Перейти к основному содержимому

Util::ReCaptcha2 - распознавание рекаптчи

Обзор парсера

Этот парсер используется только в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать Google ReCaptcha v2, например: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, а также кастомных JavaScript парсерах.

Принцип работы этого парсера заключается в отправке данных рекаптчи (обычно это sitekey и url страницы, на которой получена рекаптча) на сервис разгадывания и получения в ответ токена, состоящего и цифр и букв. Правильность разгадывания зависит только от сервиса разгадывания, как правило сервисы почти всегда разгадывают рекаптчи правильно.

Подробно процесс подключения и настройки данного парсера описан в статье Настройка Рекапчи

Кейсы по применению парсера

Пример настройки разгадывания через Xevil

В Xevil рекомендуется выбирать тип API Antigate (Anti-Captcha). В настройках Util::ReCaptcha2Util::ReCaptcha2 в Provider url нужно указать ip:port Xevil:

Provider url в Xevil для парсера Util::ReCaptcha2

В Provider выбрать Xevil (AntiGate):

Настройка Provider url для парсера Util::ReCaptcha2

Возможности

  • Поддерживается работа с такими сервисами: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io
  • Возможность настраивать время ожидания ответа и задержку проверки статуса

Варианты использования

  • Распознавание рекаптч во встроенных парсерах, в которых опционально или обязательно необходимо разгадывать каптчи для получения результатов
  • Распознавание рекаптч в собственных JS парсерах

Запросы

Парсер принимает запросы двух видов:

  • sitekey url
  • sitekey url proxy user-agent

Параметры разделяются пробелом и означают:

  • sitekey - это sitekey рекаптчи
  • url - страница, на которой находится рекаптча
  • proxy - прокси, через который получена рекаптча. Параметр должен быть в формате login:pass@ip:port@type для прокси с авторизацией или ip:port@type для прокси без авторизации
    • type может быть http, https, socks4, socks5
  • user-agent - юзерагент, с которым получена рекаптча

Варианты вывода результатов

  • $resp - ответ рекаптчи
  • $error - если возникла ошибка, ее описание

Вывод токена рекаптчи

Формат результата:

$resp

Пример результата:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Возможные настройки

Для выбора сервиса используется параметр Provider.

Для онлайн сервисов (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) обязательно нужно задать параметр Client key.

ПараметрЗначение по умолчаниюОписание
Client keyКлюч клиента для онлайн сервисов разгадывания
Provider urlУрл провайдера, позволяет переопределить домен. Можно указывать несколько через запятую, парсер будет использовать каждый из них в случайном порядке. Может быть пустым, парсер автоматически использует нужный в зависимости от выбранного сервиса разгадывания
ProviderAntiCaptchaСервис разгадывания
Wait between get status5Задержка между получением статуса
Max wait time300Максимальное время ожидания разадывания
Threshold % for (Capmonster.cloud)0Порог уверенности (используется только в capmonster.cloud)