Перейти к основному содержимому

Util::ReCaptcha2 - распознавание рекаптчи

Обзор парсера Util::ReCaptcha2#

Этот парсер используется только в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать Google ReCaptcha v2, например: SE::GoogleSE::Google, Rank::AhrefsRank::Ahrefs, а также кастомных JavaScript парсерах.

Принцип работы этого парсера заключается в отправке данных рекаптчи (обычно это sitekey и url страницы, на которой получена рекаптча) на сервис разгадывания и получения в ответ токена, состоящего и цифр и букв. Правильность разгадывания зависит только от сервиса разгадывания, как правило сервисы почти всегда разгадывают рекаптчи правильно.

Подробно процесс подключения и настройки данного парсера описан в статье Настройка Рекапчи

Кейсы по применению Util::ReCaptcha2#

ReCaptcha в JS парсерах

Пример JS парсера для работы с рекаптчами

Возможности#

  • Поддерживается работа с такими сервисами: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud и RIPCaptcha.
  • Возможность настраивать время ожидания ответа и задержку проверки статуса.

Варианты использования#

  • Распознавание рекаптч во встроенных парсерах, в которых опционально или обязательно необходимо разгадывать каптчи для получения результатов
  • Распознавание рекаптч в собственных JS парсерах

Запросы#

Парсер принимает запросы двух видов:

  • sitekey url
  • sitekey url proxy user-agent

Параметры разделяются пробелом и означают:

  • sitekey - это sitekey рекаптчи
  • url - страница, на которой находится рекаптча
  • proxy - прокси, через который получена рекаптча. Параметр должен быть в формате login:[email protected]:[email protected] для прокси с авторизацией или ip:[email protected] для прокси без авторизации
    • type может быть http, https, socks4, socks5
  • user-agent - юзерагент, с которым получена рекаптча

Результаты#

В результате будет выведен токен рекаптчи:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Возможные результаты#

  • $resp - ответ рекаптчи
  • $error - если возникла ошибка, её описание

Пример настройки разгадывания через Xevil#

В Xevil рекомендуется выбирать тип API Antigate (Anti-Captcha) или RuCaptcha. В настройках Util::ReCaptcha2Util::ReCaptcha2 в Provider url нужно указать ip:port Xevil:

где взять Provider url в Xevil для парсера Util::ReCaptcha2

и выбрать Provider - Xevil:

насройка Provider url для парсера Util::ReCaptcha2

Возможные настройки#

Для выбора сервиса используется параметр Provider.

Для Anti-captcha, Rucaptcha, 2captcha, Сapmonster.cloud обязательно нужно задать параметр Client key.

ПараметрЗначение по умолчаниюОписание
Client key-Ключ клиента для Anti-captcha.com, Rucaptcha.com, Сapmonster.cloud и других онлайн сервисов разгадывания
Provider url-Урл провайдера, не обязателен для XEvil/CapMonster, для других типов позволяет переопределить домен. Можно указывать несколько через запятую, парсер будет использовать каждый из них в рандомном порядке
ProviderAntiCaptchaСервис разгадывания
Wait between get status5Задержка между получением статуса
Max wait time300Максимальное время ожидания статуса
Последнее обновление