Util::ReCaptcha2 - распознавание рекаптчи
Обзор парсера Util::ReCaptcha2
Этот парсер используется только в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать Google ReCaptcha v2, например: SE::Google,
Rank::Ahrefs, а также кастомных JavaScript парсерах.
Принцип работы этого парсера заключается в отправке данных рекаптчи (обычно это sitekey и url страницы, на которой получена рекаптча) на сервис разгадывания и получения в ответ токена, состоящего и цифр и букв. Правильность разгадывания зависит только от сервиса разгадывания, как правило сервисы почти всегда разгадывают рекаптчи правильно.
Подробно процесс подключения и настройки данного парсера описан в статье Настройка Рекапчи
Кейсы по применению Util::ReCaptcha2
ReCaptcha в JS парсерах
Пример JS парсера для работы с рекаптчами
Возможности
- Поддерживается работа с такими сервисами: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud и RIPCaptcha.
- Возможность настраивать время ожидания ответа и задержку проверки статуса.
Варианты использования
- Распознавание рекаптч во встроенных парсерах, в которых опционально или обязательно необходимо разгадывать каптчи для получения результатов
- Распознавание рекаптч в собственных JS парсерах
Запросы
Парсер принимает запросы двух видов:
sitekey
url
sitekey
url
proxy
user-agent
Параметры разделяются пробелом и означают:
sitekey
- это sitekey рекаптчиurl
- страница, на которой находится рекаптчаproxy
- прокси, через который получена рекаптча. Параметр должен быть в формате login:[email protected]:[email protected] для прокси с авторизацией или ip:[email protected] для прокси без авторизации- type может быть http, https, socks4, socks5
user-agent
- юзерагент, с которым получена рекаптча
Результаты
В результате будет выведен токен рекаптчи:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Возможные результаты
$resp
- ответ рекаптчи$error
- если возникла ошибка, её описание
Пример настройки разгадывания через Xevil
В Xevil рекомендуется выбирать тип API Antigate (Anti-Captcha). В настройках Util::ReCaptcha2 в
Provider url
нужно указать ip:port Xevil:
и выбрать Provider
- Xevil:
Возможные настройки
Для выбора сервиса используется параметр Provider
.
Для Anti-captcha, Rucaptcha, 2captcha, Сapmonster.cloud обязательно нужно задать параметр Client key
.
important
Параметр | Значение по умолчанию | Описание |
---|---|---|
Client key | - | Ключ клиента для Anti-captcha.com, Rucaptcha.com, Сapmonster.cloud и других онлайн сервисов разгадывания |
Provider url | - | Урл провайдера, не обязателен для XEvil/CapMonster, для других типов позволяет переопределить домен. Можно указывать несколько через запятую, парсер будет использовать каждый из них в случайном порядке |
Provider | AntiCaptcha | Сервис разгадывания |
Wait between get status | 5 | Задержка между получением статуса |
Max wait time | 300 | Максимальное время ожидания разадывания |
Threshold % for (Capmonster.cloud) | 0 | Порог уверенности (используется только в capmonster.cloud) |