Util::ReCaptcha2 - распознавание рекаптчи
Обзор парсера
Этот парсер используется только в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать Google ReCaptcha v2, например: SE::Google, SE::Google::Images, SE::Google::ByImage, а также кастомных JavaScript парсерах.
Принцип работы этого парсера заключается в отправке данных рекаптчи (обычно это sitekey и url страницы, на которой получена рекаптча) на сервис разгадывания и получения в ответ токена, состоящего и цифр и букв. Правильность разгадывания зависит только от сервиса разгадывания, как правило сервисы почти всегда разгадывают рекаптчи правильно.
Подробно процесс подключения и настройки данного парсера описан в статье Настройка Рекапчи
Кейсы по применению парсера
🔗 ReCaptcha в JS парсерах
Пример JS парсера для работы с рекаптчами
Пример настройки разгадывания через Xevil
В Xevil рекомендуется выбирать тип API Antigate (Anti-Captcha)
. В настройках Util::ReCaptcha2 в Provider url нужно указать ip:port
Xevil:
В Provider выбрать Xevil (AntiGate)
:
Возможности
- Поддерживается работа с такими сервисами: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Возможность настраивать время ожидания ответа и задержку проверки статуса
Варианты использования
- Распознавание рекаптч во встроенных парсерах, в которых опционально или обязательно необходимо разгадывать каптчи для получения результатов
- Распознавание рекаптч в собственных JS парсерах
Запросы
Парсер принимает запросы двух видов:
sitekey
url
sitekey
url
proxy
user-agent
Параметры разделяются пробелом и означают:
sitekey
- это sitekey рекаптчиurl
- страница, на которой находится рекаптчаproxy
- прокси, через который получена рекаптча. Параметр должен быть в форматеlogin:pass@ip:port@type
для прокси с авторизацией илиip:port@type
для прокси без авторизации- type может быть
http
,https
,socks4
,socks5
- type может быть
user-agent
- юзерагент, с которым получена рекаптча
Варианты вывода результатов
$resp
- ответ рекаптчи$error
- если возникла ошибка, ее описание
Вывод токена рекаптчи
Формат результата:
$resp
Пример результата:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Возможные настройки
Для выбора сервиса используется параметр Provider.
Для онлайн сервисов (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) обязательно нужно задать параметр Client key.
Параметр | Значение по умолчанию | Описание |
---|---|---|
Client key | Ключ клиента для онлайн сервисов разгадывания | |
Provider url | Урл провайдера, позволяет переопределить домен. Можно указывать несколько через запятую, парсер будет использовать каждый из них в случайном порядке. Может быть пустым, парсер автоматически использует нужный в зависимости от выбранного сервиса разгадывания | |
Provider | AntiCaptcha | Сервис разгадывания |
Wait between get status | 5 | Задержка между получением статуса |
Max wait time | 300 | Максимальное время ожидания разадывания |
Threshold % for (Capmonster.cloud) | 0 | Порог уверенности (используется только в capmonster.cloud) |