Util::AntiGate - распознавание каптчи через сервис AntiGate
Обзор парсера
Данный парсер обычно используется в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать каптчи в виде картинок, например: SE::Yandex, Check::RosKomNadzor, а также кастомных JavaScript парсерах.
Принцип работы этого парсера заключается в отправке картинки каптчи на сервис разгадывания и получения в ответ текстового значения, изображенного на каптче. Правильность разгадывания зависит только от сервиса разгадывания и иногда от настроек каптчи.
Подробно процесс подключения и настройки данного парсера описан в статье Настройка Антикаптчи
Кейсы по применению парсера
🔗 Парсинг Яндекс
Получаем выдачу Yandex и номер позиции результата
🔗 Captcha в JS парсерах
Пример JS парсера для работы с каптчами
Возможности
- Поддерживается работа со всеми AntiGate-совместимыми сервисами: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io и т.п.
- Возможность гибко настраивать время ожидания ответа, параметры каптч и оповещать сервис разгадывания о неверно рагаданной каптче
Варианты использования
- Распознавание каптч во встроенных парсерах, в которых опционально или обязательно необходимо разгадывать каптчи для получения результатов
- Распознавание каптч в собственных JS парсерах
- Распознавание небольших текстовых данных с изображений (например телефонов)
Запросы
В качестве запросов необходимо указывать ссылку на каптчу, пример:
https://files.a-parser.com/img/get-captcha-image.png
Варианты вывода результатов
$answer
- ответ каптчи$error
- если возникла ошибка, ее описание
Вывод распознанного текста
Формат результата:
$answer
Пример результата:
332822
Возможные настройки
Параметр | Значение по умолчанию | Описание |
---|---|---|
Provider | AntiCaptcha | Выбор сервиса разгадывания, автоматически подставляет правильный адрес (url) сервиса |
Provider url | Домен сервиса разгадывания, позволяет переопределить домен сервиса, может быть пустым | |
Client key | Ключ доступа к сервису | |
HTTP errors retries | 5 | Количество попыток распознать капчу при сбоях сети |
HTTP timeout | 60 | таймаут ответа сервера в секундах |
Wait between get status | 5 | Задержка между опросами сервиса антигейта о состоянии капчи |
Max wait time | 300 | Максимальное время ожидания распознанной каптчи |
NO_SLOT_AVAILABLE retries | 5 | Количество попыток залить капчу на сервис антикаптчи, если сервис выдаёт сообщение о перегрузке |
NO_SLOT_AVAILABLE interval | 2 | Интервал ожидания между попытками в секундах |
Param "phrase" | 0 | 0 = значение по умолчанию (одно слово). 1 = капча имеет два слова |
Param "regsense" | 0 | 0 = значение по умолчанию (регистр не имеет значения). 1 = регистр имеет значение |
Param "numeric" | 0 | 0 = значение по умолчанию. 1 = капча состоит только из цифр. 2 = Капча не имеет цифр |
Param "calc" | 0 | 0 = значение по умолчанию. 1 = математическое действие из цифр на капче |
Param "min_len" | 0 | 0 = значение по умолчанию. >0 = минимальная длина текста на капче, которую работник должен ввести |
Param "max_len" | 0 | 0 = значение по умолчанию (неограничено). >0 = максимальная длина текста на капче, которую работник должен ввести |
Param "is_russian" | 0 | 0 = значение по умолчанию. 1 = показать капчу работнику со знанием русского языка |
Fake answer | ☐ | Ложный ответ, не использует сервис а выдаёт сразу случайную строку в качествет ответа, используется для тестирования парсеров |
Report bad captchas | ☐ | Если опция отключена, будет экономиться время, которое тратится на проверку запроса о правильности каптчи. Актуально для CapMonster и XEvil |
Log captcha images | ☐ | Управление выводом картинок каптч в лог |
Stop task on zero balance | ☑ | Остановить задание если на балансе сервиса разгадывания закончились средства |