Перейти к основному содержимому

Util::Turnstile - распознавание каптч Cloudflare Turnstile

Обзор парсера

Этот парсер используется только в качестве подключаемого компонента в других парсерах, где может быть необходимо разгадывать каптчи Cloudflare Turnstile, например парсеры Ahrefs, а также кастомных JavaScript парсерах.

Принцип работы этого парсера заключается в отправке данных Turnstile (обычно это sitekey и url страницы, на которой получена каптча Turnstile) на сервис разгадывания и получения в ответ токена, состоящего и цифр и букв. Правильность разгадывания зависит только от сервиса разгадывания, как правило сервисы почти всегда разгадывают Turnstile правильно.

Возможности

  • Поддерживается работа с такими сервисами: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Возможность настраивать время ожидания ответа и задержку проверки статуса
  • Возможность разгадывания каптчи без использования сервисов. Для включения данной возможности в Provider нужно выбрать Auto (using Chrome). Для разгадывания используется Chrome (puppeteer), учитывайте это при настройке количества потоков.

Варианты использования

  • Обход Cloudflare Turnstile в парсерах, в которых опционально или обязательно необходимо разгадывать такой вид каптч для получения результатов

Запросы

Парсер принимает запросы двух видов:

  • sitekey url
  • sitekey url proxy user-agent

Параметры разделяются пробелом и означают:

  • sitekey - это sitekey Turnstile
  • url - страница, на которой находится Turnstile
  • proxy - прокси, через который получена Cloudflare Turnstile. Параметр должен быть в формате login:pass@ip:port@type для прокси с авторизацией или ip:port@type для прокси без авторизации
    • type может быть http, https, socks4, socks5
  • user-agent - юзерагент, с которым получена Turnstile

Варианты вывода результатов

  • $resp - ответ (токен) Cloudflare Turnstile
  • $error - если возникла ошибка, ее описание

Вывод токена Cloudflare Turnstile

Формат результата:

$resp

Пример результата:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Возможные настройки

Для выбора сервиса используется параметр Provider.

ПараметрЗначение по умолчаниюОписание
Client keyКлюч клиента для онлайн сервисов разгадывания
Provider urlУрл провайдера, позволяет переопределить домен. Можно указывать несколько через запятую, парсер будет использовать каждый из них в случайном порядке. Может быть пустым, парсер автоматически использует нужный в зависимости от выбранного сервиса разгадывания
ProviderAntiCaptchaСервис разгадывания
Wait between get status5Задержка между получением статуса
Max wait time300Максимальное время ожидания разгадывания
Threshold % for Capmonster.Cloud0Порог уверенности (используется только в capmonster.cloud)