Pular para o conteúdo principal

Util::Turnstile - reconhecimento de captchas Cloudflare Turnstile

Visão geral do scraper

Este scraper é utilizado apenas como um componente conectável em outros scrapers, onde pode ser necessário resolver captchas Cloudflare Turnstile, por exemplo, scrapers Ahrefs, bem como scrapers JavaScript personalizados.

O princípio de funcionamento deste scraper consiste em enviar os dados do Turnstile (geralmente o sitekey e a url da página onde o captcha Turnstile foi recebido) para o serviço de resolução e receber em resposta um token composto por números e letras. A precisão da resolução depende apenas do serviço de resolução; como regra, os serviços quase sempre resolvem o Turnstile corretamente.

Recursos

  • Suporte para trabalhar com os seguintes serviços: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Possibilidade de configurar o tempo de espera pela resposta e o atraso na verificação do status
  • Possibilidade de resolver o captcha sem usar serviços. Para ativar esta opção, em Provider, selecione Auto (using browser). O navegador é usado para a resolução, leve isso em conta ao configurar o número de threads.

Casos de uso

  • Contornar Cloudflare Turnstile em scrapers nos quais é opcional ou obrigatório resolver este tipo de captcha para obter resultados

Consultas

O scraper aceita dois tipos de consultas:

  • sitekey url
  • sitekey url proxy user-agent

Os parâmetros são separados por um espaço e significam:

  • sitekey - é a sitekey do Turnstile
  • url - a página onde o Turnstile está localizado
  • proxy - o proxy através do qual o Cloudflare Turnstile foi obtido. O parâmetro deve estar no formato login:pass@ip:port@type para proxies com autenticação ou ip:port@type para proxies sem autenticação
    • type pode ser http, https, socks4, socks5
  • user-agent - o user-agent com o qual o Turnstile foi obtido

Exemplos de saída de resultados

  • $resp - resposta (token) do Cloudflare Turnstile
  • $error - se ocorrer um erro, sua descrição

Saída do token Cloudflare Turnstile

Formato do resultado:

$resp

Exemplo de resultado:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Configurações possíveis

Para selecionar o serviço, utilize o parâmetro Provider.

ParâmetroValor padrãoDescrição
Client keyChave do cliente para serviços de resolução online
Provider urlURL do provedor, permite substituir o domínio. Pode-se especificar vários separados por vírgula, o scraper usará cada um deles aleatoriamente. Pode estar vazio, o scraper usará automaticamente o necessário dependendo do serviço de resolução selecionado
ProviderAntiCaptchaServiço de resolução
Wait between get status5Atraso entre a obtenção do status
Max wait time300Tempo máximo de espera pela resolução
Max browser pages for Auto modeLimita o número de páginas do navegador abertas simultaneamente ao resolver o captcha, se em Provider estiver selecionado Auto (using browser)