Util::Turnstile - reconhecimento de captchas Cloudflare Turnstile
Visão geral do scraper
Este scraper é utilizado apenas como um componente conectável em outros scrapers, onde pode ser necessário resolver captchas Cloudflare Turnstile, por exemplo, scrapers Ahrefs, bem como scrapers JavaScript personalizados.
O princípio de funcionamento deste scraper consiste em enviar os dados do Turnstile (geralmente o sitekey e a url da página onde o captcha Turnstile foi recebido) para o serviço de resolução e receber em resposta um token composto por números e letras. A precisão da resolução depende apenas do serviço de resolução; como regra, os serviços quase sempre resolvem o Turnstile corretamente.
Recursos
- Suporte para trabalhar com os seguintes serviços: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- Possibilidade de configurar o tempo de espera pela resposta e o atraso na verificação do status
- Possibilidade de resolver o captcha sem usar serviços. Para ativar esta opção, em Provider, selecione
Auto (using browser). O navegador é usado para a resolução, leve isso em conta ao configurar o número de threads.
Casos de uso
- Contornar Cloudflare Turnstile em scrapers nos quais é opcional ou obrigatório resolver este tipo de captcha para obter resultados
Consultas
O scraper aceita dois tipos de consultas:
sitekeyurlsitekeyurlproxyuser-agent
Os parâmetros são separados por um espaço e significam:
sitekey- é a sitekey do Turnstileurl- a página onde o Turnstile está localizadoproxy- o proxy através do qual o Cloudflare Turnstile foi obtido. O parâmetro deve estar no formatologin:pass@ip:port@typepara proxies com autenticação ouip:port@typepara proxies sem autenticação- type pode ser
http,https,socks4,socks5
- type pode ser
user-agent- o user-agent com o qual o Turnstile foi obtido
Exemplos de saída de resultados
$resp- resposta (token) do Cloudflare Turnstile$error- se ocorrer um erro, sua descrição
Saída do token Cloudflare Turnstile
Formato do resultado:
$resp
Exemplo de resultado:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
Configurações possíveis
Para selecionar o serviço, utilize o parâmetro Provider.
| Parâmetro | Valor padrão | Descrição |
|---|---|---|
| Client key | Chave do cliente para serviços de resolução online | |
| Provider url | URL do provedor, permite substituir o domínio. Pode-se especificar vários separados por vírgula, o scraper usará cada um deles aleatoriamente. Pode estar vazio, o scraper usará automaticamente o necessário dependendo do serviço de resolução selecionado | |
| Provider | AntiCaptcha | Serviço de resolução |
| Wait between get status | 5 | Atraso entre a obtenção do status |
| Max wait time | 300 | Tempo máximo de espera pela resolução |
| Max browser pages for Auto mode | Limita o número de páginas do navegador abertas simultaneamente ao resolver o captcha, se em Provider estiver selecionado Auto (using browser) |