Util::ReCaptcha3 - reconhecimento do Google ReCaptcha v3
Visão geral do scraper
Este scraper foi projetado para ser usado como um componente conectável em outros scrapers, onde pode ser necessário resolver o Google ReCaptcha v3.
O princípio de funcionamento deste scraper consiste em enviar os dados do reCAPTCHA (que são sempre o sitekey e a url da página onde o reCAPTCHA foi obtido) para um serviço de resolução e receber em resposta um token composto por números e letras. A precisão da resolução depende apenas do serviço de resolução; como regra, os serviços quase sempre resolvem os reCAPTCHAs corretamente.
Recursos
- Suporte para os seguintes serviços: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Capacidade de configurar o tempo de espera pela resposta e o atraso na verificação do status
Casos de uso
- Reconhecimento do Google ReCaptcha v3 em scrapers integrados, nos quais é opcional ou obrigatório resolver captchas para obter resultados
- Reconhecimento do Google ReCaptcha v3 em scrapers JS próprios
Consultas
O scraper aceita consultas no formato:
sitekeyurl
Os parâmetros são separados por um espaço e significam:
sitekey- este é o sitekey do reCAPTCHA, em alguns serviços é chamado de websitekey. Como regra, o sitekey deve ser obtido do código da página e geralmente está localizado na URL do script conectado:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Além disso, o sitekey no código da página pode ser especificado como um argumento de função:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- a página onde o reCAPTCHA está localizado
Exemplos de saída de resultados
$resp- resposta do reCAPTCHA$error- se ocorrer um erro, sua descrição
Saída do token do reCAPTCHA
Formato do resultado:
$resp
Exemplo de resultado:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Configurações possíveis
Para escolher o serviço utilizado, usa-se o parâmetro Provider.
Para serviços online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), é obrigatório definir o parâmetro Client key.
| Parâmetro | Valor padrão | Descrição |
|---|---|---|
| Client key | Chave do cliente para serviços de resolução online | |
| Provider url | URL do provedor, permite substituir o domínio. Pode-se indicar vários separados por vírgula, o scraper usará cada um deles aleatoriamente. Pode estar vazio, o scraper usará automaticamente o necessário dependendo do serviço de resolução escolhido | |
| Provider | AntiCaptcha | Serviço de resolução |
| Wait between get status | 5 | Atraso entre a obtenção do status |
| Max wait time | 300 | Tempo máximo de espera pela resolução |
| minScore | 0.3 | Grau mínimo de confiança no resultado. Determinado experimentalmente para cada site individual. Ao consultar o serviço de resolução, define o filtro pelo qual o trabalhador com o score mínimo necessário é selecionado |
| pageAction | Valor do parâmetro action, que é passado ao Google e que o proprietário do site vê ao verificar o token. Geralmente indicado como argumento da função: grecaptcha.execute('sitekey', {action:'VALOR DA ACTION'}) | |
| isEnterprise | ☐ | Indica ao serviço de resolução que este reCAPTCHA deve ser resolvido como Recaptcha Enterprise V3. Não funciona em todos os serviços de resolução |