Pular para o conteúdo principal

Util::ReCaptcha2 - reconhecimento de reCAPTCHA

Visão geral do Scraper

Este scraper é utilizado apenas como um componente conectável em outros scrapers onde pode ser necessário resolver o Google ReCaptcha v2, por exemplo: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, bem como em scrapers JavaScript personalizados.

O princípio de funcionamento deste scraper consiste em enviar os dados do reCAPTCHA (geralmente o sitekey e a URL da página onde o reCAPTCHA foi obtido) para um serviço de resolução e receber em resposta um token composto por números e letras. A precisão da resolução depende exclusivamente do serviço de resolução; como regra, os serviços quase sempre resolvem os reCAPTCHAs corretamente.

O processo detalhado de conexão e configuração deste scraper está descrito no artigo Configuração de ReCaptcha

Casos de uso do scraper

Exemplo de configuração de resolução via Xevil

No Xevil, recomenda-se selecionar o tipo de API Antigate (Anti-Captcha). Nas configurações do Util::ReCaptcha2Util::ReCaptcha2, em Provider url, você deve especificar o ip:port do Xevil:

Provider url no Xevil para o scraper Util::ReCaptcha2

Em Provider, selecione Xevil (AntiGate):

Configuração de Provider url para o scraper Util::ReCaptcha2

Recursos

  • Suporte para os seguintes serviços: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Possibilidade de configurar o tempo de espera pela resposta e o intervalo de verificação de status

Opções de uso

  • Reconhecimento de reCAPTCHAs em scrapers integrados, onde é opcional ou obrigatório resolver captchas para obter resultados
  • Reconhecimento de reCAPTCHAs em scrapers JS personalizados

Consultas

O scraper aceita dois tipos de consultas:

  • sitekey url
  • sitekey url proxy user-agent

Os parâmetros são separados por espaço e significam:

  • sitekey - o sitekey do reCAPTCHA
  • url - a página onde se encontra o reCAPTCHA
  • proxy - o proxy através do qual o reCAPTCHA foi obtido. O parâmetro deve estar no formato login:pass@ip:port@type para proxies com autenticação ou ip:port@type para proxies sem autenticação
    • type pode ser http, https, socks4, socks5
  • user-agent - o user-agent com o qual o reCAPTCHA foi obtido

Exemplos de saída de resultados

  • $resp - resposta do reCAPTCHA
  • $error - se ocorrer um erro, sua descrição

Saída do token do reCAPTCHA

Formato do resultado:

$resp

Exemplo de resultado:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Configurações possíveis

Para selecionar o serviço, utiliza-se o parâmetro Provider.

Para serviços online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), é obrigatório definir o parâmetro Client key.

ParâmetroValor padrãoDescrição
Client keyChave do cliente para serviços de resolução online
Provider urlURL do provedor, permite substituir o domínio. Pode-se indicar vários separados por vírgula; o scraper usará cada um deles aleatoriamente. Pode ficar vazio, o scraper usará automaticamente o necessário dependendo do serviço de resolução selecionado
ProviderAntiCaptchaServiço de resolução
Wait between get status5Intervalo entre as verificações de status
Max wait time300Tempo máximo de espera pela resolução