Pular para o conteúdo principal

Util::AntiGate - reconhecimento de captcha através do serviço AntiGate

Visão geral do scraper

antigate

Este scraper é geralmente utilizado como um componente conectado em outros scrapers, onde pode ser necessário resolver captchas em formato de imagem, por exemplo: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, bem como em scrapers JavaScript personalizados.

O princípio de funcionamento deste scraper consiste em enviar uma imagem de captcha para um serviço de resolução e receber em resposta o valor textual exibido no captcha. A precisão da resolução depende exclusivamente do serviço de resolução e, por vezes, das configurações do captcha.

O processo detalhado de conexão e configuração deste scraper está descrito no artigo Configuração de Anti-captcha

Casos de uso do scraper

Recursos

  • Suporte para todos os serviços compatíveis com AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, etc.
  • Possibilidade de configurar de forma flexível o tempo de espera pela resposta, parâmetros de captcha e notificar o serviço de resolução sobre um captcha resolvido incorretamente

Opções de uso

  • Reconhecimento de captchas em scrapers integrados, nos quais é opcional ou obrigatório resolver captchas para obter resultados
  • Reconhecimento de captchas em scrapers JS personalizados
  • Reconhecimento de pequenos dados de texto em imagens (por exemplo, números de telefone)

Consultas

Como consultas, é necessário indicar o link para o captcha, exemplo:

https://files.a-parser.com/img/get-captcha-image.png

Opções de exibição de resultados

  • $answer - resposta do captcha
  • $error - se ocorrer um erro, sua descrição

Exibição do texto reconhecido

Formato do resultado:

$answer

Exemplo de resultado:

332822

Configurações possíveis

ParâmetroValor padrãoDescrição
ProviderAntiCaptchaEscolha do serviço de resolução, substitui automaticamente o endereço (url) correto do serviço
Provider urlDomínio do serviço de resolução, permite redefinir o domínio do serviço, pode estar vazio
Client keyChave de acesso ao serviço
HTTP errors retries5Número de tentativas de reconhecer o captcha em caso de falhas na rede
HTTP timeout60tempo limite de resposta do servidor em segundos
Wait between get status5Atraso entre as consultas ao serviço antigate sobre o status do captcha
Max wait time300Tempo máximo de espera pelo captcha reconhecido
NO_SLOT_AVAILABLE retries5Número de tentativas de enviar o captcha para o serviço de anti-captcha se o serviço retornar uma mensagem de sobrecarga
NO_SLOT_AVAILABLE interval2Intervalo de espera entre as tentativas em segundos
Param "phrase"00 = valor padrão (uma palavra). 1 = o captcha tem duas palavras
Param "regsense"00 = valor padrão (maiúsculas/minúsculas não importam). 1 = maiúsculas/minúsculas importam
Param "numeric"00 = valor padrão. 1 = o captcha consiste apenas em números. 2 = o captcha não possui números
Param "calc"00 = valor padrão. 1 = operação matemática com números no captcha
Param "min_len"00 = valor padrão. >0 = comprimento mínimo do texto no captcha que o trabalhador deve inserir
Param "max_len"00 = valor padrão (ilimitado). >0 = comprimento máximo do texto no captcha que o trabalhador deve inserir
Param "is_russian"00 = valor padrão. 1 = mostrar o captcha para um trabalhador com conhecimento de língua russa
Fake answerResposta falsa, não utiliza o serviço e retorna imediatamente uma string aleatória como resposta, usado para testar scrapers
Report bad captchasSe a opção estiver desativada, economizará o tempo gasto na verificação da consulta sobre a correção do captcha. Relevante para CapMonster e XEvil
Log captcha imagesGerenciamento da exibição de imagens de captchas no log
Stop task on zero balanceParar a tarefa se o saldo no serviço de resolução terminar