Ir al contenido principal

Util::AntiGate - reconocimiento de captcha a través del servicio AntiGate

Descripción general del extractor

antigate

Este extractor se utiliza habitualmente como un componente conectable en otros extractores donde puede ser necesario resolver captchas en forma de imágenes, por ejemplo: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, así como en extractores JavaScript personalizados.

El principio de funcionamiento de este extractor consiste en enviar una imagen de captcha a un servicio de resolución y recibir como respuesta el valor textual mostrado en el captcha. La precisión de la resolución depende únicamente del servicio de resolución y, en ocasiones, de la configuración del captcha.

El proceso de conexión y configuración de este extractor se describe detalladamente en el artículo Configuración de Anticaptcha

Casos de uso del extractor

Características

  • Soporta el trabajo con todos los servicios compatibles con AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, etc.
  • Posibilidad de configurar de forma flexible el tiempo de espera de la respuesta, los parámetros de los captchas y notificar al servicio de resolución sobre un captcha resuelto incorrectamente

Casos de uso

  • Reconocimiento de captchas en extractores integrados, donde es opcional u obligatorio resolver captchas para obtener resultados
  • Reconocimiento de captchas en extractores JS propios
  • Reconocimiento de pequeños datos de texto de imágenes (por ejemplo, números de teléfono)

Consultas

Como consultas, es necesario especificar el enlace a la imagen del captcha, ejemplo:

https://files.a-parser.com/img/get-captcha-image.png

Opciones de salida de resultados

  • $answer - respuesta del captcha
  • $error - si ocurre un error, su descripción

Salida del texto reconocido

Formato del resultado:

$answer

Ejemplo de resultado:

332822

Configuraciones posibles

ParámetroValor por defectoDescripción
ProviderAntiCaptchaSelección del servicio de resolución, sustituye automáticamente la dirección (url) correcta del servicio
Provider urlDominio del servicio de resolución, permite redefinir el dominio del servicio, puede estar vacío
Client keyClave de acceso al servicio
HTTP errors retries5Número de intentos para reconocer el captcha en caso de fallos de red
HTTP timeout60tiempo de espera de la respuesta del servidor en segundos
Wait between get status5Retraso entre consultas al servicio antigate sobre el estado del captcha
Max wait time300Tiempo máximo de espera para el captcha reconocido
NO_SLOT_AVAILABLE retries5Número de intentos para subir el captcha al servicio anticaptcha si el servicio informa de sobrecarga
NO_SLOT_AVAILABLE interval2Intervalo de espera entre intentos en segundos
Param "phrase"00 = valor por defecto (una palabra). 1 = el captcha tiene dos palabras
Param "regsense"00 = valor por defecto (no distingue entre mayúsculas y minúsculas). 1 = distingue entre mayúsculas y minúsculas
Param "numeric"00 = valor por defecto. 1 = el captcha consiste solo en números. 2 = el captcha no tiene números
Param "calc"00 = valor por defecto. 1 = operación matemática con números en el captcha
Param "min_len"00 = valor por defecto. >0 = longitud mínima del texto del captcha que el trabajador debe introducir
Param "max_len"00 = valor por defecto (ilimitado). >0 = longitud máxima del texto del captcha que el trabajador debe introducir
Param "is_russian"00 = valor por defecto. 1 = mostrar el captcha a un trabajador con conocimiento del idioma ruso
Fake answerRespuesta falsa, no utiliza el servicio sino que devuelve inmediatamente una cadena aleatoria como respuesta, se utiliza para probar extractores
Report bad captchasSi la opción está desactivada, se ahorrará el tiempo que se gasta en verificar la consulta sobre la corrección del captcha. Relevante para CapMonster y XEvil
Log captcha imagesGestión de la salida de imágenes de captchas en el registro
Stop task on zero balanceDetener la tarea si se agotan los fondos en el balance del servicio de resolución