Ir al contenido principal

Util::ReCaptcha2 - reconocimiento de reCAPTCHA

Descripción general del extractor

Este extractor se utiliza únicamente como un componente conectable en otros extractores donde puede ser necesario resolver Google ReCaptcha v2, por ejemplo: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, así como en extractores JavaScript personalizados.

El principio de funcionamiento de este extractor consiste en enviar los datos de reCAPTCHA (normalmente el sitekey y la URL de la página donde se obtuvo el reCAPTCHA) a un servicio de resolución y recibir como respuesta un token compuesto por números y letras. La precisión de la resolución depende únicamente del servicio de resolución; por lo general, los servicios casi siempre resuelven los reCAPTCHA correctamente.

El proceso de conexión y configuración de este extractor se describe detalladamente en el artículo Configuración de ReCaptcha

Casos de uso del extractor

Ejemplo de configuración de resolución a través de Xevil

En Xevil se recomienda seleccionar el tipo de API Antigate (Anti-Captcha). En la configuración de Util::ReCaptcha2Util::ReCaptcha2, en Provider url, debe especificar el ip:port de Xevil:

Provider url en Xevil para el extractor Util::ReCaptcha2

En Provider seleccionar Xevil (AntiGate):

Configuración de Provider url para el extractor Util::ReCaptcha2

Características

  • Soporta el trabajo con los siguientes servicios: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Posibilidad de configurar el tiempo de espera de la respuesta y el retraso en la comprobación del estado

Variantes de uso

  • Reconocimiento de reCAPTCHA en extractores integrados, en los cuales es opcional u obligatorio resolver captchas para obtener resultados
  • Reconocimiento de reCAPTCHA en extractores JS propios

Consultas

El extractor acepta dos tipos de consultas:

  • sitekey url
  • sitekey url proxy user-agent

Los parámetros se separan por un espacio y significan:

  • sitekey - es el sitekey del reCAPTCHA
  • url - página en la que se encuentra el reCAPTCHA
  • proxy - proxy a través del cual se obtuvo el reCAPTCHA. El parámetro debe estar en formato login:pass@ip:port@type para proxies con autorización o ip:port@type para proxies sin autorización
    • type puede ser http, https, socks4, socks5
  • user-agent - user-agent con el que se obtuvo el reCAPTCHA

Variantes de salida de resultados

  • $resp - respuesta del reCAPTCHA
  • $error - si ocurre un error, su descripción

Salida del token de reCAPTCHA

Formato del resultado:

$resp

Ejemplo de resultado:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Configuraciones posibles

Para elegir el servicio se utiliza el parámetro Provider.

Para servicios en línea (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) es obligatorio establecer el parámetro Client key.

ParámetroValor por defectoDescripción
Client keyClave de cliente para servicios de resolución en línea
Provider urlURL del proveedor, permite redefinir el dominio. Se pueden indicar varios separados por comas, el extractor usará cada uno de ellos de forma aleatoria. Puede estar vacío, el extractor usará automáticamente el necesario según el servicio de resolución seleccionado
ProviderAntiCaptchaServicio de resolución
Wait between get status5Retraso entre la obtención del estado
Max wait time300Tiempo máximo de espera para la resolución