Util::ReCaptcha2 - reconocimiento de reCAPTCHA
Descripción general del extractor
Este extractor se utiliza únicamente como un componente conectable en otros extractores donde puede ser necesario resolver Google ReCaptcha v2, por ejemplo:
SE::Google,
SE::Google::Images,
SE::Google::ByImage, así como en extractores JavaScript personalizados.
El principio de funcionamiento de este extractor consiste en enviar los datos de reCAPTCHA (normalmente el sitekey y la URL de la página donde se obtuvo el reCAPTCHA) a un servicio de resolución y recibir como respuesta un token compuesto por números y letras. La precisión de la resolución depende únicamente del servicio de resolución; por lo general, los servicios casi siempre resuelven los reCAPTCHA correctamente.
El proceso de conexión y configuración de este extractor se describe detalladamente en el artículo Configuración de ReCaptcha
Casos de uso del extractor
🔗 ReCaptcha en extractores JS
Ejemplo de extractor JS para trabajar con reCAPTCHAs
Ejemplo de configuración de resolución a través de Xevil
En Xevil se recomienda seleccionar el tipo de API Antigate (Anti-Captcha). En la configuración de
Util::ReCaptcha2, en Provider url, debe especificar el ip:port de Xevil:

En Provider seleccionar Xevil (AntiGate):

Características
- Soporta el trabajo con los siguientes servicios: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Posibilidad de configurar el tiempo de espera de la respuesta y el retraso en la comprobación del estado
Variantes de uso
- Reconocimiento de reCAPTCHA en extractores integrados, en los cuales es opcional u obligatorio resolver captchas para obtener resultados
- Reconocimiento de reCAPTCHA en extractores JS propios
Consultas
El extractor acepta dos tipos de consultas:
sitekeyurlsitekeyurlproxyuser-agent
Los parámetros se separan por un espacio y significan:
sitekey- es el sitekey del reCAPTCHAurl- página en la que se encuentra el reCAPTCHAproxy- proxy a través del cual se obtuvo el reCAPTCHA. El parámetro debe estar en formatologin:pass@ip:port@typepara proxies con autorización oip:port@typepara proxies sin autorización- type puede ser
http,https,socks4,socks5
- type puede ser
user-agent- user-agent con el que se obtuvo el reCAPTCHA
Variantes de salida de resultados
$resp- respuesta del reCAPTCHA$error- si ocurre un error, su descripción
Salida del token de reCAPTCHA
Formato del resultado:
$resp
Ejemplo de resultado:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Configuraciones posibles
Para elegir el servicio se utiliza el parámetro Provider.
Para servicios en línea (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) es obligatorio establecer el parámetro Client key.
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| Client key | Clave de cliente para servicios de resolución en línea | |
| Provider url | URL del proveedor, permite redefinir el dominio. Se pueden indicar varios separados por comas, el extractor usará cada uno de ellos de forma aleatoria. Puede estar vacío, el extractor usará automáticamente el necesario según el servicio de resolución seleccionado | |
| Provider | AntiCaptcha | Servicio de resolución |
| Wait between get status | 5 | Retraso entre la obtención del estado |
| Max wait time | 300 | Tiempo máximo de espera para la resolución |