Util::ReCaptcha2 - reconnaissance de reCAPTCHA
Présentation du scraper
Ce scraper est utilisé uniquement comme composant intégré dans d'autres scrapers où il peut être nécessaire de résoudre Google ReCaptcha v2, par exemple :
SE::Google,
SE::Google::Images,
SE::Google::ByImage, ainsi que dans les scrapers JavaScript personnalisés.
Le principe de fonctionnement de ce scraper consiste à envoyer les données du reCAPTCHA (généralement le sitekey et l'URL de la page où le reCAPTCHA a été obtenu) à un service de résolution et à recevoir en retour un jeton composé de chiffres et de lettres. La précision de la résolution dépend uniquement du service de résolution ; en règle générale, les services résolvent presque toujours les reCAPTCHA correctement.
Le processus de connexion et de configuration de ce scraper est décrit en détail dans l'article Configuration de ReCaptcha
Cas d'utilisation du scraper
🔗 ReCaptcha dans les scrapers JS
Exemple de scraper JS pour travailler avec les reCAPTCHAs
Exemple de configuration de la résolution via Xevil
Dans Xevil, il est recommandé de choisir le type d'API Antigate (Anti-Captcha). Dans les paramètres de
Util::ReCaptcha2, dans Provider url, vous devez indiquer ip:port de Xevil :

Dans Provider, sélectionnez Xevil (AntiGate) :

Fonctionnalités
- Prise en charge des services suivants : AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Possibilité de configurer le temps d'attente de la réponse et le délai de vérification du statut
Variantes d'utilisation
- Reconnaissance de reCAPTCHA dans les scrapers intégrés, où la résolution de captchas est optionnelle ou obligatoire pour obtenir des résultats
- Reconnaissance de reCAPTCHA dans vos propres scrapers JS
Requêtes
Le scraper accepte deux types de requêtes :
sitekeyurlsitekeyurlproxyuser-agent
Les paramètres sont séparés par un espace et signifient :
sitekey- le sitekey du reCAPTCHAurl- la page sur laquelle se trouve le reCAPTCHAproxy- le proxy via lequel le reCAPTCHA a été obtenu. Le paramètre doit être au formatlogin:pass@ip:port@typepour les proxys avec authentification ouip:port@typepour les proxys sans authentification- type peut être
http,https,socks4,socks5
- type peut être
user-agent- le user-agent avec lequel le reCAPTCHA a été obtenu
Exemples de sortie de résultats
$resp- la réponse du reCAPTCHA$error- si une erreur survient, sa description
Sortie du jeton reCAPTCHA
Format du résultat :
$resp
Exemple de résultat :
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Paramètres possibles
Le paramètre Provider est utilisé pour choisir le service.
Pour les services en ligne (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), le paramètre Client key doit obligatoirement être défini.
| Paramètre | Valeur par défaut | Description |
|---|---|---|
| Client key | Clé client pour les services de résolution en ligne | |
| Provider url | URL du fournisseur, permet de redéfinir le domaine. Vous pouvez en spécifier plusieurs séparés par des virgules, le scraper utilisera chacun d'eux de manière aléatoire. Peut être vide, le scraper utilisera automatiquement celui approprié en fonction du service de résolution choisi | |
| Provider | AntiCaptcha | Service de résolution |
| Wait between get status | 5 | Délai entre les vérifications de statut |
| Max wait time | 300 | Temps d'attente maximum pour la résolution |