Passer au contenu principal

Util::ReCaptcha2 - reconnaissance de reCAPTCHA

Présentation du scraper

Ce scraper est utilisé uniquement comme composant intégré dans d'autres scrapers où il peut être nécessaire de résoudre Google ReCaptcha v2, par exemple : SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, ainsi que dans les scrapers JavaScript personnalisés.

Le principe de fonctionnement de ce scraper consiste à envoyer les données du reCAPTCHA (généralement le sitekey et l'URL de la page où le reCAPTCHA a été obtenu) à un service de résolution et à recevoir en retour un jeton composé de chiffres et de lettres. La précision de la résolution dépend uniquement du service de résolution ; en règle générale, les services résolvent presque toujours les reCAPTCHA correctement.

Le processus de connexion et de configuration de ce scraper est décrit en détail dans l'article Configuration de ReCaptcha

Cas d'utilisation du scraper

Exemple de configuration de la résolution via Xevil

Dans Xevil, il est recommandé de choisir le type d'API Antigate (Anti-Captcha). Dans les paramètres de Util::ReCaptcha2Util::ReCaptcha2, dans Provider url, vous devez indiquer ip:port de Xevil :

Provider url dans Xevil pour le scraper Util::ReCaptcha2

Dans Provider, sélectionnez Xevil (AntiGate) :

Configuration du Provider url pour le scraper Util::ReCaptcha2

Fonctionnalités

  • Prise en charge des services suivants : AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Possibilité de configurer le temps d'attente de la réponse et le délai de vérification du statut

Variantes d'utilisation

  • Reconnaissance de reCAPTCHA dans les scrapers intégrés, où la résolution de captchas est optionnelle ou obligatoire pour obtenir des résultats
  • Reconnaissance de reCAPTCHA dans vos propres scrapers JS

Requêtes

Le scraper accepte deux types de requêtes :

  • sitekey url
  • sitekey url proxy user-agent

Les paramètres sont séparés par un espace et signifient :

  • sitekey - le sitekey du reCAPTCHA
  • url - la page sur laquelle se trouve le reCAPTCHA
  • proxy - le proxy via lequel le reCAPTCHA a été obtenu. Le paramètre doit être au format login:pass@ip:port@type pour les proxys avec authentification ou ip:port@type pour les proxys sans authentification
    • type peut être http, https, socks4, socks5
  • user-agent - le user-agent avec lequel le reCAPTCHA a été obtenu

Exemples de sortie de résultats

  • $resp - la réponse du reCAPTCHA
  • $error - si une erreur survient, sa description

Sortie du jeton reCAPTCHA

Format du résultat :

$resp

Exemple de résultat :

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Paramètres possibles

Le paramètre Provider est utilisé pour choisir le service.

Pour les services en ligne (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), le paramètre Client key doit obligatoirement être défini.

ParamètreValeur par défautDescription
Client keyClé client pour les services de résolution en ligne
Provider urlURL du fournisseur, permet de redéfinir le domaine. Vous pouvez en spécifier plusieurs séparés par des virgules, le scraper utilisera chacun d'eux de manière aléatoire. Peut être vide, le scraper utilisera automatiquement celui approprié en fonction du service de résolution choisi
ProviderAntiCaptchaService de résolution
Wait between get status5Délai entre les vérifications de statut
Max wait time300Temps d'attente maximum pour la résolution