Passer au contenu principal

Util::ReCaptcha3 - reconnaissance de Google ReCaptcha v3

Présentation du scraper

Ce scraper est conçu pour être utilisé comme composant intégré dans d'autres scrapers, lorsqu'il est nécessaire de résoudre Google ReCaptcha v3.

Le principe de fonctionnement de ce scraper consiste à envoyer les données du reCAPTCHA (il s'agit toujours du sitekey et de l'URL de la page où le reCAPTCHA a été obtenu) à un service de résolution et à recevoir en retour un jeton (token) composé de chiffres et de lettres. L'exactitude de la résolution dépend uniquement du service de résolution ; en règle générale, les services résolvent presque toujours les reCAPTCHAs correctement.

Fonctionnalités

  • Prise en charge des services suivants : AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Possibilité de configurer le temps d'attente de la réponse et le délai de vérification du statut

Cas d'utilisation

  • Reconnaissance de Google ReCaptcha v3 dans les scrapers intégrés, où la résolution des captchas est optionnelle ou obligatoire pour obtenir des résultats
  • Reconnaissance de Google ReCaptcha v3 dans vos propres scrapers JS

Requêtes

Le scraper accepte des requêtes de type :

  • sitekey url

Les paramètres sont séparés par un espace et signifient :

  • sitekey - c'est la clé de site du reCAPTCHA, appelée websitekey dans certains services. En règle générale, la sitekey doit être extraite du code de la page et se trouve habituellement dans l'URL du script inclus :
https://www.google.com/recaptcha/api.js?render=SITEKEY

De plus, la sitekey dans le code de la page peut être spécifiée comme argument d'une fonction :

grecaptcha.execute(SITEKEY, {action:'verify'}).
  • url - la page sur laquelle se trouve le reCAPTCHA

Variantes d'affichage des résultats

  • $resp - réponse du reCAPTCHA
  • $error - si une erreur survient, sa description

Affichage du jeton reCAPTCHA

Format du résultat :

$resp

Exemple de résultat :

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Paramètres possibles

Pour choisir le service utilisé, on utilise le paramètre Provider.

Pour les services en ligne (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), il est impératif de renseigner le paramètre Client key.

ParamètreValeur par défautDescription
Client keyClé client pour les services de résolution en ligne
Provider urlURL du fournisseur, permet de redéfinir le domaine. Vous pouvez en indiquer plusieurs séparés par des virgules, le scraper utilisera chacun d'eux de manière aléatoire. Peut être vide, le scraper utilisera automatiquement celui approprié selon le service de résolution choisi
ProviderAntiCaptchaService de résolution
Wait between get status5Délai entre les récupérations de statut
Max wait time300Temps d'attente maximum pour la résolution
minScore0.3Degré de confiance minimal dans le résultat. À déterminer expérimentalement pour chaque site. Lors de l'appel au service de résolution, définit le filtre pour sélectionner un travailleur avec le score minimal requis
pageActionValeur du paramètre action transmise à Google, que le propriétaire du site voit ensuite lors de la vérification du jeton. Généralement spécifiée comme argument de fonction : grecaptcha.execute('sitekey', {action:'VALEUR ACTION'})
isEnterpriseIndique au service de résolution qu'il faut résoudre ce reCAPTCHA comme un Recaptcha Enterprise V3. Ne fonctionne pas avec tous les services