Util::ReCaptcha3 - reconnaissance de Google ReCaptcha v3
Présentation du scraper
Ce scraper est conçu pour être utilisé comme composant intégré dans d'autres scrapers, lorsqu'il est nécessaire de résoudre Google ReCaptcha v3.
Le principe de fonctionnement de ce scraper consiste à envoyer les données du reCAPTCHA (il s'agit toujours du sitekey et de l'URL de la page où le reCAPTCHA a été obtenu) à un service de résolution et à recevoir en retour un jeton (token) composé de chiffres et de lettres. L'exactitude de la résolution dépend uniquement du service de résolution ; en règle générale, les services résolvent presque toujours les reCAPTCHAs correctement.
Fonctionnalités
- Prise en charge des services suivants : AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Possibilité de configurer le temps d'attente de la réponse et le délai de vérification du statut
Cas d'utilisation
- Reconnaissance de Google ReCaptcha v3 dans les scrapers intégrés, où la résolution des captchas est optionnelle ou obligatoire pour obtenir des résultats
- Reconnaissance de Google ReCaptcha v3 dans vos propres scrapers JS
Requêtes
Le scraper accepte des requêtes de type :
sitekeyurl
Les paramètres sont séparés par un espace et signifient :
sitekey- c'est la clé de site du reCAPTCHA, appelée websitekey dans certains services. En règle générale, la sitekey doit être extraite du code de la page et se trouve habituellement dans l'URL du script inclus :
https://www.google.com/recaptcha/api.js?render=SITEKEY
De plus, la sitekey dans le code de la page peut être spécifiée comme argument d'une fonction :
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- la page sur laquelle se trouve le reCAPTCHA
Variantes d'affichage des résultats
$resp- réponse du reCAPTCHA$error- si une erreur survient, sa description
Affichage du jeton reCAPTCHA
Format du résultat :
$resp
Exemple de résultat :
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Paramètres possibles
Pour choisir le service utilisé, on utilise le paramètre Provider.
Pour les services en ligne (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), il est impératif de renseigner le paramètre Client key.
| Paramètre | Valeur par défaut | Description |
|---|---|---|
| Client key | Clé client pour les services de résolution en ligne | |
| Provider url | URL du fournisseur, permet de redéfinir le domaine. Vous pouvez en indiquer plusieurs séparés par des virgules, le scraper utilisera chacun d'eux de manière aléatoire. Peut être vide, le scraper utilisera automatiquement celui approprié selon le service de résolution choisi | |
| Provider | AntiCaptcha | Service de résolution |
| Wait between get status | 5 | Délai entre les récupérations de statut |
| Max wait time | 300 | Temps d'attente maximum pour la résolution |
| minScore | 0.3 | Degré de confiance minimal dans le résultat. À déterminer expérimentalement pour chaque site. Lors de l'appel au service de résolution, définit le filtre pour sélectionner un travailleur avec le score minimal requis |
| pageAction | Valeur du paramètre action transmise à Google, que le propriétaire du site voit ensuite lors de la vérification du jeton. Généralement spécifiée comme argument de fonction : grecaptcha.execute('sitekey', {action:'VALEUR ACTION'}) | |
| isEnterprise | ☐ | Indique au service de résolution qu'il faut résoudre ce reCAPTCHA comme un Recaptcha Enterprise V3. Ne fonctionne pas avec tous les services |