Gestion des CAPTCHA
Pour le fonctionnement et la résolution de captcha dans A-Parser, des méthodes spéciales ont été implémentées pour permettre l'envoi de captchas à un service de résolution en utilisant les scrapers :
Util::AntiGate - résout les captchas sous forme d'images avec des lettres/chiffres/mots
Util::ReCaptcha2 - résout Google ReCaptcha v2
Util::ReCaptcha3 - résout Google ReCaptcha v3
Util::hCaptcha - résout les captchas hCaptcha
Util::Turnstile - résout les captchas Cloudflare Turnstile
Il est également facile de résoudre un CAPTCHA en utilisant la méthode await this.parser.request()
Par exemple, l'appel de cette méthode pour Google ReCaptcha v2 ressemblera à ceci :
await this.parser.request('Util::ReCaptcha2', this.conf.Util_ReCaptcha2_preset, {}, siteKey + ' ' + endPoint);
Vous pouvez trouver plus de détails dans l'exemple du catalogue Vérification de la catégorie des sites via le service cyren.com
Détails sur le CAPTCHA bypass (Contournement de captcha)
await this.captcha.*
Gestion des captchas
.recognize(preset, image, type[, overrides])
await this.captcha.recognize(preset, image, type, overrides) - chargement du captcha pour reconnaissance
image- données binaires de l'image pour la reconnaissancepreset- indique la présélection pour
Util::AntiGatetypespécifie l'un des suivants : 'jpeg', 'gif', 'png'
Le résultat sera un hash avec les champs :
answer- texte de l'imageid- id du captcha, pour pouvoir signaler une erreur ultérieurement via.reportBaderror- erreur textuelle si answer n'est pas défini
.recognizeFromUrl(preset, url[, overrides])
await this.captcha.recognizeFromUrl(preset, url, overrides) - analogue à la méthode précédente, mais le chargement du captcha sera effectué automatiquement via le lien (url), sans utiliser de proxy
.reportBad(preset, id[, overrides])
await this.captcha.reportBad(preset, id, overrides) - signaler au service que le captcha a été mal résolu
Liens utiles
🔗 ⏩ Création de scrapers JS. Travail avec CAPTCHA
Vidéo sur la façon d'écrire un scraper JS avec support de l'antigate pour la résolution de captchas sur les pages
🔗 Création de scrapers JS. Travail avec CAPTCHA
Article sur la façon d'écrire un scraper JS avec support de l'antigate pour la résolution de captchas sur les pages
🔗 Vérification de la catégorie des sites via le service cyren.com
Exemple d'implémentation de la connexion Util::ReCaptcha2 dans un scraper JS