Lavorare con i CAPTCHA
Per il lavoro e la risoluzione dei captcha in A-Parser sono implementati metodi speciali che consentono di inviare il captcha per la risoluzione a un servizio di risoluzione captcha utilizzando gli scraper:
Util::AntiGate - risolve i captcha sotto forma di immagini con lettere/numeri/parole
Util::ReCaptcha2 - risolve Google ReCaptcha v2
Util::ReCaptcha3 - risolve Google ReCaptcha v3
Util::hCaptcha - risolve i captcha hCaptcha
Util::Turnstile - risolve i captcha Cloudflare Turnstile
Inoltre è facile risolvere i CAPTCHA utilizzando il metodo await this.parser.request()
Ad esempio, la chiamata di questo metodo per Google ReCaptcha v2 apparirà come segue:
await this.parser.request('Util::ReCaptcha2', this.conf.Util_ReCaptcha2_preset, {}, siteKey + ' ' + endPoint);
Maggiori dettagli sono disponibili nell'esempio dal catalogo Verifica della categoria dei siti tramite il servizio cyren.com
Maggiori dettagli sull'CAPTCHA bypass (Aggiramento dei captcha)
await this.captcha.*
Lavoro con i captcha
.recognize(preset, image, type[, overrides])
await this.captcha.recognize(preset, image, type, overrides) - caricamento del captcha per il riconoscimento
image- dati binari dell'immagine per il riconoscimentopreset- indica il preset per
Util::AntiGatetypeviene specificato uno tra: 'jpeg', 'gif', 'png'
Il risultato sarà un hash con i campi:
answer- testo dall'immagineid- id del captcha, per poter segnalare in seguito un errore tramite.reportBaderror- errore testuale, se answer non è impostato
.recognizeFromUrl(preset, url[, overrides])
await this.captcha.recognizeFromUrl(preset, url, overrides) - simile al metodo precedente, ma il caricamento del captcha verrà eseguito automaticamente tramite link (url), senza l'uso di proxy
.reportBad(preset, id[, overrides])
await this.captcha.reportBad(preset, id, overrides) - segnalare al servizio che il captcha è stato risolto in modo errato
Link utili
🔗 ⏩ Creazione di scraper JS. Lavoro con i CAPTCHA
Video su come scrivere uno scraper JS con supporto antigate per la risoluzione dei captcha sulle pagine
🔗 Creazione di scraper JS. Lavoro con i CAPTCHA
Articolo su come scrivere uno scraper JS con supporto antigate per la risoluzione dei captcha sulle pagine
🔗 Verifica della categoria dei siti tramite il servizio cyren.com
Esempio con implementazione della connessione Util::ReCaptcha2 in uno scraper JS