Util::Turnstile - riconoscimento dei captcha Cloudflare Turnstile
Panoramica dello scraper
Questo scraper viene utilizzato solo come componente collegabile in altri scraper, dove potrebbe essere necessario risolvere i captcha Cloudflare Turnstile, ad esempio gli scraper Ahrefs, così come negli scraper JavaScript personalizzati.
Il principio di funzionamento di questo scraper consiste nell'invio dei dati Turnstile (solitamente sitekey e l'url della pagina in cui è stato ricevuto il captcha Turnstile) a un servizio di risoluzione e nella ricezione in risposta di un token composto da cifre e lettere. La correttezza della risoluzione dipende solo dal servizio di risoluzione; di norma, i servizi risolvono Turnstile correttamente quasi sempre.
Funzionalità
- È supportato il lavoro con i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- Possibilità di configurare il tempo di attesa della risposta e il ritardo del controllo dello stato
- Possibilità di risolvere il captcha senza utilizzare servizi. Per abilitare questa funzione, in Provider è necessario selezionare
Auto (using browser). Per la risoluzione viene utilizzato il browser, tienilo presente quando configuri il numero di thread.
Casi d'uso
- Bypass di Cloudflare Turnstile negli scraper in cui è opzionalmente o obbligatoriamente necessario risolvere questo tipo di captcha per ottenere i risultati
Query
Lo scraper accetta query di due tipi:
sitekeyurlsitekeyurlproxyuser-agent
I parametri sono separati da uno spazio e significano:
sitekey- è la sitekey di Turnstileurl- la pagina in cui si trova Turnstileproxy- il proxy attraverso il quale è stato ottenuto Cloudflare Turnstile. Il parametro deve essere nel formatologin:pass@ip:port@typeper i proxy con autorizzazione oip:port@typeper i proxy senza autorizzazione- type può essere
http,https,socks4,socks5
- type può essere
user-agent- lo user-agent con cui è stato ottenuto Turnstile
Esempi di output dei risultati
$resp- risposta (token) Cloudflare Turnstile$error- se si è verificato un errore, la sua descrizione
Output del token Cloudflare Turnstile
Formato del risultato:
$resp
Esempio di risultato:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
Impostazioni possibili
Per selezionare il servizio viene utilizzato il parametro Provider.
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Client key | Chiave cliente per i servizi di risoluzione online | |
| Provider url | URL del provider, consente di sovrascrivere il dominio. È possibile specificarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario a seconda del servizio di risoluzione selezionato | |
| Provider | AntiCaptcha | Servizio di risoluzione |
| Wait between get status | 5 | Ritardo tra la ricezione dello stato |
| Max wait time | 300 | Tempo massimo di attesa per la risoluzione |
| Max browser pages for Auto mode | Limita il numero di pagine del browser aperte contemporaneamente durante la risoluzione del captcha, se in Provider è selezionato Auto (using browser) |