Vai al contenuto principale

Util::Turnstile - riconoscimento dei captcha Cloudflare Turnstile

Panoramica dello scraper

Questo scraper viene utilizzato solo come componente collegabile in altri scraper, dove potrebbe essere necessario risolvere i captcha Cloudflare Turnstile, ad esempio gli scraper Ahrefs, così come negli scraper JavaScript personalizzati.

Il principio di funzionamento di questo scraper consiste nell'invio dei dati Turnstile (solitamente sitekey e l'url della pagina in cui è stato ricevuto il captcha Turnstile) a un servizio di risoluzione e nella ricezione in risposta di un token composto da cifre e lettere. La correttezza della risoluzione dipende solo dal servizio di risoluzione; di norma, i servizi risolvono Turnstile correttamente quasi sempre.

Funzionalità

  • È supportato il lavoro con i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Possibilità di configurare il tempo di attesa della risposta e il ritardo del controllo dello stato
  • Possibilità di risolvere il captcha senza utilizzare servizi. Per abilitare questa funzione, in Provider è necessario selezionare Auto (using browser). Per la risoluzione viene utilizzato il browser, tienilo presente quando configuri il numero di thread.

Casi d'uso

  • Bypass di Cloudflare Turnstile negli scraper in cui è opzionalmente o obbligatoriamente necessario risolvere questo tipo di captcha per ottenere i risultati

Query

Lo scraper accetta query di due tipi:

  • sitekey url
  • sitekey url proxy user-agent

I parametri sono separati da uno spazio e significano:

  • sitekey - è la sitekey di Turnstile
  • url - la pagina in cui si trova Turnstile
  • proxy - il proxy attraverso il quale è stato ottenuto Cloudflare Turnstile. Il parametro deve essere nel formato login:pass@ip:port@type per i proxy con autorizzazione o ip:port@type per i proxy senza autorizzazione
    • type può essere http, https, socks4, socks5
  • user-agent - lo user-agent con cui è stato ottenuto Turnstile

Esempi di output dei risultati

  • $resp - risposta (token) Cloudflare Turnstile
  • $error - se si è verificato un errore, la sua descrizione

Output del token Cloudflare Turnstile

Formato del risultato:

$resp

Esempio di risultato:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Impostazioni possibili

Per selezionare il servizio viene utilizzato il parametro Provider.

ParametroValore predefinitoDescrizione
Client keyChiave cliente per i servizi di risoluzione online
Provider urlURL del provider, consente di sovrascrivere il dominio. È possibile specificarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario a seconda del servizio di risoluzione selezionato
ProviderAntiCaptchaServizio di risoluzione
Wait between get status5Ritardo tra la ricezione dello stato
Max wait time300Tempo massimo di attesa per la risoluzione
Max browser pages for Auto modeLimita il numero di pagine del browser aperte contemporaneamente durante la risoluzione del captcha, se in Provider è selezionato Auto (using browser)