Vai al contenuto principale

Util::ReCaptcha3 - riconoscimento di Google ReCaptcha v3

Panoramica dello scraper

Questo scraper è progettato per essere utilizzato come componente integrato in altri scraper, dove potrebbe essere necessario risolvere Google ReCaptcha v3.

Il principio di funzionamento di questo scraper consiste nell'inviare i dati del recaptcha (che sono sempre sitekey e l'url della pagina in cui è stato ottenuto il recaptcha) a un servizio di risoluzione e ricevere in risposta un token composto da numeri e lettere. La correttezza della risoluzione dipende esclusivamente dal servizio di risoluzione; di norma, i servizi risolvono i recaptcha correttamente quasi sempre.

Funzionalità

  • Supporto per il lavoro con i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Possibilità di configurare il tempo di attesa per la risposta e il ritardo nel controllo dello stato

Casi d'uso

  • Riconoscimento di Google ReCaptcha v3 negli scraper integrati, in cui è opzionalmente o obbligatoriamente necessario risolvere i captcha per ottenere i risultati
  • Riconoscimento di Google ReCaptcha v3 negli scraper JS personalizzati

Query

Lo scraper accetta query nel formato:

  • sitekey url

I parametri sono separati da uno spazio e significano:

  • sitekey - è la sitekey del recaptcha, in alcuni servizi è chiamata websitekey. Di norma, la sitekey deve essere ottenuta dal codice della pagina e solitamente si trova nell'url dello script collegato:
https://www.google.com/recaptcha/api.js?render=SITEKEY

Inoltre, la sitekey nel codice della pagina può essere indicata come argomento di una funzione:

grecaptcha.execute(SITEKEY, {action:'verify'}).
  • url - la pagina in cui si trova il recaptcha

Esempi di output dei risultati

  • $resp - risposta del recaptcha
  • $error - se si è verificato un errore, la sua descrizione

Output del token recaptcha

Formato del risultato:

$resp

Esempio di risultato:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Impostazioni possibili

Per scegliere il servizio da utilizzare si usa il parametro Provider.

Per i servizi online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) è obbligatorio impostare il parametro Client key.

ParametroValore predefinitoDescrizione
Client keyChiave cliente per i servizi di risoluzione online
Provider urlURL del provider, permette di sovrascrivere il dominio. È possibile indicarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario in base al servizio di risoluzione selezionato
ProviderAntiCaptchaServizio di risoluzione
Wait between get status5Ritardo tra il recupero dello stato
Max wait time300Tempo massimo di attesa per la risoluzione
minScore0.3Grado minimo di fiducia nel risultato. Viene scelto sperimentalmente per ogni singolo sito. Quando si contatta il servizio di risoluzione, definisce il filtro con cui viene selezionato un operatore con lo score minimo richiesto
pageActionValore del parametro action, che viene passato a Google e che il proprietario del sito vede successivamente durante la verifica del token. Di norma viene indicato come argomento della funzione: grecaptcha.execute('sitekey', {action:'VALORE ACTION'})
isEnterpriseIndica al servizio di risoluzione che è necessario risolvere questo recaptcha come Recaptcha Enterprise V3. Non funziona in tutti i servizi di risoluzione