Util::ReCaptcha3 - riconoscimento di Google ReCaptcha v3
Panoramica dello scraper
Questo scraper è progettato per essere utilizzato come componente integrato in altri scraper, dove potrebbe essere necessario risolvere Google ReCaptcha v3.
Il principio di funzionamento di questo scraper consiste nell'inviare i dati del recaptcha (che sono sempre sitekey e l'url della pagina in cui è stato ottenuto il recaptcha) a un servizio di risoluzione e ricevere in risposta un token composto da numeri e lettere. La correttezza della risoluzione dipende esclusivamente dal servizio di risoluzione; di norma, i servizi risolvono i recaptcha correttamente quasi sempre.
Funzionalità
- Supporto per il lavoro con i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Possibilità di configurare il tempo di attesa per la risposta e il ritardo nel controllo dello stato
Casi d'uso
- Riconoscimento di Google ReCaptcha v3 negli scraper integrati, in cui è opzionalmente o obbligatoriamente necessario risolvere i captcha per ottenere i risultati
- Riconoscimento di Google ReCaptcha v3 negli scraper JS personalizzati
Query
Lo scraper accetta query nel formato:
sitekeyurl
I parametri sono separati da uno spazio e significano:
sitekey- è la sitekey del recaptcha, in alcuni servizi è chiamata websitekey. Di norma, la sitekey deve essere ottenuta dal codice della pagina e solitamente si trova nell'url dello script collegato:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Inoltre, la sitekey nel codice della pagina può essere indicata come argomento di una funzione:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- la pagina in cui si trova il recaptcha
Esempi di output dei risultati
$resp- risposta del recaptcha$error- se si è verificato un errore, la sua descrizione
Output del token recaptcha
Formato del risultato:
$resp
Esempio di risultato:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Impostazioni possibili
Per scegliere il servizio da utilizzare si usa il parametro Provider.
Per i servizi online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) è obbligatorio impostare il parametro Client key.
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Client key | Chiave cliente per i servizi di risoluzione online | |
| Provider url | URL del provider, permette di sovrascrivere il dominio. È possibile indicarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario in base al servizio di risoluzione selezionato | |
| Provider | AntiCaptcha | Servizio di risoluzione |
| Wait between get status | 5 | Ritardo tra il recupero dello stato |
| Max wait time | 300 | Tempo massimo di attesa per la risoluzione |
| minScore | 0.3 | Grado minimo di fiducia nel risultato. Viene scelto sperimentalmente per ogni singolo sito. Quando si contatta il servizio di risoluzione, definisce il filtro con cui viene selezionato un operatore con lo score minimo richiesto |
| pageAction | Valore del parametro action, che viene passato a Google e che il proprietario del sito vede successivamente durante la verifica del token. Di norma viene indicato come argomento della funzione: grecaptcha.execute('sitekey', {action:'VALORE ACTION'}) | |
| isEnterprise | ☐ | Indica al servizio di risoluzione che è necessario risolvere questo recaptcha come Recaptcha Enterprise V3. Non funziona in tutti i servizi di risoluzione |