Util::ReCaptcha2 - riconoscimento di reCAPTCHA
Panoramica dello scraper
Questo scraper viene utilizzato solo come componente aggiuntivo in altri scraper dove potrebbe essere necessario risolvere Google ReCaptcha v2, ad esempio:
SE::Google,
SE::Google::Images,
SE::Google::ByImage, così come negli scraper JavaScript personalizzati.
Il principio di funzionamento di questo scraper consiste nell'invio dei dati reCAPTCHA (solitamente sitekey e l'URL della pagina in cui è stato ottenuto il reCAPTCHA) a un servizio di risoluzione e nella ricezione in risposta di un token composto da numeri e lettere. La correttezza della risoluzione dipende esclusivamente dal servizio di risoluzione; di norma, i servizi risolvono i reCAPTCHA correttamente quasi sempre.
Il processo di connessione e configurazione di questo scraper è descritto dettagliatamente nell'articolo Configurazione di ReCaptcha
Casi d'uso dello scraper
🔗 ReCaptcha negli scraper JS
Esempio di scraper JS per lavorare con le reCAPTCHA
Esempio di configurazione della risoluzione tramite Xevil
In Xevil si consiglia di selezionare il tipo di API Antigate (Anti-Captcha). Nelle impostazioni di
Util::ReCaptcha2, nel campo Provider url, è necessario specificare ip:port di Xevil:

In Provider selezionare Xevil (AntiGate):

Funzionalità
- Supporto per i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Possibilità di configurare il tempo di attesa della risposta e il ritardo del controllo dello stato
Varianti di utilizzo
- Riconoscimento di reCAPTCHA negli scraper integrati, in cui è opzionale o obbligatorio risolvere i captcha per ottenere i risultati
- Riconoscimento di reCAPTCHA in scraper JS personalizzati
Query
Lo scraper accetta due tipi di query:
sitekeyurlsitekeyurlproxyuser-agent
I parametri sono separati da uno spazio e significano:
sitekey- è la sitekey del reCAPTCHAurl- la pagina in cui si trova il reCAPTCHAproxy- il proxy attraverso il quale è stato ottenuto il reCAPTCHA. Il parametro deve essere nel formatologin:pass@ip:port@typeper proxy con autorizzazione oip:port@typeper proxy senza autorizzazione- type può essere
http,https,socks4,socks5
- type può essere
user-agent- lo user-agent con cui è stato ottenuto il reCAPTCHA
Varianti di output dei risultati
$resp- risposta del reCAPTCHA$error- se si è verificato un errore, la sua descrizione
Output del token reCAPTCHA
Formato del risultato:
$resp
Esempio di risultato:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Possibili impostazioni
Per selezionare il servizio si utilizza il parametro Provider.
Per i servizi online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) è obbligatorio impostare il parametro Client key.
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Client key | Chiave cliente per i servizi di risoluzione online | |
| Provider url | URL del provider, consente di sovrascrivere il dominio. È possibile indicarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario in base al servizio di risoluzione selezionato | |
| Provider | AntiCaptcha | Servizio di risoluzione |
| Wait between get status | 5 | Ritardo tra la ricezione dello stato |
| Max wait time | 300 | Tempo massimo di attesa per la risoluzione |