Vai al contenuto principale

Util::ReCaptcha2 - riconoscimento di reCAPTCHA

Panoramica dello scraper

Questo scraper viene utilizzato solo come componente aggiuntivo in altri scraper dove potrebbe essere necessario risolvere Google ReCaptcha v2, ad esempio: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, così come negli scraper JavaScript personalizzati.

Il principio di funzionamento di questo scraper consiste nell'invio dei dati reCAPTCHA (solitamente sitekey e l'URL della pagina in cui è stato ottenuto il reCAPTCHA) a un servizio di risoluzione e nella ricezione in risposta di un token composto da numeri e lettere. La correttezza della risoluzione dipende esclusivamente dal servizio di risoluzione; di norma, i servizi risolvono i reCAPTCHA correttamente quasi sempre.

Il processo di connessione e configurazione di questo scraper è descritto dettagliatamente nell'articolo Configurazione di ReCaptcha

Casi d'uso dello scraper

Esempio di configurazione della risoluzione tramite Xevil

In Xevil si consiglia di selezionare il tipo di API Antigate (Anti-Captcha). Nelle impostazioni di Util::ReCaptcha2Util::ReCaptcha2, nel campo Provider url, è necessario specificare ip:port di Xevil:

Provider url v Xevil dlya parsera Util::ReCaptcha2

In Provider selezionare Xevil (AntiGate):

Nastroyka Provider url dlya parsera Util::ReCaptcha2

Funzionalità

  • Supporto per i seguenti servizi: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Possibilità di configurare il tempo di attesa della risposta e il ritardo del controllo dello stato

Varianti di utilizzo

  • Riconoscimento di reCAPTCHA negli scraper integrati, in cui è opzionale o obbligatorio risolvere i captcha per ottenere i risultati
  • Riconoscimento di reCAPTCHA in scraper JS personalizzati

Query

Lo scraper accetta due tipi di query:

  • sitekey url
  • sitekey url proxy user-agent

I parametri sono separati da uno spazio e significano:

  • sitekey - è la sitekey del reCAPTCHA
  • url - la pagina in cui si trova il reCAPTCHA
  • proxy - il proxy attraverso il quale è stato ottenuto il reCAPTCHA. Il parametro deve essere nel formato login:pass@ip:port@type per proxy con autorizzazione o ip:port@type per proxy senza autorizzazione
    • type può essere http, https, socks4, socks5
  • user-agent - lo user-agent con cui è stato ottenuto il reCAPTCHA

Varianti di output dei risultati

  • $resp - risposta del reCAPTCHA
  • $error - se si è verificato un errore, la sua descrizione

Output del token reCAPTCHA

Formato del risultato:

$resp

Esempio di risultato:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Possibili impostazioni

Per selezionare il servizio si utilizza il parametro Provider.

Per i servizi online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) è obbligatorio impostare il parametro Client key.

ParametroValore predefinitoDescrizione
Client keyChiave cliente per i servizi di risoluzione online
Provider urlURL del provider, consente di sovrascrivere il dominio. È possibile indicarne diversi separati da virgola, lo scraper utilizzerà ciascuno di essi in ordine casuale. Può essere vuoto, lo scraper utilizzerà automaticamente quello necessario in base al servizio di risoluzione selezionato
ProviderAntiCaptchaServizio di risoluzione
Wait between get status5Ritardo tra la ricezione dello stato
Max wait time300Tempo massimo di attesa per la risoluzione