Vai al contenuto principale

Util::AntiGate - riconoscimento captcha tramite il servizio AntiGate

Panoramica dello scraper

antigate

Questo scraper viene solitamente utilizzato come componente aggiuntivo in altri scraper dove potrebbe essere necessario risolvere captcha sotto forma di immagini, ad esempio: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, così come in scraper JavaScript personalizzati.

Il principio di funzionamento di questo scraper consiste nell'inviare l'immagine del captcha a un servizio di risoluzione e ricevere in risposta il valore testuale raffigurato nel captcha. La correttezza della risoluzione dipende esclusivamente dal servizio di risoluzione e talvolta dalle impostazioni del captcha.

Il processo di connessione e configurazione di questo scraper è descritto in dettaglio nell'articolo Configurazione Anti-captcha

Casi d'uso dello scraper

Funzionalità

  • Supporta il lavoro con tutti i servizi compatibili con AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, ecc.
  • Possibilità di configurare in modo flessibile il tempo di attesa della risposta, i parametri del captcha e di notificare al servizio di risoluzione un captcha risolto in modo errato

Casi d'uso

  • Riconoscimento di captcha negli scraper integrati, dove è opzionalmente o obbligatoriamente necessario risolvere i captcha per ottenere i risultati
  • Riconoscimento di captcha nei propri scraper JS
  • Riconoscimento di piccoli dati testuali da immagini (ad esempio numeri di telefono)

Query

Come query è necessario indicare il link all'immagine del captcha, esempio:

https://files.a-parser.com/img/get-captcha-image.png

Esempi di output dei risultati

  • $answer - risposta del captcha
  • $error - se si verifica un errore, la sua descrizione

Output del testo riconosciuto

Formato del risultato:

$answer

Esempio di risultato:

332822

Impostazioni possibili

ParametroValore predefinitoDescrizione
ProviderAntiCaptchaScelta del servizio di risoluzione, inserisce automaticamente l'indirizzo (url) corretto del servizio
Provider urlDominio del servizio di risoluzione, permette di sovrascrivere il dominio del servizio, può essere vuoto
Client keyChiave di accesso al servizio
HTTP errors retries5Numero di tentativi di riconoscimento del captcha in caso di guasti alla rete
HTTP timeout60timeout della risposta del server in secondi
Wait between get status5Ritardo tra le interrogazioni al servizio antigate sullo stato del captcha
Max wait time300Tempo massimo di attesa per il captcha riconosciuto
NO_SLOT_AVAILABLE retries5Numero di tentativi di caricamento del captcha sul servizio anticaptcha se il servizio restituisce un messaggio di sovraccarico
NO_SLOT_AVAILABLE interval2Intervallo di attesa tra i tentativi in secondi
Param "phrase"00 = valore predefinito (una parola). 1 = il captcha ha due parole
Param "regsense"00 = valore predefinito (case-insensitive). 1 = case-sensitive
Param "numeric"00 = valore predefinito. 1 = il captcha consiste solo di cifre. 2 = il captcha non ha cifre
Param "calc"00 = valore predefinito. 1 = operazione matematica con cifre sul captcha
Param "min_len"00 = valore predefinito. >0 = lunghezza minima del testo sul captcha che l'operatore deve inserire
Param "max_len"00 = valore predefinito (illimitato). >0 = lunghezza massima del testo sul captcha che l'operatore deve inserire
Param "is_russian"00 = valore predefinito. 1 = mostra il captcha a un operatore con conoscenza della lingua russa
Fake answerRisposta falsa, non utilizza il servizio ma restituisce immediatamente una stringa casuale come risposta, utilizzato per testare gli scraper
Report bad captchasSe l'opzione è disattivata, si risparmierà tempo speso per verificare la richiesta sulla correttezza del captcha. Rilevante per CapMonster e XEvil
Log captcha imagesGestione dell'output delle immagini captcha nel log
Stop task on zero balanceFerma l'attività se il saldo sul servizio di risoluzione è esaurito