Hoppa till huvudinnehåll

Util::AntiGate - bildigenkänning via tjänsten AntiGate

Översikt av scrapern

antigate

Denna scraper används vanligtvis som en ansluten komponent i andra scrapers där det kan vara nödvändigt att lösa captchas i form av bilder, till exempel: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, samt i anpassade JavaScript-scrapers.

Principen för denna scraper är att skicka en bild av en captcha till en lösningstjänst och få tillbaka det textvärde som visas på captchan. Korrektheten i lösningen beror enbart på lösningstjänsten och ibland på captcha-inställningarna.

Processen för att ansluta och konfigurera denna scraper beskrivs i detalj i artikeln Inställning av Anticaptcha

Användningsfall för scrapern

Funktioner

  • Stöd för alla AntiGate-kompatibla tjänster: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar etc.
  • Möjlighet att flexibelt konfigurera väntetid för svar, captcha-parametrar och meddela lösningstjänsten om en felaktigt löst captcha

Varianter av användning

  • Igenkänning av captchas i inbyggda scrapers, där det valfritt eller obligatoriskt krävs att lösa captchas för att få resultat
  • Igenkänning av captchas i egna JS-scrapers
  • Igenkänning av små textdata från bilder (till exempel telefonnummer)

Frågor

Som frågor måste en länk till captchan anges, exempel:

https://files.a-parser.com/img/get-captcha-image.png

Varianter för utmatning av resultat

  • $answer - captcha-svar
  • $error - om ett fel uppstod, dess beskrivning

Utmatning av igenkänd text

Resultatformat:

$answer

Exempel på resultat:

332822

Möjliga inställningar

ParameterStandardvärdeBeskrivning
ProviderAntiCaptchaVal av lösningstjänst, fyller automatiskt i rätt adress (url) till tjänsten
Provider urlDomän för lösningstjänsten, gör det möjligt att åsidosätta tjänstens domän, kan vara tom
Client keyÅtkomstnyckel till tjänsten
HTTP errors retries5Antal försök att känna igen captchan vid nätverksfel
HTTP timeout60timeout för serversvar i sekunder
Wait between get status5Fördröjning mellan förfrågningar till antigate-tjänsten om captchans status
Max wait time300Maximal väntetid för igenkänd captcha
NO_SLOT_AVAILABLE retries5Antal försök att ladda upp captchan till anticaptcha-tjänsten om tjänsten meddelar om överbelastning
NO_SLOT_AVAILABLE interval2Vänteintervall mellan försök i sekunder
Param "phrase"00 = standardvärde (ett ord). 1 = captchan har två ord
Param "regsense"00 = standardvärde (skiftlägesoberoende). 1 = skiftlägeskänslig
Param "numeric"00 = standardvärde. 1 = captchan består endast av siffror. 2 = captchan har inga siffror
Param "calc"00 = standardvärde. 1 = matematisk operation med siffror på captchan
Param "min_len"00 = standardvärde. >0 = minsta textlängd på captchan som arbetaren måste ange
Param "max_len"00 = standardvärde (obegränsat). >0 = maximal textlängd på captchan som arbetaren måste ange
Param "is_russian"00 = standardvärde. 1 = visa captchan för en arbetare med kunskaper i ryska språket
Fake answerFalskt svar, använder inte tjänsten utan ger omedelbart en slumpmässig sträng som svar, används för att testa scrapers
Report bad captchasOm alternativet är inaktiverat sparas tid som annars läggs på att kontrollera förfrågan om captchans korrekthet. Relevant för CapMonster och XEvil
Log captcha imagesHantering av utmatning av captcha-bilder i loggen
Stop task on zero balanceStoppa uppgiften om saldot hos lösningstjänsten tar slut