Util::AntiGate - bildigenkänning via tjänsten AntiGate
Översikt av scrapern

Denna scraper används vanligtvis som en ansluten komponent i andra scrapers där det kan vara nödvändigt att lösa captchas i form av bilder, till exempel:
SE::Yandex,
Check::RosKomNadzor, samt i anpassade JavaScript-scrapers.
Principen för denna scraper är att skicka en bild av en captcha till en lösningstjänst och få tillbaka det textvärde som visas på captchan. Korrektheten i lösningen beror enbart på lösningstjänsten och ibland på captcha-inställningarna.
Processen för att ansluta och konfigurera denna scraper beskrivs i detalj i artikeln Inställning av Anticaptcha
Användningsfall för scrapern
🔗 Dataskrapning Yandex
Hämtar Yandex sökresultat och resultatets positionsnummer
🔗 Captcha i JS-scrapers
Exempel på JS-scraper för arbete med captchas
Funktioner
- Stöd för alla AntiGate-kompatibla tjänster: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar etc.
- Möjlighet att flexibelt konfigurera väntetid för svar, captcha-parametrar och meddela lösningstjänsten om en felaktigt löst captcha
Varianter av användning
- Igenkänning av captchas i inbyggda scrapers, där det valfritt eller obligatoriskt krävs att lösa captchas för att få resultat
- Igenkänning av captchas i egna JS-scrapers
- Igenkänning av små textdata från bilder (till exempel telefonnummer)
Frågor
Som frågor måste en länk till captchan anges, exempel:
https://files.a-parser.com/img/get-captcha-image.png
Varianter för utmatning av resultat
$answer- captcha-svar$error- om ett fel uppstod, dess beskrivning
Utmatning av igenkänd text
Resultatformat:
$answer
Exempel på resultat:
332822
Möjliga inställningar
| Parameter | Standardvärde | Beskrivning |
|---|---|---|
| Provider | AntiCaptcha | Val av lösningstjänst, fyller automatiskt i rätt adress (url) till tjänsten |
| Provider url | Domän för lösningstjänsten, gör det möjligt att åsidosätta tjänstens domän, kan vara tom | |
| Client key | Åtkomstnyckel till tjänsten | |
| HTTP errors retries | 5 | Antal försök att känna igen captchan vid nätverksfel |
| HTTP timeout | 60 | timeout för serversvar i sekunder |
| Wait between get status | 5 | Fördröjning mellan förfrågningar till antigate-tjänsten om captchans status |
| Max wait time | 300 | Maximal väntetid för igenkänd captcha |
| NO_SLOT_AVAILABLE retries | 5 | Antal försök att ladda upp captchan till anticaptcha-tjänsten om tjänsten meddelar om överbelastning |
| NO_SLOT_AVAILABLE interval | 2 | Vänteintervall mellan försök i sekunder |
| Param "phrase" | 0 | 0 = standardvärde (ett ord). 1 = captchan har två ord |
| Param "regsense" | 0 | 0 = standardvärde (skiftlägesoberoende). 1 = skiftlägeskänslig |
| Param "numeric" | 0 | 0 = standardvärde. 1 = captchan består endast av siffror. 2 = captchan har inga siffror |
| Param "calc" | 0 | 0 = standardvärde. 1 = matematisk operation med siffror på captchan |
| Param "min_len" | 0 | 0 = standardvärde. >0 = minsta textlängd på captchan som arbetaren måste ange |
| Param "max_len" | 0 | 0 = standardvärde (obegränsat). >0 = maximal textlängd på captchan som arbetaren måste ange |
| Param "is_russian" | 0 | 0 = standardvärde. 1 = visa captchan för en arbetare med kunskaper i ryska språket |
| Fake answer | ☐ | Falskt svar, använder inte tjänsten utan ger omedelbart en slumpmässig sträng som svar, används för att testa scrapers |
| Report bad captchas | ☐ | Om alternativet är inaktiverat sparas tid som annars läggs på att kontrollera förfrågan om captchans korrekthet. Relevant för CapMonster och XEvil |
| Log captcha images | ☐ | Hantering av utmatning av captcha-bilder i loggen |
| Stop task on zero balance | ☑ | Stoppa uppgiften om saldot hos lösningstjänsten tar slut |