Util::AntiGate - captcha-herkenning via de AntiGate-service
Overzicht van de scraper

Deze scraper wordt meestal gebruikt als een plug-in component in andere scrapers waar het nodig kan zijn om afbeeldings-captcha's op te lossen, bijvoorbeeld:
SE::Yandex,
Check::RosKomNadzor, evenals in op maat gemaakte JavaScript-scrapers.
Het werkingsprincipe van deze scraper is het verzenden van een captcha-afbeelding naar een oplossingsdienst en het als antwoord ontvangen van de tekstwaarde die op de captcha wordt afgebeeld. De nauwkeurigheid van het oplossen hangt uitsluitend af van de oplossingsdienst en soms van de captcha-instellingen.
Het proces van het verbinden en configureren van deze scraper wordt gedetailleerd beschreven in het artikel Anticaptcha instellen
Use cases voor de scraper
🔗 Yandex-gegevensextractie
Verkrijg Yandex-zoekresultaten en de positie van het resultaat
🔗 Captcha in JS-scrapers
Voorbeeld van een JS-scraper voor het werken met captcha's
Mogelijkheden
- Ondersteuning voor alle AntiGate-compatibele diensten: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, enz.
- Mogelijkheid om de wachttijd voor antwoorden en captcha-parameters flexibel te configureren, en de oplossingsdienst te informeren over een onjuist opgeloste captcha.
Gebruiksscenario's
- Herkenning van captcha's in ingebouwde scrapers, waarbij het optioneel of verplicht is om captcha's op te lossen om resultaten te verkrijgen.
- Herkenning van captcha's in eigen JS-scrapers.
- Herkenning van kleine tekstgegevens van afbeeldingen (bijvoorbeeld telefoonnummers).
Query's
Als query's moet een link naar de captcha worden opgegeven, bijvoorbeeld:
https://files.a-parser.com/img/get-captcha-image.png
Voorbeelden van resultaatuitvoer
$answer- het antwoord van de captcha$error- als er een fout is opgetreden, de beschrijving ervan
Uitvoer van herkende tekst
Resultaatindeling:
$answer
Voorbeeldresultaat:
332822
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Provider | AntiCaptcha | Selectie van de oplossingsdienst, vult automatisch het juiste adres (url) van de dienst in |
| Provider url | Domein van de oplossingsdienst, maakt het mogelijk om het domein van de dienst te overschrijven, kan leeg zijn | |
| Client key | Toegangssleutel voor de dienst | |
| HTTP errors retries | 5 | Aantal pogingen om de captcha te herkennen bij netwerkstoringen |
| HTTP timeout | 60 | time-out van het serverantwoord in seconden |
| Wait between get status | 5 | Vertraging tussen het opvragen van de status van de captcha bij de antigate-dienst |
| Max wait time | 300 | Maximale wachttijd voor een herkende captcha |
| NO_SLOT_AVAILABLE retries | 5 | Aantal pogingen om de captcha naar de anticaptcha-dienst te uploaden als de dienst een overbelastingsbericht geeft |
| NO_SLOT_AVAILABLE interval | 2 | Wachtinterval tussen pogingen in seconden |
| Param "phrase" | 0 | 0 = standaardwaarde (één woord). 1 = captcha heeft twee woorden |
| Param "regsense" | 0 | 0 = standaardwaarde (hoofdletterongevoelig). 1 = hoofdlettergevoelig |
| Param "numeric" | 0 | 0 = standaardwaarde. 1 = captcha bestaat alleen uit cijfers. 2 = captcha heeft geen cijfers |
| Param "calc" | 0 | 0 = standaardwaarde. 1 = wiskundige bewerking met cijfers op de captcha |
| Param "min_len" | 0 | 0 = standaardwaarde. >0 = minimale tekstlengte op de captcha die de medewerker moet invoeren |
| Param "max_len" | 0 | 0 = standaardwaarde (onbeperkt). >0 = maximale tekstlengte op de captcha die de medewerker moet invoeren |
| Param "is_russian" | 0 | 0 = standaardwaarde. 1 = toon de captcha aan een medewerker met kennis van de Russische taal |
| Fake answer | ☐ | Nep-antwoord, gebruikt de dienst niet maar geeft direct een willekeurige reeks als antwoord, wordt gebruikt voor het testen van scrapers |
| Report bad captchas | ☐ | Als deze optie is uitgeschakeld, wordt tijd bespaard die wordt besteed aan het controleren van de juistheid van de captcha. Relevant voor CapMonster en XEvil |
| Log captcha images | ☐ | Beheer van de uitvoer van captcha-afbeeldingen naar het logboek |
| Stop task on zero balance | ☑ | Stop de taak als het saldo van de oplossingsdienst op is |