Ga naar de hoofdinhoud

Util::AntiGate - captcha-herkenning via de AntiGate-service

Overzicht van de scraper

antigate

Deze scraper wordt meestal gebruikt als een plug-in component in andere scrapers waar het nodig kan zijn om afbeeldings-captcha's op te lossen, bijvoorbeeld: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, evenals in op maat gemaakte JavaScript-scrapers.

Het werkingsprincipe van deze scraper is het verzenden van een captcha-afbeelding naar een oplossingsdienst en het als antwoord ontvangen van de tekstwaarde die op de captcha wordt afgebeeld. De nauwkeurigheid van het oplossen hangt uitsluitend af van de oplossingsdienst en soms van de captcha-instellingen.

Het proces van het verbinden en configureren van deze scraper wordt gedetailleerd beschreven in het artikel Anticaptcha instellen

Use cases voor de scraper

Mogelijkheden

  • Ondersteuning voor alle AntiGate-compatibele diensten: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, enz.
  • Mogelijkheid om de wachttijd voor antwoorden en captcha-parameters flexibel te configureren, en de oplossingsdienst te informeren over een onjuist opgeloste captcha.

Gebruiksscenario's

  • Herkenning van captcha's in ingebouwde scrapers, waarbij het optioneel of verplicht is om captcha's op te lossen om resultaten te verkrijgen.
  • Herkenning van captcha's in eigen JS-scrapers.
  • Herkenning van kleine tekstgegevens van afbeeldingen (bijvoorbeeld telefoonnummers).

Query's

Als query's moet een link naar de captcha worden opgegeven, bijvoorbeeld:

https://files.a-parser.com/img/get-captcha-image.png

Voorbeelden van resultaatuitvoer

  • $answer - het antwoord van de captcha
  • $error - als er een fout is opgetreden, de beschrijving ervan

Uitvoer van herkende tekst

Resultaatindeling:

$answer

Voorbeeldresultaat:

332822

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
ProviderAntiCaptchaSelectie van de oplossingsdienst, vult automatisch het juiste adres (url) van de dienst in
Provider urlDomein van de oplossingsdienst, maakt het mogelijk om het domein van de dienst te overschrijven, kan leeg zijn
Client keyToegangssleutel voor de dienst
HTTP errors retries5Aantal pogingen om de captcha te herkennen bij netwerkstoringen
HTTP timeout60time-out van het serverantwoord in seconden
Wait between get status5Vertraging tussen het opvragen van de status van de captcha bij de antigate-dienst
Max wait time300Maximale wachttijd voor een herkende captcha
NO_SLOT_AVAILABLE retries5Aantal pogingen om de captcha naar de anticaptcha-dienst te uploaden als de dienst een overbelastingsbericht geeft
NO_SLOT_AVAILABLE interval2Wachtinterval tussen pogingen in seconden
Param "phrase"00 = standaardwaarde (één woord). 1 = captcha heeft twee woorden
Param "regsense"00 = standaardwaarde (hoofdletterongevoelig). 1 = hoofdlettergevoelig
Param "numeric"00 = standaardwaarde. 1 = captcha bestaat alleen uit cijfers. 2 = captcha heeft geen cijfers
Param "calc"00 = standaardwaarde. 1 = wiskundige bewerking met cijfers op de captcha
Param "min_len"00 = standaardwaarde. >0 = minimale tekstlengte op de captcha die de medewerker moet invoeren
Param "max_len"00 = standaardwaarde (onbeperkt). >0 = maximale tekstlengte op de captcha die de medewerker moet invoeren
Param "is_russian"00 = standaardwaarde. 1 = toon de captcha aan een medewerker met kennis van de Russische taal
Fake answerNep-antwoord, gebruikt de dienst niet maar geeft direct een willekeurige reeks als antwoord, wordt gebruikt voor het testen van scrapers
Report bad captchasAls deze optie is uitgeschakeld, wordt tijd bespaard die wordt besteed aan het controleren van de juistheid van de captcha. Relevant voor CapMonster en XEvil
Log captcha imagesBeheer van de uitvoer van captcha-afbeeldingen naar het logboek
Stop task on zero balanceStop de taak als het saldo van de oplossingsdienst op is