Util::AntiGate - Captcha-Erkennung über den AntiGate-Dienst
Übersicht des Parsers

Dieser Parser wird normalerweise als Plug-in-Komponente in anderen Scrapern verwendet, bei denen Bild-Captchas gelöst werden müssen, zum Beispiel:
SE::Yandex,
Check::RosKomNadzor, sowie in benutzerdefinierten JavaScript-Parsern.
Das Funktionsprinzip dieses Parsers besteht darin, ein Captcha-Bild an einen Lösungsdienst zu senden und als Antwort den auf dem Captcha dargestellten Textwert zu erhalten. Die Korrektheit der Lösung hängt allein vom Lösungsdienst und manchmal von den Captcha-Einstellungen ab.
Der Prozess der Verbindung und Konfiguration dieses Parsers ist im Artikel Anticaptcha-Einstellungen ausführlich beschrieben.
Anwendungsbeispiele für den Parser
🔗 Datenerfassung Yandex
Yandex-SERP abrufen und die Position des Ergebnisses ermitteln
🔗 Captcha in JS-Parsern
Beispiel eines JS-Parsers für die Arbeit mit Captchas
Funktionen
- Unterstützung für alle AntiGate-kompatiblen Dienste: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar usw.
- Möglichkeit zur flexiblen Konfiguration der Antwortwartezeit, der Captcha-Parameter und zur Benachrichtigung des Lösungsdienstes über ein falsch gelöstes Captcha
Anwendungsfälle
- Captcha-Erkennung in integrierten Scrapern, bei denen das Lösen von Captchas optional oder obligatorisch ist, um Ergebnisse zu erhalten
- Captcha-Erkennung in eigenen JS-Parsern
- Erkennung kleiner Textdaten aus Bildern (z. B. Telefonnummern)
Anfragen
Als Anfragen muss ein Link zum Captcha angegeben werden, Beispiel:
https://files.a-parser.com/img/get-captcha-image.png
Beispiele für die Ergebnisausgabe
$answer- Captcha-Antwort$error- falls ein Fehler aufgetreten ist, dessen Beschreibung
Ausgabe des erkannten Textes
Ergebnisformat:
$answer
Beispielergebnis:
332822
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Provider | AntiCaptcha | Auswahl des Lösungsdienstes, setzt automatisch die richtige Adresse (URL) des Dienstes ein |
| Provider url | Domain des Lösungsdienstes, ermöglicht das Überschreiben der Dienst-Domain, kann leer sein | |
| Client key | Zugriffsschlüssel für den Dienst | |
| HTTP errors retries | 5 | Anzahl der Versuche zur Captcha-Erkennung bei Netzwerkausfällen |
| HTTP timeout | 60 | Timeout der Serverantwort in Sekunden |
| Wait between get status | 5 | Verzögerung zwischen den Abfragen des AntiGate-Dienstes zum Captcha-Status |
| Max wait time | 300 | Maximale Wartezeit auf das erkannte Captcha |
| NO_SLOT_AVAILABLE retries | 5 | Anzahl der Versuche, das Captcha zum Anticaptcha-Dienst hochzuladen, wenn der Dienst eine Überlastung meldet |
| NO_SLOT_AVAILABLE interval | 2 | Warteintervall zwischen den Versuchen in Sekunden |
| Param "phrase" | 0 | 0 = Standardwert (ein Wort). 1 = Captcha enthält zwei Wörter |
| Param "regsense" | 0 | 0 = Standardwert (Groß-/Kleinschreibung egal). 1 = Groß-/Kleinschreibung ist relevant |
| Param "numeric" | 0 | 0 = Standardwert. 1 = Captcha besteht nur aus Zahlen. 2 = Captcha enthält keine Zahlen |
| Param "calc" | 0 | 0 = Standardwert. 1 = Mathematische Operation aus Zahlen auf dem Captcha |
| Param "min_len" | 0 | 0 = Standardwert. >0 = Mindestlänge des Captcha-Textes, den der Mitarbeiter eingeben muss |
| Param "max_len" | 0 | 0 = Standardwert (unbegrenzt). >0 = Maximallänge des Captcha-Textes, den der Mitarbeiter eingeben muss |
| Param "is_russian" | 0 | 0 = Standardwert. 1 = Captcha einem Mitarbeiter mit Russischkenntnissen anzeigen |
| Fake answer | ☐ | Falsche Antwort, nutzt keinen Dienst, sondern gibt sofort eine zufällige Zeichenfolge als Antwort aus, wird zum Testen von Parsern verwendet |
| Report bad captchas | ☐ | Wenn diese Option deaktiviert ist, wird Zeit gespart, die für die Überprüfung der Anfrage zur Captcha-Korrektheit aufgewendet wird. Relevant für CapMonster und XEvil |
| Log captcha images | ☐ | Steuerung der Ausgabe von Captcha-Bildern im Log |
| Stop task on zero balance | ☑ | Aufgabe stoppen, wenn das Guthaben des Lösungsdienstes aufgebraucht ist |