Util::ReCaptcha2 - ReCaptcha-Erkennung
Übersicht des Parsers
Dieser Parser wird nur als Plug-in-Komponente in anderen Scrapern verwendet, bei denen das Lösen von Google ReCaptcha v2 erforderlich sein kann, zum Beispiel:
SE::Google,
SE::Google::Images,
SE::Google::ByImage, sowie in benutzerdefinierten JavaScript-Scrapern.
Das Funktionsprinzip dieses Parsers besteht darin, ReCaptcha-Daten (normalerweise den Sitekey und die URL der Seite, auf der das ReCaptcha empfangen wurde) an einen Lösungsdienst zu senden und als Antwort ein Token zu erhalten, das aus Zahlen und Buchstaben besteht. Die Korrektheit der Lösung hängt allein vom Lösungsdienst ab; in der Regel lösen diese Dienste ReCaptchas fast immer korrekt.
Der Prozess der Anbindung und Konfiguration dieses Parsers ist im Artikel ReCaptcha-Einstellungen ausführlich beschrieben.
Anwendungsbeispiele für den Parser
🔗 ReCaptcha in JS-Scrapern
Beispiel eines JS-Scrapers für die Arbeit mit ReCaptchas
Beispiel für die Konfiguration der Lösung über Xevil
In Xevil wird empfohlen, den API-Typ Antigate (Anti-Captcha) zu wählen. In den Einstellungen von
Util::ReCaptcha2 muss unter Provider url die ip:port von Xevil angegeben werden:

Wählen Sie unter Provider Xevil (AntiGate) aus:

Funktionen
- Unterstützung für folgende Dienste: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Möglichkeit, die Wartezeit auf eine Antwort und die Verzögerung bei der Statusprüfung zu konfigurieren
Anwendungsfälle
- Erkennung von ReCaptchas in integrierten Scrapern, bei denen das Lösen von Captchas optional oder obligatorisch ist, um Ergebnisse zu erhalten
- Erkennung von ReCaptchas in eigenen JS-Parsern
Anfragen
Der Parser akzeptiert zwei Arten von Anfragen:
sitekeyurlsitekeyurlproxyuser-agent
Die Parameter werden durch ein Leerzeichen getrennt und bedeuten:
sitekey- der Sitekey des ReCaptchasurl- die Seite, auf der sich das ReCaptcha befindetproxy- der Proxy, über den das ReCaptcha empfangen wurde. Der Parameter muss im Formatlogin:pass@ip:port@typefür Proxys mit Authentifizierung oderip:port@typefür Proxys ohne Authentifizierung vorliegen- type kann
http,https,socks4,socks5sein
- type kann
user-agent- der User-Agent, mit dem das ReCaptcha empfangen wurde
Beispiele für die Ergebnisausgabe
$resp- die Antwort des ReCaptchas$error- falls ein Fehler aufgetreten ist, dessen Beschreibung
Ausgabe des ReCaptcha-Tokens
Ergebnisformat:
$resp
Ergebnisbeispiel:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Mögliche Einstellungen
Zur Auswahl des Dienstes wird der Parameter Provider verwendet.
Für Online-Dienste (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) muss zwingend der Parameter Client key festgelegt werden.
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Client key | Client-Schlüssel für Online-Lösungsdienste | |
| Provider url | Provider-URL, ermöglicht das Überschreiben der Domain. Es können mehrere durch Komma getrennt angegeben werden, der Parser verwendet diese in zufälliger Reihenfolge. Kann leer sein, der Parser verwendet automatisch die richtige URL basierend auf dem gewählten Lösungsdienst | |
| Provider | AntiCaptcha | Lösungsdienst |
| Wait between get status | 5 | Verzögerung zwischen den Statusabfragen |
| Max wait time | 300 | Maximale Wartezeit für die Lösung |