Zum Hauptinhalt springen

Util::ReCaptcha2 - ReCaptcha-Erkennung

Übersicht des Parsers

Dieser Parser wird nur als Plug-in-Komponente in anderen Scrapern verwendet, bei denen das Lösen von Google ReCaptcha v2 erforderlich sein kann, zum Beispiel: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, sowie in benutzerdefinierten JavaScript-Scrapern.

Das Funktionsprinzip dieses Parsers besteht darin, ReCaptcha-Daten (normalerweise den Sitekey und die URL der Seite, auf der das ReCaptcha empfangen wurde) an einen Lösungsdienst zu senden und als Antwort ein Token zu erhalten, das aus Zahlen und Buchstaben besteht. Die Korrektheit der Lösung hängt allein vom Lösungsdienst ab; in der Regel lösen diese Dienste ReCaptchas fast immer korrekt.

Der Prozess der Anbindung und Konfiguration dieses Parsers ist im Artikel ReCaptcha-Einstellungen ausführlich beschrieben.

Anwendungsbeispiele für den Parser

Beispiel für die Konfiguration der Lösung über Xevil

In Xevil wird empfohlen, den API-Typ Antigate (Anti-Captcha) zu wählen. In den Einstellungen von Util::ReCaptcha2Util::ReCaptcha2 muss unter Provider url die ip:port von Xevil angegeben werden:

Provider-URL in Xevil für den Parser Util::ReCaptcha2

Wählen Sie unter Provider Xevil (AntiGate) aus:

Konfiguration der Provider-URL für den Parser Util::ReCaptcha2

Funktionen

  • Unterstützung für folgende Dienste: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Möglichkeit, die Wartezeit auf eine Antwort und die Verzögerung bei der Statusprüfung zu konfigurieren

Anwendungsfälle

  • Erkennung von ReCaptchas in integrierten Scrapern, bei denen das Lösen von Captchas optional oder obligatorisch ist, um Ergebnisse zu erhalten
  • Erkennung von ReCaptchas in eigenen JS-Parsern

Anfragen

Der Parser akzeptiert zwei Arten von Anfragen:

  • sitekey url
  • sitekey url proxy user-agent

Die Parameter werden durch ein Leerzeichen getrennt und bedeuten:

  • sitekey - der Sitekey des ReCaptchas
  • url - die Seite, auf der sich das ReCaptcha befindet
  • proxy - der Proxy, über den das ReCaptcha empfangen wurde. Der Parameter muss im Format login:pass@ip:port@type für Proxys mit Authentifizierung oder ip:port@type für Proxys ohne Authentifizierung vorliegen
    • type kann http, https, socks4, socks5 sein
  • user-agent - der User-Agent, mit dem das ReCaptcha empfangen wurde

Beispiele für die Ergebnisausgabe

  • $resp - die Antwort des ReCaptchas
  • $error - falls ein Fehler aufgetreten ist, dessen Beschreibung

Ausgabe des ReCaptcha-Tokens

Ergebnisformat:

$resp

Ergebnisbeispiel:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Mögliche Einstellungen

Zur Auswahl des Dienstes wird der Parameter Provider verwendet.

Für Online-Dienste (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) muss zwingend der Parameter Client key festgelegt werden.

ParameterStandardwertBeschreibung
Client keyClient-Schlüssel für Online-Lösungsdienste
Provider urlProvider-URL, ermöglicht das Überschreiben der Domain. Es können mehrere durch Komma getrennt angegeben werden, der Parser verwendet diese in zufälliger Reihenfolge. Kann leer sein, der Parser verwendet automatisch die richtige URL basierend auf dem gewählten Lösungsdienst
ProviderAntiCaptchaLösungsdienst
Wait between get status5Verzögerung zwischen den Statusabfragen
Max wait time300Maximale Wartezeit für die Lösung