Zum Hauptinhalt springen

Util::ReCaptcha3 - Erkennung von Google ReCaptcha v3

Übersicht über den Parser

Dieser Parser ist für die Verwendung als steckbare Komponente in anderen Scrapern konzipiert, bei denen es erforderlich sein kann, Google ReCaptcha v3 zu lösen.

Das Funktionsprinzip dieses Parsers besteht darin, ReCaptcha-Daten (dies sind immer sitekey und die URL der Seite, auf der das ReCaptcha erhalten wurde) an einen Lösungsdienst zu senden und als Antwort ein Token zu erhalten, das aus Zahlen und Buchstaben besteht. Die Korrektheit der Lösung hängt allein vom Lösungsdienst ab; in der Regel lösen die Dienste ReCaptchas fast immer korrekt.

Funktionen

  • Unterstützung für folgende Dienste: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Möglichkeit, die Antwortwartezeit und die Verzögerung der Statusprüfung zu konfigurieren

Anwendungsfälle

  • Erkennung von Google ReCaptcha v3 in integrierten Scrapern, bei denen optional oder obligatorisch Captchas gelöst werden müssen, um Ergebnisse zu erhalten
  • Erkennung von Google ReCaptcha v3 in eigenen JS-Scrapern

Abfragen

Der Parser akzeptiert Abfragen im Format:

  • sitekey url

Die Parameter werden durch ein Leerzeichen getrennt und bedeuten:

  • sitekey - dies ist der Sitekey des ReCaptchas, bei einigen Diensten wird er websitekey genannt. In der Regel muss der Sitekey aus dem Quellcode der Seite extrahiert werden und befindet sich normalerweise in der URL des eingebundenen Skripts:
https://www.google.com/recaptcha/api.js?render=SITEKEY

Außerdem kann der Sitekey im Seitencode als Funktionsargument angegeben sein:

grecaptcha.execute(SITEKEY, {action:'verify'}).
  • url - die Seite, auf der sich das ReCaptcha befindet

Beispiele für die Ergebnisausgabe

  • $resp - ReCaptcha-Antwort
  • $error - falls ein Fehler aufgetreten ist, dessen Beschreibung

Ausgabe des ReCaptcha-Tokens

Ergebnisformat:

$resp

Ergebnisbeispiel:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Mögliche Einstellungen

Zur Auswahl des verwendeten Dienstes wird der Parameter Provider verwendet.

Für Online-Dienste (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) muss zwingend der Parameter Client key festgelegt werden.

ParameterStandardwertBeschreibung
Client keyClient-Schlüssel für Online-Lösungsdienste
Provider urlProvider-URL, ermöglicht das Überschreiben der Domain. Es können mehrere durch Komma getrennt angegeben werden, der Parser verwendet diese in zufälliger Reihenfolge. Kann leer sein, der Parser verwendet automatisch die richtige URL basierend auf dem gewählten Lösungsdienst
ProviderAntiCaptchaLösungsdienst
Wait between get status5Verzögerung zwischen Statusabfragen
Max wait time300Maximale Wartezeit für die Lösung
minScore0.3Minimaler Vertrauenswert (Score) für das Ergebnis. Wird experimentell für jede einzelne Website ermittelt. Bei der Anfrage an den Lösungsdienst definiert dies den Filter, nach dem ein Worker mit dem erforderlichen minimalen Score ausgewählt wird
pageActionWert des Action-Parameters, der an Google übermittelt wird und den der Websitebesitzer bei der Token-Prüfung sieht. Wird in der Regel als Funktionsargument angegeben: grecaptcha.execute('sitekey', {action:'ACTION-WERT'})
isEnterpriseWeist den Lösungsdienst an, dieses ReCaptcha als Recaptcha Enterprise V3 zu lösen. Funktioniert nicht bei allen Lösungsdiensten