Util::ReCaptcha3 - Erkennung von Google ReCaptcha v3
Übersicht über den Parser
Dieser Parser ist für die Verwendung als steckbare Komponente in anderen Scrapern konzipiert, bei denen es erforderlich sein kann, Google ReCaptcha v3 zu lösen.
Das Funktionsprinzip dieses Parsers besteht darin, ReCaptcha-Daten (dies sind immer sitekey und die URL der Seite, auf der das ReCaptcha erhalten wurde) an einen Lösungsdienst zu senden und als Antwort ein Token zu erhalten, das aus Zahlen und Buchstaben besteht. Die Korrektheit der Lösung hängt allein vom Lösungsdienst ab; in der Regel lösen die Dienste ReCaptchas fast immer korrekt.
Funktionen
- Unterstützung für folgende Dienste: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Möglichkeit, die Antwortwartezeit und die Verzögerung der Statusprüfung zu konfigurieren
Anwendungsfälle
- Erkennung von Google ReCaptcha v3 in integrierten Scrapern, bei denen optional oder obligatorisch Captchas gelöst werden müssen, um Ergebnisse zu erhalten
- Erkennung von Google ReCaptcha v3 in eigenen JS-Scrapern
Abfragen
Der Parser akzeptiert Abfragen im Format:
sitekeyurl
Die Parameter werden durch ein Leerzeichen getrennt und bedeuten:
sitekey- dies ist der Sitekey des ReCaptchas, bei einigen Diensten wird er websitekey genannt. In der Regel muss der Sitekey aus dem Quellcode der Seite extrahiert werden und befindet sich normalerweise in der URL des eingebundenen Skripts:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Außerdem kann der Sitekey im Seitencode als Funktionsargument angegeben sein:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- die Seite, auf der sich das ReCaptcha befindet
Beispiele für die Ergebnisausgabe
$resp- ReCaptcha-Antwort$error- falls ein Fehler aufgetreten ist, dessen Beschreibung
Ausgabe des ReCaptcha-Tokens
Ergebnisformat:
$resp
Ergebnisbeispiel:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Mögliche Einstellungen
Zur Auswahl des verwendeten Dienstes wird der Parameter Provider verwendet.
Für Online-Dienste (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) muss zwingend der Parameter Client key festgelegt werden.
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Client key | Client-Schlüssel für Online-Lösungsdienste | |
| Provider url | Provider-URL, ermöglicht das Überschreiben der Domain. Es können mehrere durch Komma getrennt angegeben werden, der Parser verwendet diese in zufälliger Reihenfolge. Kann leer sein, der Parser verwendet automatisch die richtige URL basierend auf dem gewählten Lösungsdienst | |
| Provider | AntiCaptcha | Lösungsdienst |
| Wait between get status | 5 | Verzögerung zwischen Statusabfragen |
| Max wait time | 300 | Maximale Wartezeit für die Lösung |
| minScore | 0.3 | Minimaler Vertrauenswert (Score) für das Ergebnis. Wird experimentell für jede einzelne Website ermittelt. Bei der Anfrage an den Lösungsdienst definiert dies den Filter, nach dem ein Worker mit dem erforderlichen minimalen Score ausgewählt wird |
| pageAction | Wert des Action-Parameters, der an Google übermittelt wird und den der Websitebesitzer bei der Token-Prüfung sieht. Wird in der Regel als Funktionsargument angegeben: grecaptcha.execute('sitekey', {action:'ACTION-WERT'}) | |
| isEnterprise | ☐ | Weist den Lösungsdienst an, dieses ReCaptcha als Recaptcha Enterprise V3 zu lösen. Funktioniert nicht bei allen Lösungsdiensten |