Util::ReCaptcha3 - rozpoznawanie Google ReCaptcha v3
Przegląd scrapera
Ten scraper jest przeznaczony do użytku jako komponent podrzędny w innych scraperach, w których może być konieczne rozwiązanie Google ReCaptcha v3.
Zasada działania tego scrapera polega na wysyłaniu danych reCAPTCHA (zawsze jest to sitekey oraz url strony, na której otrzymano reCAPTCHA) do serwisu rozwiązującego i otrzymaniu w odpowiedzi tokena składającego się z cyfr i liter. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego; zazwyczaj serwisy te prawie zawsze rozwiązują reCAPTCHA poprawnie.
Funkcje
- Obsługiwana jest współpraca z następującymi serwisami: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Możliwość konfiguracji czasu oczekiwania na odpowiedź oraz opóźnienia sprawdzenia statusu
Zastosowania
- Rozpoznawanie Google ReCaptcha v3 we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captche w celu uzyskania wyników
- Rozpoznawanie Google ReCaptcha v3 we własnych scraperach JS
Zapytania
Scraper przyjmuje zapytania w formacie:
sitekeyurl
Parametry są oddzielone spacją i oznaczają:
sitekey- jest to sitekey reCAPTCHA, w niektórych serwisach nazywany websitekey. Zazwyczaj sitekey należy pobrać z kodu strony i przeważnie znajduje się on w adresie URL dołączanego skryptu:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Również sitekey w kodzie strony może być podany jako argument funkcji:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- strona, na której znajduje się reCAPTCHA
Warianty wyświetlania wyników
$resp- odpowiedź reCAPTCHA$error- jeśli wystąpił błąd, jego opis
Wyświetlanie tokena reCAPTCHA
Format wyniku:
$resp
Przykład wyniku:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Możliwe ustawienia
Do wyboru używanego serwisu służy parametr Provider.
Dla serwisów online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) konieczne jest ustawienie parametru Client key.
| Parametr | Wartość domyślna | Opis |
|---|---|---|
| Client key | Klucz klienta dla online serwisów rozwiązywania | |
| Provider url | Url dostawcy, pozwala nadpisać domenę. Można podać kilka oddzielonych przecinkiem, scraper będzie używał każdego z nich w losowej kolejności. Może być pusty, scraper automatycznie użyje właściwego w zależności od wybranego serwisu rozwiązywania | |
| Provider | AntiCaptcha | Serwis rozwiązywania |
| Wait between get status | 5 | Opóźnienie między sprawdzaniem statusu |
| Max wait time | 300 | Maksymalny czas oczekiwania na rozwiązanie |
| minScore | 0.3 | Minimalny stopień zaufania do wyniku. Dobierany eksperymentalnie dla każdej oddzielnej strony. Przy zapytaniu do serwisu rozwiązywania określa filtr, według którego wybierany jest pracownik z wymaganym minimalnym score |
| pageAction | Wartość parametru action, która jest przekazywana do Google i którą potem widzi właściciel strony podczas weryfikacji tokena. Zazwyczaj podawana jako argument funkcji: grecaptcha.execute('sitekey', {action:'WARTOŚĆ ACTION'}) | |
| isEnterprise | ☐ | Wskazuje serwisowi rozwiązywania, że należy rozwiązać tę reCAPTCHA jako Recaptcha Enterprise V3. Działa nie we wszystkich serwisach rozwiązywania |