Przejdź do treści głównej

Util::ReCaptcha3 - rozpoznawanie Google ReCaptcha v3

Przegląd scrapera

Ten scraper jest przeznaczony do użytku jako komponent podrzędny w innych scraperach, w których może być konieczne rozwiązanie Google ReCaptcha v3.

Zasada działania tego scrapera polega na wysyłaniu danych reCAPTCHA (zawsze jest to sitekey oraz url strony, na której otrzymano reCAPTCHA) do serwisu rozwiązującego i otrzymaniu w odpowiedzi tokena składającego się z cyfr i liter. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego; zazwyczaj serwisy te prawie zawsze rozwiązują reCAPTCHA poprawnie.

Funkcje

  • Obsługiwana jest współpraca z następującymi serwisami: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Możliwość konfiguracji czasu oczekiwania na odpowiedź oraz opóźnienia sprawdzenia statusu

Zastosowania

  • Rozpoznawanie Google ReCaptcha v3 we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captche w celu uzyskania wyników
  • Rozpoznawanie Google ReCaptcha v3 we własnych scraperach JS

Zapytania

Scraper przyjmuje zapytania w formacie:

  • sitekey url

Parametry są oddzielone spacją i oznaczają:

  • sitekey - jest to sitekey reCAPTCHA, w niektórych serwisach nazywany websitekey. Zazwyczaj sitekey należy pobrać z kodu strony i przeważnie znajduje się on w adresie URL dołączanego skryptu:
https://www.google.com/recaptcha/api.js?render=SITEKEY

Również sitekey w kodzie strony może być podany jako argument funkcji:

grecaptcha.execute(SITEKEY, {action:'verify'}).
  • url - strona, na której znajduje się reCAPTCHA

Warianty wyświetlania wyników

  • $resp - odpowiedź reCAPTCHA
  • $error - jeśli wystąpił błąd, jego opis

Wyświetlanie tokena reCAPTCHA

Format wyniku:

$resp

Przykład wyniku:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Możliwe ustawienia

Do wyboru używanego serwisu służy parametr Provider.

Dla serwisów online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) konieczne jest ustawienie parametru Client key.

ParametrWartość domyślnaOpis
Client keyKlucz klienta dla online serwisów rozwiązywania
Provider urlUrl dostawcy, pozwala nadpisać domenę. Można podać kilka oddzielonych przecinkiem, scraper będzie używał każdego z nich w losowej kolejności. Może być pusty, scraper automatycznie użyje właściwego w zależności od wybranego serwisu rozwiązywania
ProviderAntiCaptchaSerwis rozwiązywania
Wait between get status5Opóźnienie między sprawdzaniem statusu
Max wait time300Maksymalny czas oczekiwania na rozwiązanie
minScore0.3Minimalny stopień zaufania do wyniku. Dobierany eksperymentalnie dla każdej oddzielnej strony. Przy zapytaniu do serwisu rozwiązywania określa filtr, według którego wybierany jest pracownik z wymaganym minimalnym score
pageActionWartość parametru action, która jest przekazywana do Google i którą potem widzi właściciel strony podczas weryfikacji tokena. Zazwyczaj podawana jako argument funkcji: grecaptcha.execute('sitekey', {action:'WARTOŚĆ ACTION'})
isEnterpriseWskazuje serwisowi rozwiązywania, że należy rozwiązać tę reCAPTCHA jako Recaptcha Enterprise V3. Działa nie we wszystkich serwisach rozwiązywania