Przejdź do treści głównej

Util::ReCaptcha2 - rozpoznawanie reCAPTCHA

Przegląd scrapera

Ten scraper jest używany wyłącznie jako komponent wtykowy w innych scraperach, gdzie może być konieczne rozwiązywanie Google ReCaptcha v2, na przykład: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, a także w niestandardowych scraperach JavaScript.

Zasada działania tego scrapera polega na przesyłaniu danych reCAPTCHA (zazwyczaj jest to sitekey oraz adres URL strony, na której znajduje się reCAPTCHA) do serwisu rozwiązującego i otrzymaniu w odpowiedzi tokena składającego się z cyfr i liter. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego; zazwyczaj serwisy te niemal zawsze rozwiązują reCAPTCHA poprawnie.

Szczegółowy proces podłączenia i konfiguracji tego scrapera został opisany w artykule Konfiguracja ReCaptcha

Przypadki użycia scrapera

Przykład konfiguracji rozwiązywania przez Xevil

W Xevil zaleca się wybranie typu API Antigate (Anti-Captcha). W ustawieniach Util::ReCaptcha2Util::ReCaptcha2 w Provider url należy podać ip:port Xevil:

Provider url w Xevil dla scrapera Util::ReCaptcha2

W Provider wybrać Xevil (AntiGate):

Konfiguracja Provider url dla scrapera Util::ReCaptcha2

Możliwości

  • Obsługiwana jest współpraca z następującymi serwisami: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Możliwość konfiguracji czasu oczekiwania na odpowiedź oraz opóźnienia sprawdzania statusu

Warianty użycia

  • Rozpoznawanie reCAPTCHA we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captcha w celu uzyskania wyników
  • Rozpoznawanie reCAPTCHA we własnych scraperach JS

Zapytania

Scraper przyjmuje zapytania dwóch rodzajów:

  • sitekey url
  • sitekey url proxy user-agent

Parametry są oddzielone spacją i oznaczają:

  • sitekey - to sitekey reCAPTCHA
  • url - strona, na której znajduje się reCAPTCHA
  • proxy - proxy, przez które pobrano reCAPTCHA. Parametr powinien być w formacie login:pass@ip:port@type dla proxy z autoryzacją lub ip:port@type dla proxy bez autoryzacji
    • type może być http, https, socks4, socks5
  • user-agent - user-agent, z którym pobrano reCAPTCHA

Warianty wyświetlania wyników

  • $resp - odpowiedź reCAPTCHA
  • $error - jeśli wystąpił błąd, jego opis

Wyświetlanie tokena reCAPTCHA

Format wyniku:

$resp

Przykład wyniku:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Możliwe ustawienia

Do wyboru serwisu służy parametr Provider.

Dla serwisów online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) należy obowiązkowo ustawić parametr Client key.

ParametrWartość domyślnaOpis
Client keyKlucz klienta dla serwisów rozwiązywania online
Provider urlURL dostawcy, pozwala nadpisać domenę. Można podać kilka oddzielonych przecinkiem, scraper będzie używał każdego z nich w losowej kolejności. Może być pusty, scraper automatycznie użyje właściwego w zależności od wybranego serwisu rozwiązywania
ProviderAntiCaptchaSerwis rozwiązywania
Wait between get status5Opóźnienie między sprawdzaniem statusu
Max wait time300Maksymalny czas oczekiwania na rozwiązanie