Util::ReCaptcha2 - rozpoznawanie reCAPTCHA
Przegląd scrapera
Ten scraper jest używany wyłącznie jako komponent wtykowy w innych scraperach, gdzie może być konieczne rozwiązywanie Google ReCaptcha v2, na przykład:
SE::Google,
SE::Google::Images,
SE::Google::ByImage, a także w niestandardowych scraperach JavaScript.
Zasada działania tego scrapera polega na przesyłaniu danych reCAPTCHA (zazwyczaj jest to sitekey oraz adres URL strony, na której znajduje się reCAPTCHA) do serwisu rozwiązującego i otrzymaniu w odpowiedzi tokena składającego się z cyfr i liter. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego; zazwyczaj serwisy te niemal zawsze rozwiązują reCAPTCHA poprawnie.
Szczegółowy proces podłączenia i konfiguracji tego scrapera został opisany w artykule Konfiguracja ReCaptcha
Przypadki użycia scrapera
🔗 ReCaptcha w scraperach JS
Przykład scrapera JS do pracy z reCAPTCHA
Przykład konfiguracji rozwiązywania przez Xevil
W Xevil zaleca się wybranie typu API Antigate (Anti-Captcha). W ustawieniach
Util::ReCaptcha2 w Provider url należy podać ip:port Xevil:

W Provider wybrać Xevil (AntiGate):

Możliwości
- Obsługiwana jest współpraca z następującymi serwisami: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Możliwość konfiguracji czasu oczekiwania na odpowiedź oraz opóźnienia sprawdzania statusu
Warianty użycia
- Rozpoznawanie reCAPTCHA we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captcha w celu uzyskania wyników
- Rozpoznawanie reCAPTCHA we własnych scraperach JS
Zapytania
Scraper przyjmuje zapytania dwóch rodzajów:
sitekeyurlsitekeyurlproxyuser-agent
Parametry są oddzielone spacją i oznaczają:
sitekey- to sitekey reCAPTCHAurl- strona, na której znajduje się reCAPTCHAproxy- proxy, przez które pobrano reCAPTCHA. Parametr powinien być w formacielogin:pass@ip:port@typedla proxy z autoryzacją lubip:port@typedla proxy bez autoryzacji- type może być
http,https,socks4,socks5
- type może być
user-agent- user-agent, z którym pobrano reCAPTCHA
Warianty wyświetlania wyników
$resp- odpowiedź reCAPTCHA$error- jeśli wystąpił błąd, jego opis
Wyświetlanie tokena reCAPTCHA
Format wyniku:
$resp
Przykład wyniku:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Możliwe ustawienia
Do wyboru serwisu służy parametr Provider.
Dla serwisów online (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) należy obowiązkowo ustawić parametr Client key.
| Parametr | Wartość domyślna | Opis |
|---|---|---|
| Client key | Klucz klienta dla serwisów rozwiązywania online | |
| Provider url | URL dostawcy, pozwala nadpisać domenę. Można podać kilka oddzielonych przecinkiem, scraper będzie używał każdego z nich w losowej kolejności. Może być pusty, scraper automatycznie użyje właściwego w zależności od wybranego serwisu rozwiązywania | |
| Provider | AntiCaptcha | Serwis rozwiązywania |
| Wait between get status | 5 | Opóźnienie między sprawdzaniem statusu |
| Max wait time | 300 | Maksymalny czas oczekiwania na rozwiązanie |