Util::AntiGate - rozpoznawanie captcha przez serwis AntiGate
Przegląd scrapera

Ten scraper jest zazwyczaj używany jako komponent podrzędny w innych scraperach, gdzie może być konieczne rozwiązywanie captch w formie obrazków, na przykład:
SE::Yandex,
Check::RosKomNadzor, a także w niestandardowych scraperach JavaScript.
Zasada działania tego scrapera polega na wysłaniu obrazka captcha do serwisu rozwiązującego i otrzymaniu w odpowiedzi wartości tekstowej przedstawionej na obrazku. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego, a czasem od ustawień captcha.
Szczegółowy proces podłączenia i konfiguracji tego scrapera został opisany w artykule Konfiguracja Anti-Captcha
Przypadki użycia scrapera
🔗 Scrapowanie Yandex
Pobieramy wyniki Yandex i numer pozycji wyniku
🔗 Captcha w scraperach JS
Przykład scrapera JS do pracy z captchami
Możliwości
- Obsługiwana jest praca ze wszystkimi serwisami kompatybilnymi z AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar itp.
- Możliwość elastycznej konfiguracji czasu oczekiwania na odpowiedź, parametrów captcha oraz powiadamiania serwisu o błędnie rozwiązanej captcha
Warianty użycia
- Rozpoznawanie captcha we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captcha w celu uzyskania wyników
- Rozpoznawanie captcha we własnych scraperach JS
- Rozpoznawanie niewielkich danych tekstowych z obrazów (np. numerów telefonów)
Zapytania
Jako zapytania należy podawać link do captcha, przykład:
https://files.a-parser.com/img/get-captcha-image.png
Warianty wyprowadzania wyników
$answer- odpowiedź captcha$error- jeśli wystąpił błąd, jego opis
Wyprowadzanie rozpoznanego tekstu
Format wyniku:
$answer
Przykład wyniku:
332822
Możliwe ustawienia
| Parametr | Wartość domyślna | Opis |
|---|---|---|
| Provider | AntiCaptcha | Wybór serwisu rozwiązującego, automatycznie podstawia właściwy adres (url) serwisu |
| Provider url | Domena serwisu rozwiązującego, pozwala nadpisać domenę serwisu, może być pusta | |
| Client key | Klucz dostępu do serwisu | |
| HTTP errors retries | 5 | Liczba prób rozpoznania captcha w przypadku awarii sieci |
| HTTP timeout | 60 | limit czasu odpowiedzi serwera w sekundach |
| Wait between get status | 5 | Opóźnienie między zapytaniami do serwisu antigate o stan captcha |
| Max wait time | 300 | Maksymalny czas oczekiwania na rozpoznaną captcha |
| NO_SLOT_AVAILABLE retries | 5 | Liczba prób przesłania captcha do serwisu anticaptcha, jeśli serwis zgłasza przeciążenie |
| NO_SLOT_AVAILABLE interval | 2 | Interwał oczekiwania między próbami w sekundach |
| Param "phrase" | 0 | 0 = wartość domyślna (jedno słowo). 1 = captcha zawiera dwa słowa |
| Param "regsense" | 0 | 0 = wartość domyślna (wielkość liter nie ma znaczenia). 1 = wielkość liter ma znaczenie |
| Param "numeric" | 0 | 0 = wartość domyślna. 1 = captcha składa się tylko z cyfr. 2 = captcha nie zawiera cyfr |
| Param "calc" | 0 | 0 = wartość domyślna. 1 = działanie matematyczne z cyfr na captcha |
| Param "min_len" | 0 | 0 = wartość domyślna. >0 = minimalna długość tekstu na captcha, którą pracownik musi wprowadzić |
| Param "max_len" | 0 | 0 = wartość domyślna (bez ograniczeń). >0 = maksymalna długość tekstu na captcha, którą pracownik musi wprowadzić |
| Param "is_russian" | 0 | 0 = wartość domyślna. 1 = pokaż captcha pracownikowi ze znajomością języka rosyjskiego |
| Fake answer | ☐ | Fałszywa odpowiedź, nie korzysta z serwisu, lecz od razu zwraca losowy ciąg znaków jako odpowiedź, używane do testowania scraperów |
| Report bad captchas | ☐ | Jeśli opcja jest wyłączona, zostanie zaoszczędzony czas poświęcany na sprawdzanie zapytania o poprawność captcha. Istotne dla CapMonster i XEvil |
| Log captcha images | ☐ | Zarządzanie wyświetlaniem obrazków captcha w logu |
| Stop task on zero balance | ☑ | Zatrzymaj zadanie, jeśli na saldzie serwisu rozwiązującego skończyły się środki |