Przejdź do treści głównej

Util::AntiGate - rozpoznawanie captcha przez serwis AntiGate

Przegląd scrapera

antigate

Ten scraper jest zazwyczaj używany jako komponent podrzędny w innych scraperach, gdzie może być konieczne rozwiązywanie captch w formie obrazków, na przykład: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, a także w niestandardowych scraperach JavaScript.

Zasada działania tego scrapera polega na wysłaniu obrazka captcha do serwisu rozwiązującego i otrzymaniu w odpowiedzi wartości tekstowej przedstawionej na obrazku. Poprawność rozwiązania zależy wyłącznie od serwisu rozwiązującego, a czasem od ustawień captcha.

Szczegółowy proces podłączenia i konfiguracji tego scrapera został opisany w artykule Konfiguracja Anti-Captcha

Przypadki użycia scrapera

Możliwości

  • Obsługiwana jest praca ze wszystkimi serwisami kompatybilnymi z AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar itp.
  • Możliwość elastycznej konfiguracji czasu oczekiwania na odpowiedź, parametrów captcha oraz powiadamiania serwisu o błędnie rozwiązanej captcha

Warianty użycia

  • Rozpoznawanie captcha we wbudowanych scraperach, w których opcjonalnie lub obowiązkowo należy rozwiązywać captcha w celu uzyskania wyników
  • Rozpoznawanie captcha we własnych scraperach JS
  • Rozpoznawanie niewielkich danych tekstowych z obrazów (np. numerów telefonów)

Zapytania

Jako zapytania należy podawać link do captcha, przykład:

https://files.a-parser.com/img/get-captcha-image.png

Warianty wyprowadzania wyników

  • $answer - odpowiedź captcha
  • $error - jeśli wystąpił błąd, jego opis

Wyprowadzanie rozpoznanego tekstu

Format wyniku:

$answer

Przykład wyniku:

332822

Możliwe ustawienia

ParametrWartość domyślnaOpis
ProviderAntiCaptchaWybór serwisu rozwiązującego, automatycznie podstawia właściwy adres (url) serwisu
Provider urlDomena serwisu rozwiązującego, pozwala nadpisać domenę serwisu, może być pusta
Client keyKlucz dostępu do serwisu
HTTP errors retries5Liczba prób rozpoznania captcha w przypadku awarii sieci
HTTP timeout60limit czasu odpowiedzi serwera w sekundach
Wait between get status5Opóźnienie między zapytaniami do serwisu antigate o stan captcha
Max wait time300Maksymalny czas oczekiwania na rozpoznaną captcha
NO_SLOT_AVAILABLE retries5Liczba prób przesłania captcha do serwisu anticaptcha, jeśli serwis zgłasza przeciążenie
NO_SLOT_AVAILABLE interval2Interwał oczekiwania między próbami w sekundach
Param "phrase"00 = wartość domyślna (jedno słowo). 1 = captcha zawiera dwa słowa
Param "regsense"00 = wartość domyślna (wielkość liter nie ma znaczenia). 1 = wielkość liter ma znaczenie
Param "numeric"00 = wartość domyślna. 1 = captcha składa się tylko z cyfr. 2 = captcha nie zawiera cyfr
Param "calc"00 = wartość domyślna. 1 = działanie matematyczne z cyfr na captcha
Param "min_len"00 = wartość domyślna. >0 = minimalna długość tekstu na captcha, którą pracownik musi wprowadzić
Param "max_len"00 = wartość domyślna (bez ograniczeń). >0 = maksymalna długość tekstu na captcha, którą pracownik musi wprowadzić
Param "is_russian"00 = wartość domyślna. 1 = pokaż captcha pracownikowi ze znajomością języka rosyjskiego
Fake answerFałszywa odpowiedź, nie korzysta z serwisu, lecz od razu zwraca losowy ciąg znaków jako odpowiedź, używane do testowania scraperów
Report bad captchasJeśli opcja jest wyłączona, zostanie zaoszczędzony czas poświęcany na sprawdzanie zapytania o poprawność captcha. Istotne dla CapMonster i XEvil
Log captcha imagesZarządzanie wyświetlaniem obrazków captcha w logu
Stop task on zero balanceZatrzymaj zadanie, jeśli na saldzie serwisu rozwiązującego skończyły się środki