Chuyển đến nội dung chính

Util::AntiGate - nhận diện captcha qua dịch vụ AntiGate

Tổng quan về công cụ cào dữ liệu

antigate

Công cụ cào dữ liệu này thường được sử dụng như một thành phần kết nối trong các công cụ cào dữ liệu khác, nơi có thể cần giải captcha dưới dạng hình ảnh, ví dụ: SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, cũng như trong các công cụ cào dữ liệu JavaScript tùy chỉnh.

Nguyên lý hoạt động của công cụ cào dữ liệu này là gửi hình ảnh captcha đến dịch vụ giải mã và nhận lại giá trị văn bản được hiển thị trên captcha. Độ chính xác của việc giải mã chỉ phụ thuộc vào dịch vụ giải mã và đôi khi phụ thuộc vào cài đặt captcha.

Quy trình kết nối và cấu hình chi tiết của công cụ cào dữ liệu này được mô tả trong bài viết Cấu hình Anti-captcha

Các trường hợp ứng dụng công cụ cào dữ liệu

Tính năng

  • Hỗ trợ làm việc với tất cả các dịch vụ tương thích với AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, v.v.
  • Khả năng cấu hình linh hoạt thời gian chờ phản hồi, các tham số captcha và thông báo cho dịch vụ giải mã về captcha bị giải sai

Biến thể sử dụng

  • Nhận dạng captcha trong các công cụ cào dữ liệu tích hợp, nơi việc giải captcha là tùy chọn hoặc bắt buộc để nhận kết quả
  • Nhận dạng captcha trong các công cụ cào dữ liệu JS tùy chỉnh
  • Nhận dạng dữ liệu văn bản nhỏ từ hình ảnh (ví dụ: số điện thoại)

Truy vấn

Trong các truy vấn, bạn cần chỉ định liên kết đến captcha, ví dụ:

https://files.a-parser.com/img/get-captcha-image.png

Các biến thể xuất kết quả

  • $answer - câu trả lời của captcha
  • $error - nếu có lỗi xảy ra, mô tả lỗi đó

Xuất văn bản đã nhận dạng

Định dạng kết quả:

$answer

Ví dụ kết quả:

332822

Các cài đặt có thể có

Tham sốGiá trị mặc địnhMô tả
ProviderAntiCaptchaChọn dịch vụ giải mã, tự động thay thế địa chỉ (url) chính xác của dịch vụ
Provider urlTên miền của dịch vụ giải mã, cho phép ghi đè tên miền dịch vụ, có thể để trống
Client keyKhóa truy cập dịch vụ
HTTP errors retries5Số lần thử nhận dạng captcha khi có lỗi mạng
HTTP timeout60thời gian chờ phản hồi từ máy chủ tính bằng giây
Wait between get status5Độ trễ giữa các lần truy vấn dịch vụ antigate về trạng thái của captcha
Max wait time300Thời gian chờ tối đa cho captcha đã được nhận dạng
NO_SLOT_AVAILABLE retries5Số lần thử tải captcha lên dịch vụ anti-captcha nếu dịch vụ báo quá tải
NO_SLOT_AVAILABLE interval2Khoảng thời gian chờ giữa các lần thử tính bằng giây
Param "phrase"00 = giá trị mặc định (một từ). 1 = captcha có hai từ
Param "regsense"00 = giá trị mặc định (không phân biệt chữ hoa chữ thường). 1 = có phân biệt chữ hoa chữ thường
Param "numeric"00 = giá trị mặc định. 1 = captcha chỉ gồm các chữ số. 2 = Captcha không có chữ số
Param "calc"00 = giá trị mặc định. 1 = phép toán từ các chữ số trên captcha
Param "min_len"00 = giá trị mặc định. >0 = độ dài văn bản tối thiểu trên captcha mà nhân viên phải nhập
Param "max_len"00 = giá trị mặc định (không giới hạn). >0 = độ dài văn bản tối đa trên captcha mà nhân viên phải nhập
Param "is_russian"00 = giá trị mặc định. 1 = hiển thị captcha cho nhân viên có kiến thức tiếng Nga
Fake answerCâu trả lời giả, không sử dụng dịch vụ mà trả về ngay một chuỗi ngẫu nhiên làm câu trả lời, được sử dụng để kiểm tra các công cụ cào dữ liệu
Report bad captchasNếu tùy chọn này bị tắt, sẽ tiết kiệm được thời gian kiểm tra yêu cầu về tính chính xác của captcha. Phù hợp với CapMonster và XEvil
Log captcha imagesQuản lý việc xuất hình ảnh captcha vào nhật ký (log)
Stop task on zero balanceDừng tác vụ nếu số dư tài khoản của dịch vụ giải mã đã hết