Util::AntiGate - nhận diện captcha qua dịch vụ AntiGate
Tổng quan về công cụ cào dữ liệu

Công cụ cào dữ liệu này thường được sử dụng như một thành phần kết nối trong các công cụ cào dữ liệu khác, nơi có thể cần giải captcha dưới dạng hình ảnh, ví dụ:
SE::Yandex,
Check::RosKomNadzor, cũng như trong các công cụ cào dữ liệu JavaScript tùy chỉnh.
Nguyên lý hoạt động của công cụ cào dữ liệu này là gửi hình ảnh captcha đến dịch vụ giải mã và nhận lại giá trị văn bản được hiển thị trên captcha. Độ chính xác của việc giải mã chỉ phụ thuộc vào dịch vụ giải mã và đôi khi phụ thuộc vào cài đặt captcha.
Quy trình kết nối và cấu hình chi tiết của công cụ cào dữ liệu này được mô tả trong bài viết Cấu hình Anti-captcha
Các trường hợp ứng dụng công cụ cào dữ liệu
🔗 Cào dữ liệu Yandex
Lấy kết quả tìm kiếm Yandex và số thứ tự vị trí của kết quả
🔗 Captcha trong các công cụ cào dữ liệu JS
Ví dụ về công cụ cào dữ liệu JS để làm việc với captcha
Tính năng
- Hỗ trợ làm việc với tất cả các dịch vụ tương thích với AntiGate: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, v.v.
- Khả năng cấu hình linh hoạt thời gian chờ phản hồi, các tham số captcha và thông báo cho dịch vụ giải mã về captcha bị giải sai
Biến thể sử dụng
- Nhận dạng captcha trong các công cụ cào dữ liệu tích hợp, nơi việc giải captcha là tùy chọn hoặc bắt buộc để nhận kết quả
- Nhận dạng captcha trong các công cụ cào dữ liệu JS tùy chỉnh
- Nhận dạng dữ liệu văn bản nhỏ từ hình ảnh (ví dụ: số điện thoại)
Truy vấn
Trong các truy vấn, bạn cần chỉ định liên kết đến captcha, ví dụ:
https://files.a-parser.com/img/get-captcha-image.png
Các biến thể xuất kết quả
$answer- câu trả lời của captcha$error- nếu có lỗi xảy ra, mô tả lỗi đó
Xuất văn bản đã nhận dạng
Định dạng kết quả:
$answer
Ví dụ kết quả:
332822
Các cài đặt có thể có
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Provider | AntiCaptcha | Chọn dịch vụ giải mã, tự động thay thế địa chỉ (url) chính xác của dịch vụ |
| Provider url | Tên miền của dịch vụ giải mã, cho phép ghi đè tên miền dịch vụ, có thể để trống | |
| Client key | Khóa truy cập dịch vụ | |
| HTTP errors retries | 5 | Số lần thử nhận dạng captcha khi có lỗi mạng |
| HTTP timeout | 60 | thời gian chờ phản hồi từ máy chủ tính bằng giây |
| Wait between get status | 5 | Độ trễ giữa các lần truy vấn dịch vụ antigate về trạng thái của captcha |
| Max wait time | 300 | Thời gian chờ tối đa cho captcha đã được nhận dạng |
| NO_SLOT_AVAILABLE retries | 5 | Số lần thử tải captcha lên dịch vụ anti-captcha nếu dịch vụ báo quá tải |
| NO_SLOT_AVAILABLE interval | 2 | Khoảng thời gian chờ giữa các lần thử tính bằng giây |
| Param "phrase" | 0 | 0 = giá trị mặc định (một từ). 1 = captcha có hai từ |
| Param "regsense" | 0 | 0 = giá trị mặc định (không phân biệt chữ hoa chữ thường). 1 = có phân biệt chữ hoa chữ thường |
| Param "numeric" | 0 | 0 = giá trị mặc định. 1 = captcha chỉ gồm các chữ số. 2 = Captcha không có chữ số |
| Param "calc" | 0 | 0 = giá trị mặc định. 1 = phép toán từ các chữ số trên captcha |
| Param "min_len" | 0 | 0 = giá trị mặc định. >0 = độ dài văn bản tối thiểu trên captcha mà nhân viên phải nhập |
| Param "max_len" | 0 | 0 = giá trị mặc định (không giới hạn). >0 = độ dài văn bản tối đa trên captcha mà nhân viên phải nhập |
| Param "is_russian" | 0 | 0 = giá trị mặc định. 1 = hiển thị captcha cho nhân viên có kiến thức tiếng Nga |
| Fake answer | ☐ | Câu trả lời giả, không sử dụng dịch vụ mà trả về ngay một chuỗi ngẫu nhiên làm câu trả lời, được sử dụng để kiểm tra các công cụ cào dữ liệu |
| Report bad captchas | ☐ | Nếu tùy chọn này bị tắt, sẽ tiết kiệm được thời gian kiểm tra yêu cầu về tính chính xác của captcha. Phù hợp với CapMonster và XEvil |
| Log captcha images | ☐ | Quản lý việc xuất hình ảnh captcha vào nhật ký (log) |
| Stop task on zero balance | ☑ | Dừng tác vụ nếu số dư tài khoản của dịch vụ giải mã đã hết |