Util::hCaptcha - giải mã hCaptcha
Tổng quan về công cụ cào dữ liệu
Công cụ cào dữ liệu này chỉ được sử dụng như một thành phần kết nối trong các công cụ cào dữ liệu khác, nơi có thể cần giải hCaptcha, cũng như trong các công cụ cào dữ liệu JavaScript tùy chỉnh.
Nguyên lý hoạt động của công cụ cào dữ liệu này là gửi dữ liệu hCaptcha (thường là sitekey và url của trang chứa hCaptcha) đến dịch vụ giải mã và nhận lại một mã token bao gồm chữ và số. Độ chính xác của việc giải mã phụ thuộc hoàn toàn vào dịch vụ giải mã, thông thường các dịch vụ hầu như luôn giải hCaptcha chính xác.
TODO: (tiếp theo) Mô tả cách kết nối/sử dụng và/hoặc cung cấp liên kết đến ví dụ
Tính năng
- Hỗ trợ làm việc với các dịch vụ sau: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io, XEvil, NextCaptcha
- Có khả năng cấu hình thời gian chờ phản hồi và độ trễ kiểm tra trạng thái
Ứng dụng
- Nhận dạng hCaptcha trong các công cụ cào dữ liệu mà việc giải hCaptcha là tùy chọn hoặc bắt buộc để nhận kết quả
Truy vấn
Công cụ cào dữ liệu chấp nhận hai loại truy vấn:
sitekeyurlsitekeyurlproxyuser-agent
Các tham số được phân tách bằng dấu cách và có ý nghĩa như sau:
sitekey- đây là sitekey của hCaptchaurl- trang web chứa hCaptchaproxy- proxy mà qua đó hCaptcha được nhận. Tham số phải ở định dạnglogin:pass@ip:port@typecho proxy có xác thực hoặcip:port@typecho proxy không có xác thực- type có thể là
http,https,socks4,socks5
- type có thể là
user-agent- user-agent đã được sử dụng để nhận hCaptcha
Các ví dụ về kết quả đầu ra
$resp- phản hồi (token) hCaptcha$error- nếu xảy ra lỗi, mô tả lỗi đó
Xuất token hCaptcha
Định dạng kết quả:
$resp
Ví dụ kết quả:
P0_eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJwYXNza2V5IjoiVXJ3bllsN0VIeGxsTTA2Nm5LVTl3VFQzY3dFdmJTTVpreGZnUGM5YlNjaFZCaE1JL0l5MnR2VjN6TjlVQUM4cjEyOWlFaHZrUkg4VnV5Y3JwUW1wRjFFZ0wwZk92VjFuRjlyV1dmUlhSYjRFaHdvekw5RitaNXdlenBHR1FRQkgzdWF5dCtYWnJSM2d2Mjh6WXhmeTdLaGlCUjFDdDRLVG9tQ1RYVm90S3dsdTJHOW8xQm5XZy9jT0E1WGd1OUc1bGNBaFJMNVVRNGt4cm4rZ2hkTTlIdEJ3SU4xcTcyZnNtbGxGenN4UE40OGtwRFVBUXhydnVMcVlaTDA2SmozWWZNWWp0WUo5Qmo0RXZJcTFqWUZyMkRsQzJWOVBVdVN2WUcvSVZURXJHaWFSZ0tBMnNuRlRXekcvV0FoK2YwU0YyUWJlVnQ2RnpoTmhValVZSmxsUVVuc1d5Y2libEZ2Ynp3ZkwzUHFqQ2Z0UnZtUFFKbE1EYjk5VVYzUUN0a2tBbHJ1bFVyNVJoVDhrckQwSkY3SkZzSU1MbUw3aXBmMkF0T1B4ZDQ1eS9UTlBrbG9vZGRQajlOUlYxeGZYWGNoQklobEcwRDR5UVNlZGw5VDBKTzZVREI1T3VCMTEzakRwUzFUMGcrbFJIRDN0RnNtRStjRms3bmZ6TTBRZzZRYWtJQWhZZkpJcEV6MldTTkFLVnpYcjZBRG5xZ3Jmb2FXTWdMR2xuRWJMMGcxRTN2SHNqbzhZNTk3ek9jTWhUdXpqSEk2RElIWmgwYWxYV3paKzduRjZscHl5KzNHTUovTXJYOHlpT2toS3dsSUtrWHpMSnUrT2wzMjQzQW1VMzEzc0hVUk1zRUszSDJHM1dIeUpOWk55OXFyZVk1NVg2cWFja25DSFozNStVWk5rV21UOStjdXZyNG95MDZ0Q1dGZjhLbjdrTVVXM25odHF5L3F6dEN2YjZ6RDdEN05BczI3RlFKU3IrTlJmNkh4aHBJK29QR0QvWnhXV1dVSlZhT3Rvb3NQbFZPdzdKakVQM1NMUHZ4VzhncElUeTlKc3MvWVE3aG43TGVxSDYyQ2RFWE1WdEYxRmZyU3FBT3VobjVwRnV6MmlLM1FLTy9lZGFJNXBpd05OWkg2cTk1WjVMTXBzNkJFZE1qaVBPUENsazl3OUpaeTJZUklxU1hVUUxvWUpyT0tFYlJHaEU0RkpkTTlYTk1FMWJHdVRkbWZ1WkxuZmwwTVF6R0EyU3lwSDQ0NDcwcjRPT3hSY2JGT3ZqcmZ6dzdHcHpxaWcxMVREcWQxQllrOEQ4WDNtaVZlblF2VzNIZUFjWWtyQ2tlRDBGUXJzM3kreVVoWE9mM3BFWUNLcWhtdHpYZ2NZMVBlVHF5Zit5Mms0SEdMaUhGN1V3MkNlc05KY3dDMkU1WVNWUW9QbjZaYWUzZWxyWDVFUWRkSnNiTS9STllPZ3RZOThwbmdaK2ZkdEw0MXRVRThnY3VaQ0tDdXVyU1l2SmVLM3g5YkxOU2E4a0ZGdlZDUzVYbkQ1Q0FENm5GS3M5WWhsSEFZZmE4UjJmK1FkWk9LS3dQRWNDbFNzaVErdjJqczRKcXJjKzlVTjhLbjRHbGpBenRDS2JWbE5SOFEwcjNqT0g5SzdBSS93bEFUNVFIVWgyQ2I1aE93TkpXTEdXQlgzd1VkZFNUOVh0RWsrTzlDclFFRnV1RDZKaDQvUUdXMHBiSE9pSzVwQmRFdnFrRngzUlpDcXZES1dTaUJlZUZuME4xNWlmeDJ5SkUzZFdrTk5GVzVTaUZ1UktRWlVER3NsNzYxSzZiTVJPalQ5Ujc5bnBldC8xUThEN2Y4aEZhenBBekhlT2gxNHVONGExUUhOYlNwWXphT3JVSEhIQ0lCUHRCQVVFZFhuQWZIdmV6OXIrSnZONWtzVXJFVE1jNk41N2FmMFUvR3pOY2F4bVBRNUJJNGRxdTl4YmNDZ3hFYlpmc0VURGhxbjBDdGNGT21MQ1NUdEdLQ2dGTDhLSDRxZmtJd2NReENaZ1RLcHo2dVFqUEN0RmphL0pDU2RYcVZ2dWJlYm5BMzk0bFVZeG05YkFiQVdSZXZDaFB2R0NnUXczZWNNalVUczYwNVYyMS9BR2o2NndDU09IN3hkY09KQmdVVzVWNTZDMEFNUTVCQWZRZTdFOHo0eTBtb0srbXVrVmgrRzk5b0tZcm8vckJLdFdoVGthc1dtbU42d3IwcVhaVHBrWGJ5a29PdnZOMWZpaGFZR0J0OXlTSlpYZWowWHBiTGpOY2plSHpBVzI4dldNb0NIZmVCcmc2bjJqVU5xQnZDSitOSUZ0eUlqQjBCMmZ0MjdDVWI2ZzlRV0IzWVNZeVZzbG9nbm1DbzFwem5pQzZqaTRTMkVxbWpTMldtRVJ0am4ranA3NEZQSVlORkw4b3BpSUp1bnhwY2ZtM0dkL3RWY0lFeFpYVlZkTUVIV3llUHhGdzBTdVNld0RseCtaamJpc2RMQXBsd2RYalZqZ0g3cE5VTGxVbXREalRBakV0bFlYVmI4YUl3NEI0bk1uTGJQb0hXeVY4RUJjMWo4ZGdnOTU5Mk01OUk0NFBoMUFTTjZVZz09TnNTUFo4czYxdEwreTh2YyIsImV4cCI6MTY0MzE4NDg4MSwic2hhcmRfaWQiOjgyMDc4NjA4NiwicGQiOjB9.V7DPQWNQkZBS_g2OX0B64zFnrHqnPMmGKv44vLW5N5g
Các cài đặt có thể
Để chọn dịch vụ, hãy sử dụng tham số Provider.
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Client key | Khóa khách hàng cho các dịch vụ giải mã trực tuyến | |
| Provider url | Url của nhà cung cấp, cho phép ghi đè tên miền. Có thể chỉ định nhiều url cách nhau bằng dấu phẩy, công cụ cào dữ liệu sẽ sử dụng ngẫu nhiên từng url. Có thể để trống, công cụ cào dữ liệu sẽ tự động sử dụng url phù hợp tùy thuộc vào dịch vụ giải mã đã chọn | |
| Provider | AntiCaptcha | Dịch vụ giải mã |
| Wait between get status | 5 | Độ trễ giữa các lần kiểm tra trạng thái |
| Max wait time | 300 | Thời gian chờ giải mã tối đa |