Util::ReCaptcha3 - nhận diện Google ReCaptcha v3
Tổng quan về công cụ cào dữ liệu
Công cụ cào dữ liệu này được thiết kế để sử dụng như một thành phần kết nối trong các công cụ cào dữ liệu khác, nơi có thể cần giải Google ReCaptcha v3.
Nguyên lý hoạt động của công cụ cào dữ liệu này là gửi dữ liệu reCAPTCHA (luôn bao gồm sitekey và url của trang web nhận được reCAPTCHA) đến dịch vụ giải mã và nhận lại một mã token bao gồm chữ và số. Độ chính xác của việc giải phụ thuộc hoàn toàn vào dịch vụ giải mã, thông thường các dịch vụ này hầu như luôn giải reCAPTCHA chính xác.
Tính năng
- Hỗ trợ làm việc với các dịch vụ sau: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Khả năng tùy chỉnh thời gian chờ phản hồi và độ trễ kiểm tra trạng thái
Các trường hợp sử dụng
- Nhận dạng Google ReCaptcha v3 trong các công cụ cào dữ liệu tích hợp, nơi việc giải captcha là tùy chọn hoặc bắt buộc để nhận kết quả
- Nhận dạng Google ReCaptcha v3 trong các công cụ cào dữ liệu JS tự phát triển
Truy vấn
Công cụ cào dữ liệu chấp nhận các truy vấn có dạng:
sitekeyurl
Các tham số được phân tách bằng dấu cách và có nghĩa là:
sitekey- đây là sitekey của reCAPTCHA, trong một số dịch vụ nó được gọi là websitekey. Thông thường, sitekey cần được lấy từ mã nguồn trang web và thường nằm trong URL của script được kết nối:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Ngoài ra, sitekey trong mã nguồn trang có thể được chỉ định làm đối số của hàm:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- trang web nơi chứa reCAPTCHA
Các ví dụ xuất kết quả
$resp- phản hồi của reCAPTCHA$error- nếu xảy ra lỗi, mô tả lỗi đó
Xuất token reCAPTCHA
Định dạng kết quả:
$resp
Ví dụ kết quả:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Các thiết lập có thể có
Để chọn dịch vụ sử dụng, hãy dùng tham số Provider.
Đối với các dịch vụ trực tuyến (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io), bắt buộc phải thiết lập tham số Client key.
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Client key | Khóa khách hàng cho các dịch vụ giải mã trực tuyến | |
| Provider url | URL nhà cung cấp, cho phép ghi đè tên miền. Có thể chỉ định nhiều URL cách nhau bằng dấu phẩy, công cụ cào dữ liệu sẽ sử dụng ngẫu nhiên từng URL. Có thể để trống, công cụ cào dữ liệu sẽ tự động sử dụng URL phù hợp tùy thuộc vào dịch vụ giải mã đã chọn | |
| Provider | AntiCaptcha | Dịch vụ giải mã |
| Wait between get status | 5 | Độ trễ giữa các lần kiểm tra trạng thái |
| Max wait time | 300 | Thời gian chờ giải mã tối đa |
| minScore | 0.3 | Mức độ tin cậy tối thiểu đối với kết quả. Được lựa chọn thực nghiệm cho từng trang web riêng lẻ. Khi gửi yêu cầu đến dịch vụ giải mã, nó xác định bộ lọc để chọn nhân viên có score tối thiểu cần thiết |
| pageAction | Giá trị của tham số action được gửi tới Google, và sau đó chủ sở hữu trang web sẽ thấy khi kiểm tra token. Thông thường được chỉ định làm đối số của hàm: grecaptcha.execute('sitekey', {action:'GIÁ TRỊ ACTION'}) | |
| isEnterprise | ☐ | Chỉ định cho dịch vụ giải mã rằng cần giải reCAPTCHA này dưới dạng Recaptcha Enterprise V3. Không hoạt động trên tất cả các dịch vụ giải mã |