Chuyển đến nội dung chính

Util::Turnstile - nhận diện mã captcha Cloudflare Turnstile

Tổng quan về công cụ cào dữ liệu

Công cụ cào dữ liệu này chỉ được sử dụng như một thành phần kết nối trong các công cụ cào dữ liệu khác, nơi có thể cần giải mã captcha Cloudflare Turnstile, ví dụ như các công cụ cào dữ liệu Ahrefs, cũng như các công cụ cào dữ liệu JavaScript tùy chỉnh.

Nguyên lý hoạt động của công cụ cào dữ liệu này là gửi dữ liệu Turnstile (thường là sitekey và url của trang chứa captcha Turnstile) đến dịch vụ giải mã và nhận lại một mã token bao gồm chữ và số. Độ chính xác của việc giải mã hoàn toàn phụ thuộc vào dịch vụ giải mã, thông thường các dịch vụ hầu như luôn giải mã Turnstile chính xác.

Tính năng

  • Hỗ trợ làm việc với các dịch vụ: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Có khả năng cấu hình thời gian chờ phản hồi và độ trễ kiểm tra trạng thái
  • Có khả năng giải mã captcha mà không cần sử dụng dịch vụ. Để bật tính năng này, trong mục Provider cần chọn Auto (using browser). Trình duyệt được sử dụng để giải mã, hãy lưu ý điều này khi cấu hình số luồng.

Ứng dụng

  • Vượt qua Cloudflare Turnstile trong các công cụ cào dữ liệu mà việc giải mã loại captcha này là tùy chọn hoặc bắt buộc để nhận được kết quả

Truy vấn

Công cụ cào dữ liệu chấp nhận hai loại truy vấn:

  • sitekey url
  • sitekey url proxy user-agent

Các tham số được phân tách bằng dấu cách và có ý nghĩa:

  • sitekey - đây là sitekey của Turnstile
  • url - trang web nơi đặt Turnstile
  • proxy - proxy mà qua đó Cloudflare Turnstile được nhận. Tham số phải ở định dạng login:pass@ip:port@type cho proxy có xác thực hoặc ip:port@type cho proxy không xác thực
    • type có thể là http, https, socks4, socks5
  • user-agent - user-agent đã nhận Turnstile

Các ví dụ về kết quả đầu ra

  • $resp - phản hồi (token) của Cloudflare Turnstile
  • $error - nếu xảy ra lỗi, mô tả lỗi đó

Xuất token Cloudflare Turnstile

Định dạng kết quả:

$resp

Ví dụ kết quả:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Các cài đặt có thể thiết lập

Để chọn dịch vụ, hãy sử dụng tham số Provider.

Tham sốGiá trị mặc địnhMô tả
Client keyKhóa khách hàng cho các dịch vụ giải mã trực tuyến
Provider urlUrl của nhà cung cấp, cho phép ghi đè tên miền. Có thể chỉ định nhiều url cách nhau bằng dấu phẩy, công cụ cào dữ liệu sẽ sử dụng ngẫu nhiên từng url trong số đó. Có thể để trống, công cụ cào dữ liệu sẽ tự động sử dụng url cần thiết tùy thuộc vào dịch vụ giải mã đã chọn
ProviderAntiCaptchaDịch vụ giải mã
Wait between get status5Độ trễ giữa các lần nhận trạng thái
Max wait time300Thời gian chờ giải mã tối đa
Max browser pages for Auto modeGiới hạn số lượng trang trình duyệt mở đồng thời khi giải captcha, nếu trong Provider chọn Auto (using browser)