跳转到主要内容

Util::Turnstile - 识别 Cloudflare Turnstile 验证码

Cloudflare Turnstile 爬虫工具概览

该爬虫工具仅作为其他爬虫工具的插入组件使用,适用于需要破解 Cloudflare Turnstile 验证码的场景,例如 Ahrefs 爬虫工具以及自定义 JavaScript 爬虫工具。

该爬虫工具的工作原理是将 Turnstile 数据(通常是 sitekey 和获取 Turnstile 验证码的页面 URL)发送到验证码识别服务,并接收由数字和字母组成的令牌(token)作为响应。识别的准确性完全取决于识别服务,通常情况下,这些服务几乎总能正确识别 Turnstile。

功能与优势

  • 支持与以下服务配合使用:AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • 可配置等待响应的时间和状态检查延迟
  • 支持无需外部服务即可破解验证码的功能。要启用此功能,需在 Provider 中选择 Auto (using browser)。该模式使用浏览器进行破解,请在设置多线程数量时考虑这一点。

应用场景

  • 在可选或必须破解此类验证码以获取结果的爬虫工具中,绕过 Cloudflare Turnstile

查询

该爬虫工具接受两种形式的查询:

  • sitekey url
  • sitekey url proxy user-agent

参数以空格分隔,含义如下:

  • sitekey - Turnstile 的 sitekey
  • url - Turnstile 所在的页面
  • proxy - 获取 Cloudflare Turnstile 时使用的代理。带身份验证的代理格式应为 login:pass@ip:port@type,不带身份验证的代理格式为 ip:port@type
    • type 可以是 http, https, socks4, socks5
  • user-agent - 获取 Turnstile 时使用的用户代理

结果输出示例

  • $resp - Cloudflare Turnstile 的响应(令牌)
  • $error - 如果发生错误,则显示其描述

输出 Cloudflare Turnstile 令牌

结果格式:

$resp

结果示例:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

可能的设置

使用 Provider 参数来选择服务。

参数默认值描述
Client key在线验证码识别服务的客户端密钥
Provider url提供商 URL,允许覆盖域名。可以指定多个并用逗号分隔,爬虫工具将按随机顺序使用。可以为空,爬虫工具将根据所选的识别服务自动使用所需的 URL
ProviderAntiCaptcha验证码识别服务
Wait between get status5获取状态之间的延迟
Max wait time300等待识别的最大时间
Max browser pages for Auto modeProvider 选择为 Auto (using browser) 时,限制解决验证码时同时打开的浏览器页面数量