Util::Turnstile - 识别 Cloudflare Turnstile 验证码
Cloudflare Turnstile 爬虫工具概览
该爬虫工具仅作为其他爬虫工具的插入组件使用,适用于需要破解 Cloudflare Turnstile 验证码的场景,例如 Ahrefs 爬虫工具以及自定义 JavaScript 爬虫工具。
该爬虫工具的工作原理是将 Turnstile 数据(通常是 sitekey 和获取 Turnstile 验证码的页面 URL)发送到验证码识别服务,并接收由数字和字母组成的令牌(token)作为响应。识别的准确性完全取决于识别服务,通常情况下,这些服务几乎总能正确识别 Turnstile。
功能与优势
- 支持与以下服务配合使用:AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- 可配置等待响应的时间和状态检查延迟
- 支持无需外部服务即可破解验证码的功能。要启用此功能,需在 Provider 中选择
Auto (using browser)。该模式使用浏览器进行破解,请在设置多线程数量时考虑这一点。
应用场景
- 在可选或必须破解此类验证码以获取结果的爬虫工具中,绕过 Cloudflare Turnstile
查询
该爬虫工具接受两种形式的查询:
sitekeyurlsitekeyurlproxyuser-agent
参数以空格分隔,含义如下:
sitekey- Turnstile 的 sitekeyurl- Turnstile 所在的页面proxy- 获取 Cloudflare Turnstile 时使用的代理。带身份验证的代理格式应为login:pass@ip:port@type,不带身份验证的代理格式为ip:port@type- type 可以是
http,https,socks4,socks5
- type 可以是
user-agent- 获取 Turnstile 时使用的用户代理
结果输出示例
$resp- Cloudflare Turnstile 的响应(令牌)$error- 如果发生错误,则显示其描述
输出 Cloudflare Turnstile 令牌
结果格式:
$resp
结果示例:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
可能的设置
使用 Provider 参数来选择服务。
| 参数 | 默认值 | 描述 |
|---|---|---|
| Client key | 在线验证码识别服务的客户端密钥 | |
| Provider url | 提供商 URL,允许覆盖域名。可以指定多个并用逗号分隔,爬虫工具将按随机顺序使用。可以为空,爬虫工具将根据所选的识别服务自动使用所需的 URL | |
| Provider | AntiCaptcha | 验证码识别服务 |
| Wait between get status | 5 | 获取状态之间的延迟 |
| Max wait time | 300 | 等待识别的最大时间 |
| Max browser pages for Auto mode | 当 Provider 选择为 Auto (using browser) 时,限制解决验证码时同时打开的浏览器页面数量 |