Util::Turnstile - Cloudflare Turnstileのキャプチャ認識
スクレイパーの概要
このスクレイパーは、AhrefsスクレイパーなどのCloudflare Turnstileキャプチャを解決する必要がある他のスクレイパーや、カスタムJavaScriptスクレイパーのプラグインコンポーネントとしてのみ使用されます。
このスクレイパーの動作原理は、Turnstileデータ(通常はsitekeyとキャプチャが表示されたページのURL)を解決サービスに送信し、応答として数字と文字で構成されるトークンを受け取ることです。解決の正確性は解決サービスのみに依存しますが、通常、サービスはほとんどの場合Turnstileを正しく解決します。
機能
- 以下のサービスとの連携をサポート:AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- 応答待ち時間とステータス確認の遅延を設定可能
- サービスを使用せずにキャプチャを解決する機能。この機能を有効にするには、Providerで
Auto (using browser)を選択する必要があります。解決にはブラウザが使用されるため、スレッド数を設定する際はこれを考慮してください。
ユースケース
- 結果を取得するために、このタイプのキャプチャを解決することがオプションまたは必須であるスクレイパーでのCloudflare Turnstileの回避
クエリ
スクレイパーは2種類のクエリを受け付けます:
sitekeyurlsitekeyurlproxyuser-agent
パラメータはスペースで区切られ、以下の意味を持ちます:
sitekey- Turnstileのsitekeyurl- Turnstileが配置されているページproxy- Cloudflare Turnstileを取得した際のプロキシ。認証ありプロキシの場合はlogin:pass@ip:port@type、認証なしプロキシの場合はip:port@typeの形式である必要があります- type は
http,https,socks4,socks5が指定可能です
- type は
user-agent- Turnstileを取得した際のユーザーエージェント
結果の出力例
$resp- Cloudflare Turnstileの応答(トークン)$error- エラーが発生した場合、その説明
Cloudflare Turnstileトークンの出力
結果の形式:
$resp
結果の例:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
可能な設定
サービスの選択には Provider パラメータを使用します。
| パラメータ | デフォルト値 | 説明 |
|---|---|---|
| Client key | オンライン解決サービス用のクライアントキー | |
| Provider url | プロバイダーURL。ドメインを上書きできます。カンマ区切りで複数指定でき、スクレイパーはそれらをランダムに使用します。空にすることもでき、その場合スクレイパーは選択された解決サービスに応じて適切なものを自動的に使用します | |
| Provider | AntiCaptcha | 解決サービス |
| Wait between get status | 5 | ステータス取得の間隔 |
| Max wait time | 300 | 解決までの最大待ち時間 |
| Max browser pages for Auto mode | ProviderでAuto (using browser)が選択されている場合、キャプチャ解決時に同時に開くブラウザページの数を制限します |