Util::ReCaptcha2 - ReCaptchaの認識
スクレイパー概要
このスクレイパーは、Google ReCaptcha v2を解決する必要がある他のスクレイパー(例:
SE::Google、
SE::Google::Images、
SE::Google::ByImage)や、カスタムJavaScriptスクレイパー内でのみ、プラグインコンポーネントとして使用されます。
このスクレイパーの動作原理は、reCAPTCHAデータ(通常はsitekeyとreCAPTCHAが表示されたページのURL)を解決サービスに送信し、応答として数字と文字で構成されるトークンを受け取ることです。解決の正確性は解決サービスのみに依存しますが、通常、サービスはほぼ常にreCAPTCHAを正しく解決します。
このスクレイパーの接続と設定プロセスの詳細は、reCAPTCHAの設定の記事で説明されています。
スクレイパーのユースケース
🔗 JSスクレイパーでのReCaptcha
ReCaptchaを処理するためのJSスクレイパーの例
Xevilを使用した解決の設定例
Xevilでは、APIタイプとしてAntigate (Anti-Captcha)を選択することをお勧めします。
Util::ReCaptcha2の設定のProvider urlには、Xevilのip:portを指定する必要があります。

Provider で Xevil (AntiGate) を選択します:

機能
- 以下のサービスに対応:AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- 応答待ち時間とステータス確認の遅延を設定可能
バリエーション
- 結果を取得するためにキャプチャ解決がオプションまたは必須である内蔵スクレイパーでのreCAPTCHA認識
- 自作のJSスクレイパーでのreCAPTCHA認識
クエリ
スクレイパーは2種類のクエリを受け付けます:
sitekeyurlsitekeyurlproxyuser-agent
パラメータはスペースで区切られ、以下の意味を持ちます:
sitekey- reCAPTCHAのsitekeyurl- reCAPTCHAがあるページproxy- reCAPTCHAを取得したプロキシ。認証ありプロキシの場合はlogin:pass@ip:port@type、認証なしプロキシの場合はip:port@typeの形式である必要があります- type は
http,https,socks4,socks5が指定可能です
- type は
user-agent- reCAPTCHAを取得した際のユーザーエージェント
結果出力例
$resp- reCAPTCHAの応答$error- エラーが発生した場合、その説明
reCAPTCHAトークンの出力
結果フォーマット:
$resp
結果の例:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
設定
サービスの選択には Provider パラメータを使用します。
オンラインサービス(AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io)の場合、Client key パラメータの設定が必須です。
| パラメータ | デフォルト値 | 説明 |
|---|---|---|
| Client key | オンライン解決サービス用のクライアントキー | |
| Provider url | プロバイダーURL。ドメインを上書きできます。カンマ区切りで複数指定でき、スクレイパーはそれらをランダムに使用します。空にすることもでき、その場合スクレイパーは選択された解決サービスに応じて適切なものを自動的に使用します | |
| Provider | AntiCaptcha | 解決サービス |
| Wait between get status | 5 | ステータス取得間の遅延 |
| Max wait time | 300 | 解決待ちの最大時間 |