メインコンテンツへスキップ

Util::ReCaptcha2 - ReCaptchaの認識

スクレイパー概要

このスクレイパーは、Google ReCaptcha v2を解決する必要がある他のスクレイパー(例:SE::GoogleSE::GoogleSE::Google::ImagesSE::Google::ImagesSE::Google::ByImageSE::Google::ByImage)や、カスタムJavaScriptスクレイパー内でのみ、プラグインコンポーネントとして使用されます。

このスクレイパーの動作原理は、reCAPTCHAデータ(通常はsitekeyとreCAPTCHAが表示されたページのURL)を解決サービスに送信し、応答として数字と文字で構成されるトークンを受け取ることです。解決の正確性は解決サービスのみに依存しますが、通常、サービスはほぼ常にreCAPTCHAを正しく解決します。

このスクレイパーの接続と設定プロセスの詳細は、reCAPTCHAの設定の記事で説明されています。

スクレイパーのユースケース

Xevilを使用した解決の設定例

Xevilでは、APIタイプとしてAntigate (Anti-Captcha)を選択することをお勧めします。Util::ReCaptcha2Util::ReCaptcha2の設定のProvider urlには、Xevilのip:portを指定する必要があります。

Util::ReCaptcha2 スクレイパー用の Xevil での Provider url

ProviderXevil (AntiGate) を選択します:

Util::ReCaptcha2 スクレイパー用の Provider url 設定

機能

  • 以下のサービスに対応:AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • 応答待ち時間とステータス確認の遅延を設定可能

バリエーション

  • 結果を取得するためにキャプチャ解決がオプションまたは必須である内蔵スクレイパーでのreCAPTCHA認識
  • 自作のJSスクレイパーでのreCAPTCHA認識

クエリ

スクレイパーは2種類のクエリを受け付けます:

  • sitekey url
  • sitekey url proxy user-agent

パラメータはスペースで区切られ、以下の意味を持ちます:

  • sitekey - reCAPTCHAのsitekey
  • url - reCAPTCHAがあるページ
  • proxy - reCAPTCHAを取得したプロキシ。認証ありプロキシの場合は login:pass@ip:port@type、認証なしプロキシの場合は ip:port@type の形式である必要があります
    • typehttp, https, socks4, socks5 が指定可能です
  • user-agent - reCAPTCHAを取得した際のユーザーエージェント

結果出力例

  • $resp - reCAPTCHAの応答
  • $error - エラーが発生した場合、その説明

reCAPTCHAトークンの出力

結果フォーマット:

$resp

結果の例:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

設定

サービスの選択には Provider パラメータを使用します。

オンラインサービス(AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io)の場合、Client key パラメータの設定が必須です。

パラメータデフォルト値説明
Client keyオンライン解決サービス用のクライアントキー
Provider urlプロバイダーURL。ドメインを上書きできます。カンマ区切りで複数指定でき、スクレイパーはそれらをランダムに使用します。空にすることもでき、その場合スクレイパーは選択された解決サービスに応じて適切なものを自動的に使用します
ProviderAntiCaptcha解決サービス
Wait between get status5ステータス取得間の遅延
Max wait time300解決待ちの最大時間