Hoppa till huvudinnehåll

Util::ReCaptcha2 - igenkänning av reCAPTCHA

Översikt av scrapern

Denna scraper används endast som en ansluten komponent i andra scrapers där det kan vara nödvändigt att lösa Google ReCaptcha v2, till exempel: SE::GoogleSE::Google, SE::Google::ImagesSE::Google::Images, SE::Google::ByImageSE::Google::ByImage, samt i anpassade JavaScript-scrapers.

Principen för denna scraper är att skicka reCAPTCHA-data (vanligtvis sitekey och URL för sidan där reCAPTCHA erhölls) till en lösningstjänst och få tillbaka en token bestående av siffror och bokstäver. Korrektheten i lösningen beror helt på lösningstjänsten; som regel löser tjänsterna nästan alltid reCAPTCHA korrekt.

Processen för anslutning och konfiguration av denna scraper beskrivs i detalj i artikeln Inställningar för ReCaptcha

Användningsfall för scrapern

Exempel på konfiguration av lösning via Xevil

I Xevil rekommenderas att välja API-typen Antigate (Anti-Captcha). I inställningarna för Util::ReCaptcha2Util::ReCaptcha2 under Provider url måste du ange ip:port för Xevil:

Provider-URL i Xevil för scrapern Util::ReCaptcha2

Välj Xevil (AntiGate) i Provider:

Inställning av Provider-URL för scrapern Util::ReCaptcha2

Funktioner

  • Stöd för arbete med följande tjänster: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Möjlighet att konfigurera väntetid för svar och fördröjning för statuskontroll

Användningsfall

  • Igenkänning av reCAPTCHA i inbyggda scrapers, där det valfritt eller obligatoriskt krävs att lösa captchas för att få resultat
  • Igenkänning av reCAPTCHA i egna JS-scrapers

Frågor

Scrapern accepterar två typer av frågor:

  • sitekey url
  • sitekey url proxy user-agent

Parametrarna separeras med mellanslag och betyder:

  • sitekey - detta är reCAPTCHA:s sitekey
  • url - sidan där reCAPTCHA finns
  • proxy - proxyn genom vilken reCAPTCHA erhölls. Parametern ska vara i formatet login:pass@ip:port@type för proxy med auktorisering eller ip:port@type för proxy utan auktorisering
    • type kan vara http, https, socks4, socks5
  • user-agent - user-agent som reCAPTCHA erhölls med

Exempel på resultatutdata

  • $resp - svar från reCAPTCHA
  • $error - om ett fel uppstod, dess beskrivning

Utmatning av reCAPTCHA-token

Resultatformat:

$resp

Exempel på resultat:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Möjliga inställningar

Parametern Provider används för att välja tjänst.

För onlinetjänster (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) måste parametern Client key anges.

ParameterStandardvärdeBeskrivning
Client keyKlientnyckel för onlinetjänster för lösning
Provider urlProvider-URL, gör det möjligt att åsidosätta domänen. Flera kan anges separerade med kommatecken, scrapern kommer att använda var och en av dem i slumpmässig ordning. Kan vara tom, scrapern använder automatiskt den korrekta beroende på vald lösningstjänst
ProviderAntiCaptchaLösningstjänst
Wait between get status5Fördröjning mellan statuskontroller
Max wait time300Maximal väntetid för lösning