Hoppa till huvudinnehåll

Util::Turnstile - igenkänning av Cloudflare Turnstile-captcha

Översikt av scrapern

Denna scraper används endast som en ansluten komponent i andra scrapers där det kan vara nödvändigt att lösa Cloudflare Turnstile-captchas, till exempel Ahrefs-scrapers, samt i anpassade JavaScript-scrapers.

Principen för denna scraper är att skicka Turnstile-data (vanligtvis sitekey och URL för sidan där Turnstile-captchan erhölls) till en lösningstjänst och få tillbaka en token bestående av siffror och bokstäver. Korrektheten i lösningen beror helt på tjänsten; som regel löser tjänsterna nästan alltid Turnstile korrekt.

Funktioner

  • Stöd för arbete med följande tjänster: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Möjlighet att ställa in väntetid för svar och fördröjning för statuskontroll
  • Möjlighet att lösa captcha utan att använda externa tjänster. För att aktivera denna funktion väljer du Auto (using browser) i Provider. En webbläsare används för lösningen, tänk på detta när du ställer in antalet trådar.

Användningsfall

  • Kringgå Cloudflare Turnstile i scrapers där det är valfritt eller obligatoriskt att lösa denna typ av captcha för att erhålla resultat

Frågor

Scrapern tar emot två typer av frågor:

  • sitekey url
  • sitekey url proxy user-agent

Parametrarna separeras med mellanslag och betyder:

  • sitekey - detta är Turnstiles sitekey
  • url - sidan där Turnstile finns
  • proxy - proxyn genom vilken Cloudflare Turnstile erhölls. Parametern ska vara i formatet login:pass@ip:port@type för proxy med autentisering eller ip:port@type för proxy utan autentisering
    • type kan vara http, https, socks4, socks5
  • user-agent - user-agent som användes när Turnstile erhölls

Exempel på resultatutdata

  • $resp - svar (token) från Cloudflare Turnstile
  • $error - om ett fel uppstod, dess beskrivning

Utmatning av Cloudflare Turnstile-token

Resultatformat:

$resp

Exempel på resultat:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Möjliga inställningar

Parametern Provider används för att välja tjänst.

ParameterStandardvärdeBeskrivning
Client keyKlientnyckel för onlinetjänster för captchalösning
Provider urlProvider-URL, gör det möjligt att åsidosätta domänen. Flera kan anges separerade med kommatecken, scrapern kommer att använda var och en av dem i slumpmässig ordning. Kan lämnas tom, scrapern använder automatiskt rätt domän beroende på vald tjänst
ProviderAntiCaptchaLösningstjänst
Wait between get status5Fördröjning mellan statuskontroller
Max wait time300Maximal väntetid för lösning
Max browser pages for Auto modeBegränsar antalet samtidigt öppna webbläsarsidor vid captchalösning om Auto (using browser) är valt i Provider