Util::Turnstile - igenkänning av Cloudflare Turnstile-captcha
Översikt av scrapern
Denna scraper används endast som en ansluten komponent i andra scrapers där det kan vara nödvändigt att lösa Cloudflare Turnstile-captchas, till exempel Ahrefs-scrapers, samt i anpassade JavaScript-scrapers.
Principen för denna scraper är att skicka Turnstile-data (vanligtvis sitekey och URL för sidan där Turnstile-captchan erhölls) till en lösningstjänst och få tillbaka en token bestående av siffror och bokstäver. Korrektheten i lösningen beror helt på tjänsten; som regel löser tjänsterna nästan alltid Turnstile korrekt.
Funktioner
- Stöd för arbete med följande tjänster: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- Möjlighet att ställa in väntetid för svar och fördröjning för statuskontroll
- Möjlighet att lösa captcha utan att använda externa tjänster. För att aktivera denna funktion väljer du
Auto (using browser)i Provider. En webbläsare används för lösningen, tänk på detta när du ställer in antalet trådar.
Användningsfall
- Kringgå Cloudflare Turnstile i scrapers där det är valfritt eller obligatoriskt att lösa denna typ av captcha för att erhålla resultat
Frågor
Scrapern tar emot två typer av frågor:
sitekeyurlsitekeyurlproxyuser-agent
Parametrarna separeras med mellanslag och betyder:
sitekey- detta är Turnstiles sitekeyurl- sidan där Turnstile finnsproxy- proxyn genom vilken Cloudflare Turnstile erhölls. Parametern ska vara i formatetlogin:pass@ip:port@typeför proxy med autentisering ellerip:port@typeför proxy utan autentisering- type kan vara
http,https,socks4,socks5
- type kan vara
user-agent- user-agent som användes när Turnstile erhölls
Exempel på resultatutdata
$resp- svar (token) från Cloudflare Turnstile$error- om ett fel uppstod, dess beskrivning
Utmatning av Cloudflare Turnstile-token
Resultatformat:
$resp
Exempel på resultat:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
Möjliga inställningar
Parametern Provider används för att välja tjänst.
anteckning
| Parameter | Standardvärde | Beskrivning |
|---|---|---|
| Client key | Klientnyckel för onlinetjänster för captchalösning | |
| Provider url | Provider-URL, gör det möjligt att åsidosätta domänen. Flera kan anges separerade med kommatecken, scrapern kommer att använda var och en av dem i slumpmässig ordning. Kan lämnas tom, scrapern använder automatiskt rätt domän beroende på vald tjänst | |
| Provider | AntiCaptcha | Lösningstjänst |
| Wait between get status | 5 | Fördröjning mellan statuskontroller |
| Max wait time | 300 | Maximal väntetid för lösning |
| Max browser pages for Auto mode | Begränsar antalet samtidigt öppna webbläsarsidor vid captchalösning om Auto (using browser) är valt i Provider |