Util::Turnstile - herkenning van Cloudflare Turnstile-captcha's
Overzicht van de scraper
Deze scraper wordt alleen gebruikt als een plug-in component in andere scrapers waar het nodig kan zijn om Cloudflare Turnstile-captcha's op te lossen, zoals Ahrefs-scrapers, evenals in aangepaste JavaScript-scrapers.
Het werkingsprincipe van deze scraper bestaat uit het verzenden van Turnstile-gegevens (meestal de sitekey en de URL van de pagina waarop de Turnstile-captcha is ontvangen) naar een oplosservice en het ontvangen van een token bestaande uit cijfers en letters als antwoord. De nauwkeurigheid van het oplossen hangt uitsluitend af van de oplosservice; over het algemeen lossen services Turnstile bijna altijd correct op.
Mogelijkheden
- Ondersteuning voor de volgende services: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
- Mogelijkheid om de wachttijd voor antwoord en de vertraging voor statuscontrole te configureren
- Mogelijkheid om captcha's op te lossen zonder gebruik van services. Om deze functie in te schakelen, moet in Provider de optie
Auto (using browser)worden geselecteerd. Voor het oplossen wordt een browser gebruikt; houd hier rekening mee bij het instellen van het aantal threads.
Varianten van gebruik
- Omzeilen van Cloudflare Turnstile in scrapers waarin het optioneel of verplicht is om dit type captcha op te lossen om resultaten te verkrijgen
Query's
De scraper accepteert twee soorten query's:
sitekeyurlsitekeyurlproxyuser-agent
Parameters worden gescheiden door een spatie en betekenen:
sitekey- dit is de Turnstile sitekeyurl- de pagina waarop de Turnstile zich bevindtproxy- de proxy waarmee de Cloudflare Turnstile is ontvangen. De parameter moet in het formaatlogin:pass@ip:port@typezijn voor proxy's met autorisatie ofip:port@typevoor proxy's zonder autorisatie- type kan
http,https,socks4,socks5zijn
- type kan
user-agent- de user-agent waarmee de Turnstile is ontvangen
Voorbeelden van resultaatweergave
$resp- het antwoord (token) van Cloudflare Turnstile$error- als er een fout is opgetreden, de beschrijving ervan
Weergave van het Cloudflare Turnstile-token
Resultaatformaat:
$resp
Voorbeeld van resultaat:
0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d
Mogelijke instellingen
Gebruik de parameter Provider om de service te selecteren.
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Client key | Client-sleutel voor online oplosservices | |
| Provider url | Provider-URL, hiermee kan het domein worden overschreven. Meerdere kunnen door komma's gescheiden worden opgegeven; de scraper zal elk van hen in willekeurige volgorde gebruiken. Kan leeg zijn, de scraper gebruikt automatisch de juiste afhankelijk van de geselecteerde oplosservice | |
| Provider | AntiCaptcha | Oplosservice |
| Wait between get status | 5 | Vertraging tussen statuscontroles |
| Max wait time | 300 | Maximale wachttijd voor het oplossen |
| Max browser pages for Auto mode | Beperkt het aantal gelijktijdig geopende browserpagina's bij het oplossen van de captcha als in Provider ```Auto (using browser)``` is geselecteerd |