Ga naar de hoofdinhoud

Util::Turnstile - herkenning van Cloudflare Turnstile-captcha's

Overzicht van de scraper

Deze scraper wordt alleen gebruikt als een plug-in component in andere scrapers waar het nodig kan zijn om Cloudflare Turnstile-captcha's op te lossen, zoals Ahrefs-scrapers, evenals in aangepaste JavaScript-scrapers.

Het werkingsprincipe van deze scraper bestaat uit het verzenden van Turnstile-gegevens (meestal de sitekey en de URL van de pagina waarop de Turnstile-captcha is ontvangen) naar een oplosservice en het ontvangen van een token bestaande uit cijfers en letters als antwoord. De nauwkeurigheid van het oplossen hangt uitsluitend af van de oplosservice; over het algemeen lossen services Turnstile bijna altijd correct op.

Mogelijkheden

  • Ondersteuning voor de volgende services: AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io
  • Mogelijkheid om de wachttijd voor antwoord en de vertraging voor statuscontrole te configureren
  • Mogelijkheid om captcha's op te lossen zonder gebruik van services. Om deze functie in te schakelen, moet in Provider de optie Auto (using browser) worden geselecteerd. Voor het oplossen wordt een browser gebruikt; houd hier rekening mee bij het instellen van het aantal threads.

Varianten van gebruik

  • Omzeilen van Cloudflare Turnstile in scrapers waarin het optioneel of verplicht is om dit type captcha op te lossen om resultaten te verkrijgen

Query's

De scraper accepteert twee soorten query's:

  • sitekey url
  • sitekey url proxy user-agent

Parameters worden gescheiden door een spatie en betekenen:

  • sitekey - dit is de Turnstile sitekey
  • url - de pagina waarop de Turnstile zich bevindt
  • proxy - de proxy waarmee de Cloudflare Turnstile is ontvangen. De parameter moet in het formaat login:pass@ip:port@type zijn voor proxy's met autorisatie of ip:port@type voor proxy's zonder autorisatie
    • type kan http, https, socks4, socks5 zijn
  • user-agent - de user-agent waarmee de Turnstile is ontvangen

Voorbeelden van resultaatweergave

  • $resp - het antwoord (token) van Cloudflare Turnstile
  • $error - als er een fout is opgetreden, de beschrijving ervan

Weergave van het Cloudflare Turnstile-token

Resultaatformaat:

$resp

Voorbeeld van resultaat:

0.uM0rQLy_vdWZNwOml8TMpvPgtXuqMs3H_2A7D5txxc27kHNFcGh2UOS1MQ82GiF3Dd6-VyOEgdBf1Ef3Q6xjwRYZH3V8YJdv4wgxfTtyH5stVsBOP6qWrE0Zu-txfDmJIJ_THkeK8wrYODLwj3p948zdiufJScERCVhsx1aPIurXAidPWhJslVutd4uTbMAvuGcYg7Nj-wwbW6VKGuofBHIx116Xt7_9eXISzWFy5se95e2FYVY4n4oGU3xSkoUnUCw0fcBMBP8Vik8Qde-qd53mc7YAGKeRKj9yV0t2erTc4i9ZeRjR22Fxm1nN_SkbdAHjj-oATJmxyfMAFoT_MEwe2WliuvuoPrkCAZYe8S0.QqD0sL8h2B_8jYaa792YPA.04643a6fbd94c593eee9770924ddefbd6d227e84dcfca973ab840728c122fc5d

Mogelijke instellingen

Gebruik de parameter Provider om de service te selecteren.

ParameterStandaardwaardeBeschrijving
Client keyClient-sleutel voor online oplosservices
Provider urlProvider-URL, hiermee kan het domein worden overschreven. Meerdere kunnen door komma's gescheiden worden opgegeven; de scraper zal elk van hen in willekeurige volgorde gebruiken. Kan leeg zijn, de scraper gebruikt automatisch de juiste afhankelijk van de geselecteerde oplosservice
ProviderAntiCaptchaOplosservice
Wait between get status5Vertraging tussen statuscontroles
Max wait time300Maximale wachttijd voor het oplossen
Max browser pages for Auto modeBeperkt het aantal gelijktijdig geopende browserpagina's bij het oplossen van de captcha als in Provider ```Auto (using browser)``` is geselecteerd