Ga naar de hoofdinhoud

Util::ReCaptcha3 - herkenning van Google ReCaptcha v3

Overzicht van de scraper

Deze scraper is ontworpen voor gebruik als een plug-in component in andere scrapers, waar het nodig kan zijn om Google ReCaptcha v3 op te lossen.

Het werkingsprincipe van deze scraper bestaat uit het verzenden van de recaptcha-gegevens (dit zijn altijd de sitekey en de URL van de pagina waarop de recaptcha is ontvangen) naar een oplosservice en het als antwoord ontvangen van een token bestaande uit cijfers en letters. De juistheid van de oplossing hangt uitsluitend af van de oplosservice; over het algemeen lossen services recaptcha's bijna altijd correct op.

Mogelijkheden

  • Ondersteuning voor de volgende services: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
  • Mogelijkheid om de wachttijd voor antwoord en de vertraging voor statuscontrole te configureren

Toepassingen

  • Herkenning van Google ReCaptcha v3 in ingebouwde scrapers, waarbij het optioneel of verplicht is om captcha's op te lossen om resultaten te verkrijgen
  • Herkenning van Google ReCaptcha v3 in eigen JS-scrapers

Query's

De scraper accepteert query's in de vorm:

  • sitekey url

Parameters worden gescheiden door een spatie en betekenen:

  • sitekey - dit is de sitekey van de recaptcha, in sommige services wordt dit websitekey genoemd. Meestal moet de sitekey uit de paginacode worden gehaald en bevindt deze zich gewoonlijk in de URL van het aangeroepen script:
https://www.google.com/recaptcha/api.js?render=SITEKEY

Ook kan de sitekey in de paginacode worden opgegeven als argument van een functie:

grecaptcha.execute(SITEKEY, {action:'verify'}).
  • url - de pagina waarop de recaptcha zich bevindt

Voorbeelden van resultaatweergave

  • $resp - het antwoord van de recaptcha
  • $error - als er een fout is opgetreden, de beschrijving ervan

Weergave van het recaptcha-token

Resultaatformaat:

$resp

Voorbeeld van resultaat:

03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw

Mogelijke instellingen

Om de gebruikte service te selecteren, wordt de parameter Provider gebruikt.

Voor online services (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) moet de parameter Client key verplicht worden ingesteld.

ParameterStandaardwaardeBeschrijving
Client keyClient key voor online oplosservices
Provider urlProvider URL, hiermee kan het domein worden overschreven. Meerdere kunnen door komma's gescheiden worden opgegeven; de scraper zal elk ervan in willekeurige volgorde gebruiken. Kan leeg zijn, de scraper gebruikt automatisch de juiste afhankelijk van de geselecteerde oplosservice
ProviderAntiCaptchaOplosservice
Wait between get status5Vertraging tussen statuscontroles
Max wait time300Maximale wachttijd voor het oplossen
minScore0.3Minimale betrouwbaarheidsscore voor het resultaat. Wordt experimenteel bepaald voor elke afzonderlijke site. Bij het aanroepen van de oplosservice bepaalt dit het filter waarmee een medewerker met de vereiste minimale score wordt geselecteerd
pageActionWaarde van de action-parameter die naar Google wordt verzonden en die de site-eigenaar vervolgens ziet bij het controleren van het token. Wordt meestal opgegeven als argument van de functie: grecaptcha.execute('sitekey', {action:'ACTION WAARDE'})
isEnterpriseGeeft aan de oplosservice door dat deze recaptcha moet worden opgelost als Recaptcha Enterprise V3. Werkt niet bij alle oplosservices