Util::ReCaptcha3 - herkenning van Google ReCaptcha v3
Overzicht van de scraper
Deze scraper is ontworpen voor gebruik als een plug-in component in andere scrapers, waar het nodig kan zijn om Google ReCaptcha v3 op te lossen.
Het werkingsprincipe van deze scraper bestaat uit het verzenden van de recaptcha-gegevens (dit zijn altijd de sitekey en de URL van de pagina waarop de recaptcha is ontvangen) naar een oplosservice en het als antwoord ontvangen van een token bestaande uit cijfers en letters. De juistheid van de oplossing hangt uitsluitend af van de oplosservice; over het algemeen lossen services recaptcha's bijna altijd correct op.
Mogelijkheden
- Ondersteuning voor de volgende services: AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, NextCaptcha
- Mogelijkheid om de wachttijd voor antwoord en de vertraging voor statuscontrole te configureren
Toepassingen
- Herkenning van Google ReCaptcha v3 in ingebouwde scrapers, waarbij het optioneel of verplicht is om captcha's op te lossen om resultaten te verkrijgen
- Herkenning van Google ReCaptcha v3 in eigen JS-scrapers
Query's
De scraper accepteert query's in de vorm:
sitekeyurl
Parameters worden gescheiden door een spatie en betekenen:
sitekey- dit is de sitekey van de recaptcha, in sommige services wordt dit websitekey genoemd. Meestal moet de sitekey uit de paginacode worden gehaald en bevindt deze zich gewoonlijk in de URL van het aangeroepen script:
https://www.google.com/recaptcha/api.js?render=SITEKEY
Ook kan de sitekey in de paginacode worden opgegeven als argument van een functie:
grecaptcha.execute(SITEKEY, {action:'verify'}).
url- de pagina waarop de recaptcha zich bevindt
Voorbeelden van resultaatweergave
$resp- het antwoord van de recaptcha$error- als er een fout is opgetreden, de beschrijving ervan
Weergave van het recaptcha-token
Resultaatformaat:
$resp
Voorbeeld van resultaat:
03AGdBq24qfVWiRMofkMHuxaaW024vkt2Oc4Nnt4WXs3PdV0fJlpDystp444u_rG8HvuJUgN3n-upnHJXeQODxHjn_X9JdRlKEzhDnatYyehxN00WDWN_37LKwdHOgER2TrdB7XBKqrz5rko_CGWea6R1Lfe3eKmkoOeHkTyn8H3ZI90wcSvZR8gSztvq5EZWpGdNgLq15w84F92-PR8S051gUH2Ls82An0N4iiAIcTFrOTQZizqfIjgVzCzqHhSaigIPGy6j8-3nt1sac7q6Xn26fKLsQzd4hZDmrlem5rNoK-IQHEb_AUJ6r4UxQZQ-z4hk9wPpzdeiCi81sxWEX5YI-cn4cWYFsoWutv_DYvZy87Iog7u1VELGWvjT3XwkY3MyDZzpUfauyCGSd5oouLDhV5YnRPfMm-gWQUSRpt28z5xbVbwGSAfmMLEpFboCgKZdUhb-IdAiKHGA4oSXB3RhOA9TQZR-ETVqyUG8A4wJEXdCvEHU7Uhw
Mogelijke instellingen
Om de gebruikte service te selecteren, wordt de parameter Provider gebruikt.
Voor online services (AntiCaptcha, RuCaptcha, 2captcha, CapMonster.cloud, CapSolver, captchas.io) moet de parameter Client key verplicht worden ingesteld.
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Client key | Client key voor online oplosservices | |
| Provider url | Provider URL, hiermee kan het domein worden overschreven. Meerdere kunnen door komma's gescheiden worden opgegeven; de scraper zal elk ervan in willekeurige volgorde gebruiken. Kan leeg zijn, de scraper gebruikt automatisch de juiste afhankelijk van de geselecteerde oplosservice | |
| Provider | AntiCaptcha | Oplosservice |
| Wait between get status | 5 | Vertraging tussen statuscontroles |
| Max wait time | 300 | Maximale wachttijd voor het oplossen |
| minScore | 0.3 | Minimale betrouwbaarheidsscore voor het resultaat. Wordt experimenteel bepaald voor elke afzonderlijke site. Bij het aanroepen van de oplosservice bepaalt dit het filter waarmee een medewerker met de vereiste minimale score wordt geselecteerd |
| pageAction | Waarde van de action-parameter die naar Google wordt verzonden en die de site-eigenaar vervolgens ziet bij het controleren van het token. Wordt meestal opgegeven als argument van de functie: grecaptcha.execute('sitekey', {action:'ACTION WAARDE'}) | |
| isEnterprise | ☐ | Geeft aan de oplosservice door dat deze recaptcha moet worden opgelost als Recaptcha Enterprise V3. Werkt niet bij alle oplosservices |