Passer au contenu principal

Util::AntiGate - reconnaissance de captcha via le service AntiGate

Présentation du scraper

antigate

Ce scraper est généralement utilisé comme composant intégré dans d'autres scrapers où il peut être nécessaire de résoudre des captchas sous forme d'images, par exemple : SE::YandexSE::Yandex, Check::RosKomNadzorCheck::RosKomNadzor, ainsi que dans des scrapers JavaScript personnalisés.

Le principe de fonctionnement de ce scraper consiste à envoyer l'image d'un captcha à un service de résolution et à recevoir en retour la valeur textuelle représentée sur le captcha. L'exactitude de la résolution dépend uniquement du service de résolution et parfois des paramètres du captcha.

Le processus de connexion et de configuration de ce scraper est décrit en détail dans l'article Configuration de l'Anti-captcha

Cas d'utilisation du scraper

Fonctionnalités

  • Prise en charge de tous les services compatibles AntiGate : AntiCaptcha, RuCaptcha, 2captcha, XEvil, CapMonster, CapMonster.cloud, CapSolver, captchas.io, ApiBar, etc.
  • Possibilité de configurer de manière flexible le temps d'attente de la réponse, les paramètres des captchas et d'informer le service de résolution d'un captcha mal résolu

Variantes d'utilisation

  • Reconnaissance de captchas dans les scrapers intégrés, où la résolution de captchas est optionnelle ou obligatoire pour obtenir des résultats
  • Reconnaissance de captchas dans vos propres scrapers JS
  • Reconnaissance de petites données textuelles à partir d'images (par exemple, des numéros de téléphone)

Requêtes

En tant que requêtes, il est nécessaire d'indiquer le lien vers le captcha, exemple :

https://files.a-parser.com/img/get-captcha-image.png

Variantes d'affichage des résultats

  • $answer - réponse du captcha
  • $error - si une erreur survient, sa description

Affichage du texte reconnu

Format du résultat :

$answer

Exemple de résultat :

332822

Paramètres possibles

ParamètreValeur par défautDescription
ProviderAntiCaptchaChoix du service de résolution, remplace automatiquement l'adresse correcte (url) du service
Provider urlDomaine du service de résolution, permet de redéfinir le domaine du service, peut être vide
Client keyClé d'accès au service
HTTP errors retries5Nombre de tentatives de reconnaissance du captcha en cas de pannes réseau
HTTP timeout60délai d'attente de la réponse du serveur en secondes
Wait between get status5Délai entre les interrogations du service antigate sur l'état du captcha
Max wait time300Temps d'attente maximum pour un captcha reconnu
NO_SLOT_AVAILABLE retries5Nombre de tentatives de téléchargement du captcha sur le service anti-captcha si le service signale une surcharge
NO_SLOT_AVAILABLE interval2Intervalle d'attente entre les tentatives en secondes
Param "phrase"00 = valeur par défaut (un mot). 1 = le captcha contient deux mots
Param "regsense"00 = valeur par défaut (la casse n'a pas d'importance). 1 = la casse est importante
Param "numeric"00 = valeur par défaut. 1 = le captcha ne contient que des chiffres. 2 = le captcha n'a pas de chiffres
Param "calc"00 = valeur par défaut. 1 = opération mathématique à partir de chiffres sur le captcha
Param "min_len"00 = valeur par défaut. >0 = longueur minimale du texte sur le captcha que l'opérateur doit saisir
Param "max_len"00 = valeur par défaut (illimité). >0 = longueur maximale du texte sur le captcha que l'opérateur doit saisir
Param "is_russian"00 = valeur par défaut. 1 = montrer le captcha à un opérateur ayant des connaissances en russe
Fake answerFausse réponse, n'utilise pas le service mais renvoie immédiatement une chaîne aléatoire comme réponse, utilisé pour tester les scrapers
Report bad captchasSi l'option est désactivée, cela économisera le temps passé à vérifier la requête sur l'exactitude du captcha. Pertinent pour CapMonster et XEvil
Log captcha imagesGestion de l'affichage des images de captchas dans le log
Stop task on zero balanceArrêter la tâche si le solde du service de résolution est épuisé