SE::Google::Compromised - Vérification de la présence de la mention « This site may be hacked » dans Google
Présentation du scraper
Le scraper Google Compromised permet de vérifier la présence de la mention This site may be hacked dans les résultats de recherche Google. Avec le scraper Google Compromised, vous pouvez vérifier vos propres bases de données de domaines pour détecter cette mention. Pour plus de détails sur cet avertissement, consultez l'Aide Google Search.
Les fonctionnalités d'A-Parser permettent de sauvegarder les paramètres de collecte de données pour une utilisation ultérieure (présélections), de définir des calendriers de collecte et bien plus encore.
La sauvegarde des résultats est possible dans le format et la structure dont vous avez besoin, grâce au puissant moteur de gabarits intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'exporter les données dans divers formats, notamment JSON, SQL et CSV.
Données collectées
- Vérification de la présence de la mention This site may be hacked dans Google

Fonctionnalités
- Prend en charge toutes les fonctionnalités du scraper
SE::Google.
Cas d'utilisation
- Vérification d'une liste de domaines pour la mention This site may be hacked dans Google
- Surveillance de ses propres domaines
Requêtes
Vous devez indiquer l'URL du site recherché comme requête, par exemple :
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/
Substitutions de requêtes
Vous pouvez utiliser les macros intégrées pour la substitution automatique de sous-requêtes à partir de fichiers. Par exemple, si nous voulons vérifier des sites par rapport à une base de mots-clés, indiquons quelques requêtes de base :
ria.ru
lenta.ru
rbc.ru
yandex.ru
Dans le format de requête, indiquons la macro de substitution de mots supplémentaires provenant du fichier Keywords.txt. Cette méthode permet de vérifier une base de sites par rapport à une base de mots-clés et d'obtenir les positions en résultat :
$query {subs:Keywords}
Cette macro créera autant de requêtes supplémentaires qu'il y en a dans le fichier pour chaque requête de recherche initiale, ce qui donnera au total [nombre de requêtes initiales (domaines)] x [nombre de requêtes dans le fichier Keywords] = [nombre total de requêtes] suite au travail de la macro.
Il est également possible de spécifier le protocole dans le format de requête pour pouvoir utiliser uniquement des domaines comme requêtes :
http://$query
Ce format ajoutera http:// devant chaque requête.
Exemples de formats de sortie
A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarits intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous forme libre ou structurée, comme CSV ou JSON.
Export de la liste de vérification de compromission
Format du résultat :
$query: $compromised\n
Exemple de résultat affichant l'URL et la présence de la mention This site may be hacked dans Google :
http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0
Liens + ancres + snippets avec affichage de la position
Affichage des liens, ancres et snippets dans un tableau CSV
Sauvegarde des mots-clés associés
Concurrence des mots-clés
Vérification de l'indexation des liens
Sauvegarde au format SQL
Dump des résultats en JSON
Traitement des résultats
A-Parser permet de traiter les résultats directement pendant la collecte de données. Dans cette section, nous avons listé les cas les plus populaires pour le scraper SE::Google::Compromised.
Sauvegarde des domaines avec la valeur de vérification "1"
Ajoutez un filtre et, dans la liste déroulante, sélectionnez la variable de valeur de vérification $compromised - Is site compromised. Choisissez le type : String equals. Ensuite, dans String (Chaîne), saisissez la valeur souhaitée 1. Ce filtre vous permettra de supprimer tous les résultats n'ayant pas la valeur recherchée.

Télécharger l'exemple
Comment importer un exemple dans A-Parser
eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
Voir aussi : Filtres de résultats
Déduplication des liens
Déduplication des liens par domaine
Extraction de domaines
Suppression des balises des ancres et snippets
Filtrage des liens par occurrence
Paramètres possibles
Prend en charge tous les paramètres du scraper
SE::Google, ainsi que de plus :
| Nom du paramètre | Valeur par défaut | Description |
|---|---|---|
| Pages count | 1 | Nombre de pages de résultats à scraper (de 1 à 10) |