Passer au contenu principal

SE::Google::Compromised - Vérification de la présence de la mention « This site may be hacked » dans Google

Présentation du scraper

Le scraper Google Compromised permet de vérifier la présence de la mention This site may be hacked dans les résultats de recherche Google. Avec le scraper Google Compromised, vous pouvez vérifier vos propres bases de données de domaines pour détecter cette mention. Pour plus de détails sur cet avertissement, consultez l'Aide Google Search.

Les fonctionnalités d'A-Parser permettent de sauvegarder les paramètres de collecte de données pour une utilisation ultérieure (présélections), de définir des calendriers de collecte et bien plus encore.

La sauvegarde des résultats est possible dans le format et la structure dont vous avez besoin, grâce au puissant moteur de gabarits intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'exporter les données dans divers formats, notamment JSON, SQL et CSV.

Données collectées

  • Vérification de la présence de la mention This site may be hacked dans Google

quelles données collecte le scraper SE::Google::Compromised

Fonctionnalités

  • Prend en charge toutes les fonctionnalités du scraper SE::GoogleSE::Google.

Cas d'utilisation

  • Vérification d'une liste de domaines pour la mention This site may be hacked dans Google
  • Surveillance de ses propres domaines

Requêtes

Vous devez indiquer l'URL du site recherché comme requête, par exemple :

http://a-parser.com/  
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/

Substitutions de requêtes

Vous pouvez utiliser les macros intégrées pour la substitution automatique de sous-requêtes à partir de fichiers. Par exemple, si nous voulons vérifier des sites par rapport à une base de mots-clés, indiquons quelques requêtes de base :

ria.ru
lenta.ru
rbc.ru
yandex.ru

Dans le format de requête, indiquons la macro de substitution de mots supplémentaires provenant du fichier Keywords.txt. Cette méthode permet de vérifier une base de sites par rapport à une base de mots-clés et d'obtenir les positions en résultat :

$query {subs:Keywords}

Cette macro créera autant de requêtes supplémentaires qu'il y en a dans le fichier pour chaque requête de recherche initiale, ce qui donnera au total [nombre de requêtes initiales (domaines)] x [nombre de requêtes dans le fichier Keywords] = [nombre total de requêtes] suite au travail de la macro.

Il est également possible de spécifier le protocole dans le format de requête pour pouvoir utiliser uniquement des domaines comme requêtes :

http://$query 

Ce format ajoutera http:// devant chaque requête.

Exemples de formats de sortie

A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarits intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous forme libre ou structurée, comme CSV ou JSON.

Export de la liste de vérification de compromission

Format du résultat :

$query: $compromised\n

Exemple de résultat affichant l'URL et la présence de la mention This site may be hacked dans Google :

http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0

Analogiquement à SE::Google.

Analogiquement à SE::Google.

Analogiquement à SE::Google.

Concurrence des mots-clés

Analogiquement à SE::Google.

Vérification de l'indexation des liens

Analogiquement à SE::Google.

Sauvegarde au format SQL

Analogiquement à SE::Google.

Dump des résultats en JSON

Analogiquement à SE::Google.

Traitement des résultats

A-Parser permet de traiter les résultats directement pendant la collecte de données. Dans cette section, nous avons listé les cas les plus populaires pour le scraper SE::Google::Compromised.

Sauvegarde des domaines avec la valeur de vérification "1"

Ajoutez un filtre et, dans la liste déroulante, sélectionnez la variable de valeur de vérification $compromised - Is site compromised. Choisissez le type : String equals. Ensuite, dans String (Chaîne), saisissez la valeur souhaitée 1. Ce filtre vous permettra de supprimer tous les résultats n'ayant pas la valeur recherchée.

Exemple de filtrage
Télécharger l'exemple

Comment importer un exemple dans A-Parser

eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
astuce

Voir aussi : Filtres de résultats

Analogiquement à SE::Google.

Analogiquement à SE::Google.

Extraction de domaines

Analogiquement à SE::Google.

Suppression des balises des ancres et snippets

Analogiquement à SE::Google.

Analogiquement à SE::Google.

Paramètres possibles

Prend en charge tous les paramètres du scraper SE::GoogleSE::Google, ainsi que de plus :

Nom du paramètreValeur par défautDescription
Pages count1Nombre de pages de résultats à scraper (de 1 à 10)