Passer au contenu principal

SE::Yandex::WordStat::ByRegion -

Yandex WordStat: ByRegion

Présentation du scraper

Wordstat est un service de Yandex conçu pour évaluer l'intérêt des utilisateurs pour divers sujets et pour sélectionner des mots-clés pour l'optimisation SEO et la publicité contextuelle. De plus, avec Wordstat Yandex, vous pouvez évaluer la saisonnalité et la dépendance géographique des requêtes de recherche.

Le scraper Yandex WordStat by region prend en charge la multiplication automatique des requêtes, vous pouvez être sûr d'obtenir le nombre maximum de résultats de la recherche. De plus, A-Parser peut passer automatiquement par les requêtes associées jusqu'à une profondeur spécifiée.

La fonctionnalité d'A-Parser permet de sauvegarder les paramètres de collecte de données pour une utilisation ultérieure (présélections), de définir un calendrier de collecte de données et bien plus encore. Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, l'itération de combinaisons alphanumériques et de listes pour obtenir le plus grand nombre de résultats possible.

La sauvegarde des résultats est possible dans la forme et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'afficher les données dans divers formats, y compris JSON, SQL et CSV.

Comptes

Pour le fonctionnement du scraper SE::Yandex::WordStat::ByRegionSE::Yandex::WordStat::ByRegion, des comptes Yandex sont nécessaires. Les comptes peuvent être enregistrés à l'aide du scraper SE::Yandex::RegisterSE::Yandex::Register ou simplement en ajoutant des comptes existants dans le fichier files/SE-Yandex/accounts.txt au format pris en charge.

Il est également possible d'activer l'enregistrement des comptes "à la volée".

Données collectées

  • Nombre total d'impressions par requête
  • Statistiques des mots-clés par régions et villes :
  • Région/Ville
  • Nombre de vues par mois
  • Popularité régionale en %

Fonctionnalités

  • Prise en charge du contournement automatique de Smart captcha et possibilité de contourner le captcha graphique à l'aide du service AntiCaptcha ou de tout autre service prenant en charge leur API
  • Choix du type d'appareil
  • Possibilité de choisir la méthode d'authentification
  • Possibilité d'enregistrer des comptes "à la volée"
  • Prend en charge le travail avec le format étendu des comptes et sait répondre à la question secrète (si la réponse est dans info). Utilise également le proxy sauvegardé pour l'authentification (s'il est présent dans info).

Cas d'utilisation

  • Évaluation du volume de trafic par mot-clé par région

Requêtes

Comme requêtes, il est nécessaire d'indiquer des mots-clés, exactement comme s'ils étaient saisis directement dans le formulaire de recherche Wordstat, par exemple :

test

Exemples de sortie de résultats

A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous une forme arbitraire, ainsi que structurée, par exemple CSV ou JSON

Sortie par défaut

Format du résultat :

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

Le résultat affiche le nombre d'impressions par requête, les statistiques des mots-clés par régions et villes, le nombre de vues par mois et la popularité régionale :

test - Total views: 872855
Views by regions:
Moscou et région de Moscou 147107, 85%
Centre 194716, 77%
Nord-Ouest 55815, 70%
Sud 31759, 67%
Volga 86006, 66%
...
Views by cities:
Tchita 2937, 113%
Saint-Pétersbourg 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kalouga 2196, 64%
Kostroma 1166, 49%

Sortie dans un tableau CSV

Format du résultat :

[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Exemple de résultat :

"test",88,"Moscou et région de Moscou",1902795
"test",96,"Centre",2992864
"test",95,"Nord-Ouest",926138
"test",112,Sud,647140
"test",124,"Volga",1927873
"test",64,"Ouest",60975
"test",86,"Est",427304

Sauvegarde au format SQL

Format du résultat :

[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]

Exemple de résultat :

INSERT INTO regions VALUES('test', '88', '1902795', 'Moscou et région de Moscou')
INSERT INTO regions VALUES('test', '96', '2992864', 'Centre')
INSERT INTO regions VALUES('test', '95', '926138', 'Nord-Ouest')
INSERT INTO regions VALUES('test', '112', '647140', 'Sud')
INSERT INTO regions VALUES('test', '124', '1927873', 'Volga')
INSERT INTO regions VALUES('test', '64', '60975', 'Ouest')
INSERT INTO regions VALUES('test', '86', '427304', 'Est')
INSERT INTO regions VALUES('test', '80', '89569', 'Sud')
INSERT INTO regions VALUES('test', '75', '356560', 'Centre')
INSERT INTO regions VALUES('test', '77', '34894', 'Nord')

Dump des résultats en JSON

Format de sortie general:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;

obj.json %]

Texte initial:

[

Texte final:

]

Exemple de résultat :

[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moscou et région de Moscou"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centre"
},
{
"count": "926138",
"popularity": 95,
"region": "Nord-Ouest"
},
{
"count": "647140",
"popularity": 112,
"region": "Sud"
},
{

"count": "34894",
"popularity": 77,
"region": "Nord"
},
],
"totalcount": "10837937"
}
]
astuce

Voir aussi : Filtres de résultats

Paramètres possibles

ParamètreValeur par défautDescription
AntiGate presetdefaultIl est nécessaire de configurer préalablement le scraper Util::AntiGateUtil::AntiGate - indiquer votre clé d'accès et d'autres paramètres, puis choisir la présélection créée ici
AntiGate preset for LogindefaultPrésélection AntiGate pour le login. Il est nécessaire de configurer préalablement le scraper Util::AntiGateUtil::AntiGate avec les paramètres, puis choisir la présélection créée ici
TypeAllChoix du type d'appareil
AccountsOnly from "accounts.txt"Choix de la méthode de travail avec les comptes : Always auto register - toujours enregistrer automatiquement les comptes "à la volée", nécessite de choisir une présélection configurée dans le paramètre SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - les comptes existants de accounts.txt sont utilisés en premier, et s'ils s'épuisent - l'enregistrement automatique "à la volée" est utilisé, pour lequel il faut choisir une présélection configurée dans le paramètre SE::Yandex::Register preset. Only from "accounts.txt" - utiliser uniquement les comptes existants de accounts.txt, et s'ils s'épuisent - attendre le temps défini (paramètre Wait new accounts in "accounts.txt") l'apparition de nouveaux
Wait new accounts in "accounts.txt"0Temps d'attente pour l'apparition de nouveaux comptes dans accounts.txt
Remove bad accountsAlways, except wrong login/passwordSuppression automatique des "mauvais" comptes : Always - toujours supprimer. Always, except wrong login/password - supprimer toujours, sauf dans les cas où Yandex a signalé un identifiant/mot de passe incorrect. Le fait est que Yandex peut donner un tel message lors d'un bannissement d'IP pour un compte tout à fait fonctionnel, donc on peut optionnellement laisser ces comptes pour une réutilisation. Never - ne jamais supprimer. Quel que soit le choix, les comptes ne sont pas supprimés en cas d'erreurs de proxy/navigateur
SE::Yandex::Register presetdefaultChoix de la présélection de paramètres pour SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPMéthode d'authentification : HTTP - rapide, peu gourmand en ressources. Chrome - lent, gourmand en ressources, peut théoriquement prolonger la vie des comptes
Chrome headlessSi l'option est activée, le navigateur ne sera pas affiché
Use sessionsUtilisation des sessions
Do not reset session if authorization passedNe pas réinitialiser la session en cas d'erreurs si le scraper est déjà authentifié
Use Wordstat 2Utilisation de Wordstat 2
Wordstat 2 parse all table dataPermet de décharger immédiatement les 2000 résultats par requête sans passer par la pagination