SE::Yandex::WordStat::ByRegion -

Présentation du scraper
Wordstat est un service de Yandex conçu pour évaluer l'intérêt des utilisateurs pour divers sujets et pour sélectionner des mots-clés pour l'optimisation SEO et la publicité contextuelle. De plus, avec Wordstat Yandex, vous pouvez évaluer la saisonnalité et la dépendance géographique des requêtes de recherche.
Le scraper Yandex WordStat by region prend en charge la multiplication automatique des requêtes, vous pouvez être sûr d'obtenir le nombre maximum de résultats de la recherche. De plus, A-Parser peut passer automatiquement par les requêtes associées jusqu'à une profondeur spécifiée.
La fonctionnalité d'A-Parser permet de sauvegarder les paramètres de collecte de données pour une utilisation ultérieure (présélections), de définir un calendrier de collecte de données et bien plus encore. Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, l'itération de combinaisons alphanumériques et de listes pour obtenir le plus grand nombre de résultats possible.
La sauvegarde des résultats est possible dans la forme et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'afficher les données dans divers formats, y compris JSON, SQL et CSV.
Comptes
Pour le fonctionnement du scraper
SE::Yandex::WordStat::ByRegion, des comptes Yandex sont nécessaires. Les comptes peuvent être enregistrés à l'aide du scraper
SE::Yandex::Register ou simplement en ajoutant des comptes existants dans le fichier files/SE-Yandex/accounts.txt au format pris en charge.
Il est également possible d'activer l'enregistrement des comptes "à la volée".
Données collectées
- Nombre total d'impressions par requête
- Statistiques des mots-clés par régions et villes :
- Région/Ville
- Nombre de vues par mois
- Popularité régionale en %
Fonctionnalités
- Prise en charge du contournement automatique de Smart captcha et possibilité de contourner le captcha graphique à l'aide du service AntiCaptcha ou de tout autre service prenant en charge leur API
- Choix du type d'appareil
- Possibilité de choisir la méthode d'authentification
- Possibilité d'enregistrer des comptes "à la volée"
- Prend en charge le travail avec le format étendu des comptes et sait répondre à la question secrète (si la réponse est dans
info). Utilise également le proxy sauvegardé pour l'authentification (s'il est présent dansinfo).
Cas d'utilisation
- Évaluation du volume de trafic par mot-clé par région
Requêtes
Comme requêtes, il est nécessaire d'indiquer des mots-clés, exactement comme s'ils étaient saisis directement dans le formulaire de recherche Wordstat, par exemple :
test
Exemples de sortie de résultats
A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous une forme arbitraire, ainsi que structurée, par exemple CSV ou JSON
Sortie par défaut
Format du résultat :
$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')
Le résultat affiche le nombre d'impressions par requête, les statistiques des mots-clés par régions et villes, le nombre de vues par mois et la popularité régionale :
test - Total views: 872855
Views by regions:
Moscou et région de Moscou 147107, 85%
Centre 194716, 77%
Nord-Ouest 55815, 70%
Sud 31759, 67%
Volga 86006, 66%
...
Views by cities:
Tchita 2937, 113%
Saint-Pétersbourg 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kalouga 2196, 64%
Kostroma 1166, 49%
Sortie dans un tableau CSV
Format du résultat :
[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]
Exemple de résultat :
"test",88,"Moscou et région de Moscou",1902795
"test",96,"Centre",2992864
"test",95,"Nord-Ouest",926138
"test",112,Sud,647140
"test",124,"Volga",1927873
"test",64,"Ouest",60975
"test",86,"Est",427304
Sauvegarde au format SQL
Format du résultat :
[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]
Exemple de résultat :
INSERT INTO regions VALUES('test', '88', '1902795', 'Moscou et région de Moscou')
INSERT INTO regions VALUES('test', '96', '2992864', 'Centre')
INSERT INTO regions VALUES('test', '95', '926138', 'Nord-Ouest')
INSERT INTO regions VALUES('test', '112', '647140', 'Sud')
INSERT INTO regions VALUES('test', '124', '1927873', 'Volga')
INSERT INTO regions VALUES('test', '64', '60975', 'Ouest')
INSERT INTO regions VALUES('test', '86', '427304', 'Est')
INSERT INTO regions VALUES('test', '80', '89569', 'Sud')
INSERT INTO regions VALUES('test', '75', '356560', 'Centre')
INSERT INTO regions VALUES('test', '77', '34894', 'Nord')
Dump des résultats en JSON
Format de sortie general:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];
FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;
obj.json %]
Texte initial:
[
Texte final:
]
Exemple de résultat :
[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moscou et région de Moscou"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centre"
},
{
"count": "926138",
"popularity": 95,
"region": "Nord-Ouest"
},
{
"count": "647140",
"popularity": 112,
"region": "Sud"
},
{
"count": "34894",
"popularity": 77,
"region": "Nord"
},
],
"totalcount": "10837937"
}
]
Voir aussi : Filtres de résultats
Paramètres possibles
| Paramètre | Valeur par défaut | Description |
|---|---|---|
| AntiGate preset | default | Il est nécessaire de configurer préalablement le scraper Util::AntiGate - indiquer votre clé d'accès et d'autres paramètres, puis choisir la présélection créée ici |
| AntiGate preset for Login | default | Présélection AntiGate pour le login. Il est nécessaire de configurer préalablement le scraper Util::AntiGate avec les paramètres, puis choisir la présélection créée ici |
| Type | All | Choix du type d'appareil |
| Accounts | Only from "accounts.txt" | Choix de la méthode de travail avec les comptes : Always auto register - toujours enregistrer automatiquement les comptes "à la volée", nécessite de choisir une présélection configurée dans le paramètre SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - les comptes existants de accounts.txt sont utilisés en premier, et s'ils s'épuisent - l'enregistrement automatique "à la volée" est utilisé, pour lequel il faut choisir une présélection configurée dans le paramètre SE::Yandex::Register preset. Only from "accounts.txt" - utiliser uniquement les comptes existants de accounts.txt, et s'ils s'épuisent - attendre le temps défini (paramètre Wait new accounts in "accounts.txt") l'apparition de nouveaux |
| Wait new accounts in "accounts.txt" | 0 | Temps d'attente pour l'apparition de nouveaux comptes dans accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Suppression automatique des "mauvais" comptes : Always - toujours supprimer. Always, except wrong login/password - supprimer toujours, sauf dans les cas où Yandex a signalé un identifiant/mot de passe incorrect. Le fait est que Yandex peut donner un tel message lors d'un bannissement d'IP pour un compte tout à fait fonctionnel, donc on peut optionnellement laisser ces comptes pour une réutilisation. Never - ne jamais supprimer. Quel que soit le choix, les comptes ne sont pas supprimés en cas d'erreurs de proxy/navigateur |
| SE::Yandex::Register preset | default | Choix de la présélection de paramètres pour SE::Yandex::Register |
| Authorization method | HTTP | Méthode d'authentification : HTTP - rapide, peu gourmand en ressources. Chrome - lent, gourmand en ressources, peut théoriquement prolonger la vie des comptes |
| Chrome headless | ☑ | Si l'option est activée, le navigateur ne sera pas affiché |
| Use sessions | ☑ | Utilisation des sessions |
| Do not reset session if authorization passed | ☑ | Ne pas réinitialiser la session en cas d'erreurs si le scraper est déjà authentifié |
| Use Wordstat 2 | ☐ | Utilisation de Wordstat 2 |
| Wordstat 2 parse all table data | ☑ | Permet de décharger immédiatement les 2000 résultats par requête sans passer par la pagination |
