Ga naar de hoofdinhoud

SE::Yandex::WordStat::ByRegion -

Yandex WordStat: ByRegion

Overzicht van de scraper

Wordstat is een dienst van Yandex die is ontworpen om de interesse van gebruikers voor verschillende onderwerpen te beoordelen en trefwoorden te selecteren voor SEO-optimalisatie en contextuele reclame. Bovendien kunt u met Wordstat Yandex de seizoensgebondenheid en geografische afhankelijkheid van zoekopdrachten evalueren.

De scraper Yandex WordStat by region ondersteunt automatische vermenigvuldiging van zoekopdrachten, zodat u er zeker van kunt zijn dat u het maximale aantal resultaten uit de zoekresultaten krijgt. Ook kan A-Parser automatisch gerelateerde zoekopdrachten volgen tot een opgegeven diepte.

De functionaliteit van A-Parser stelt u in staat om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer. U kunt automatische vermenigvuldiging van zoekopdrachten gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het grootst mogelijke aantal resultaten te verkrijgen.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Accounts

Voor de werking van de scraper SE::Yandex::WordStat::ByRegionSE::Yandex::WordStat::ByRegion zijn Yandex-accounts vereist. Accounts kunnen worden geregistreerd met de scraper SE::Yandex::RegisterSE::Yandex::Register of u kunt bestaande accounts toevoegen aan het bestand files/SE-Yandex/accounts.txt in het ondersteunde formaat.

U kunt ook registratie van accounts "on the fly" inschakelen.

Verzamelde gegevens

  • Totaal aantal vertoningen per zoekopdracht
  • Trefwoordstatistieken per regio en stad:
  • Regio/Stad
  • Aantal weergaven per maand
  • Regionale populariteit in %

Mogelijkheden

  • Ondersteuning voor het automatisch omzeilen van Smart captcha en de mogelijkheid om grafische captcha's te omzeilen met de AntiCaptcha-service of een andere service die hun API ondersteunt
  • Keuze van apparaattype
  • Mogelijkheid om de autorisatiemethode te kiezen
  • Mogelijkheid om accounts "on the fly" te registreren
  • Ondersteunt het werken met het uitgebreide accountformaat en kan de geheime vraag beantwoorden (als het antwoord in info staat). Gebruikt ook de opgeslagen proxy voor autorisatie (als deze in info staat).

Toepassingen

  • Schatting van de hoeveelheid verkeer per trefwoord per regio

Zoekopdrachten

Als zoekopdrachten moeten trefwoorden worden opgegeven, op dezelfde manier als wanneer ze rechtstreeks in het Wordstat-zoekformulier zouden worden ingevoerd, bijvoorbeeld:

test

Opties voor resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden weergegeven, evenals in een gestructureerde vorm zoals CSV of JSON

Standaard uitvoer

Resultaatformaat:

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

Het resultaat toont het aantal vertoningen per zoekopdracht, trefwoordstatistieken per regio en stad, het aantal weergaven per maand en de regionale populariteit:

test - Total views: 872855
Views by regions:
Moskou en regio Moskou 147107, 85%
Centrum 194716, 77%
Noordwest 55815, 70%
Zuid 31759, 67%
Wolga-regio 86006, 66%
...
Views by cities:
Tsjita 2937, 113%
Sint-Petersburg 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaloega 2196, 64%
Kostroma 1166, 49%

Uitvoer naar CSV-tabel

Resultaatformaat:

[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Voorbeeldresultaat:

"test",88,"Moskou en regio Moskou",1902795
"test",96,"Centrum",2992864
"test",95,"Noordwest",926138
"test",112,Zuid,647140
"test",124,"Wolga-regio",1927873
"test",64,"West",60975
"test",86,"Oost",427304

Opslaan in SQL-formaat

Resultaatformaat:

[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]

Voorbeeldresultaat:

INSERT INTO regions VALUES('test', '88', '1902795', 'Moskou en regio Moskou')
INSERT INTO regions VALUES('test', '96', '2992864', 'Centrum')
INSERT INTO regions VALUES('test', '95', '926138', 'Noordwest')
INSERT INTO regions VALUES('test', '112', '647140', 'Zuid')
INSERT INTO regions VALUES('test', '124', '1927873', 'Wolga-regio')
INSERT INTO regions VALUES('test', '64', '60975', 'West')
INSERT INTO regions VALUES('test', '86', '427304', 'Oost')
INSERT INTO regions VALUES('test', '80', '89569', 'Zuid')
INSERT INTO regions VALUES('test', '75', '356560', 'Centrum')
INSERT INTO regions VALUES('test', '77', '34894', 'Noord')

Resultaten dumpen in JSON

Algemeen resultaatformaat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;

obj.json %]

Begintekst:

[

Eindtekst:

]

Voorbeeldresultaat:

[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moskou en regio Moskou"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centrum"
},
{
"count": "926138",
"popularity": 95,
"region": "Noordwest"
},
{
"count": "647140",
"popularity": 112,
"region": "Zuid"
},
{

"count": "34894",
"popularity": 77,
"region": "Noord"
},
],
"totalcount": "10837937"
}
]
tip

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
AntiGate presetdefaultU moet eerst de scraper Util::AntiGateUtil::AntiGate configureren - geef uw toegangssleutel en andere parameters op, en selecteer vervolgens de gemaakte preset hier
AntiGate preset for LogindefaultAntiGate-preset voor inloggen. U moet eerst de scraper Util::AntiGateUtil::AntiGate configureren met parameters, en vervolgens de gemaakte preset hier selecteren
TypeAllKeuze van apparaattype
AccountsOnly from "accounts.txt"Keuze van de methode voor het werken met accounts: Always auto register - altijd automatisch accounts "on the fly" registreren, vereist het selecteren van een geconfigureerde preset in de parameter SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - eerst worden bestaande accounts uit accounts.txt gebruikt, en als deze opraken wordt automatische registratie "on the fly" gebruikt, waarvoor u de geconfigureerde preset in de parameter SE::Yandex::Register preset moet selecteren. Only from "accounts.txt" - gebruik alleen bestaande accounts uit accounts.txt, en als deze opraken - wacht de opgegeven tijd (parameter Wait new accounts in "accounts.txt") op het verschijnen van nieuwe
Wait new accounts in "accounts.txt"0Wachttijd voor het verschijnen van nieuwe accounts in accounts.txt
Remove bad accountsAlways, except wrong login/passwordAutomatisch verwijderen van "slechte" accounts: Always - altijd verwijderen. Always, except wrong login/password - altijd verwijderen, behalve wanneer Yandex meldt dat een onjuiste login/wachtwoord is opgegeven. Het feit is dat Yandex een dergelijke melding kan geven bij een IP-ban voor een volledig werkend account, daarom kunnen dergelijke accounts optioneel worden behouden voor hergebruik. Never - nooit verwijderen. Ongeacht de gekozen optie worden accounts niet verwijderd bij proxy-/browserfouten
SE::Yandex::Register presetdefaultSelectie van de instellingen-preset voor SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPAutorisatiemethode: HTTP - snel, niet veeleisend voor resources. Chrome - langzaam, veeleisend voor resources, kan theoretisch de levensduur van accounts verlengen
Chrome headlessAls deze optie is ingeschakeld, wordt de browser niet weergegeven
Use sessionsGebruik van sessies
Do not reset session if authorization passedSessie niet resetten bij fouten als de scraper al is geautoriseerd
Use Wordstat 2Gebruik van Wordstat 2
Wordstat 2 parse all table dataMaakt het mogelijk om direct alle 2000 resultaten per zoekopdracht te exporteren zonder door de paginering te gaan