Hoppa till huvudinnehåll

SE::Yandex::WordStat::ByRegion -

Yandex WordStat: ByRegion

Översikt av scrapern

Wordstat är en tjänst från Yandex som är utformad för att utvärdera användarintresse för olika ämnen och välja sökord för SEO-optimering och kontextuell reklam. Dessutom kan man med hjälp av Wordstat Yandex utvärdera säsongsvariationer och det geografiska beroendet för sökfrågor.

Scrapern Yandex WordStat by region stöder automatisk multiplikation av frågor, så du kan vara säker på att du får maximalt antal resultat från sökresultaten. A-Parser kan också automatiskt navigera genom relaterade frågor till ett angivet djup.

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för dataskrapning för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av frågor, ersättning av underfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga mängd resultat.

Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Konton

För att använda scrapern SE::Yandex::WordStat::ByRegionSE::Yandex::WordStat::ByRegion krävs Yandex-konton. Konton kan registreras med hjälp av scrapern SE::Yandex::RegisterSE::Yandex::Register eller genom att helt enkelt lägga till befintliga konton i filen files/SE-Yandex/accounts.txt i det format som stöds.

Alternativt kan du aktivera registrering av konton "i farten".

Insamlade data

  • Totalt antal visningar per sökfråga
  • Sökordsstatistik per regioner och städer:
  • Region/Stad
  • Antal visningar per månad
  • Regional popularitet i %

Funktioner

  • Stöd för automatisk hantering av Smart captcha och möjlighet att hantera grafisk captcha med hjälp av tjänsten AntiCaptcha eller någon annan tjänst som stöder deras API
  • Val av enhetstyp
  • Möjlighet att välja auktoriseringsmetod
  • Möjlighet att registrera konton "i farten"
  • Stöder arbete med utökat kontoformat och kan svara på hemliga frågor (om svaret finns i info). Den använder också en sparad proxy för auktorisering (om den finns i info).

Användningsfall

  • Uppskattning av trafikmängd per sökord uppdelat på regioner

Frågor

Som frågor måste du ange sökord, precis som om du skulle skriva in dem direkt i Wordstats sökformulär, till exempel:

test

Alternativ för resultatvisning

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att visa resultat i valfri form, såväl som i strukturerad form, till exempel CSV eller JSON

Standardutdata

Resultatformat:

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

Resultatet visar antal visningar per fråga, sökordsstatistik per regioner och städer, antal visningar per månad och regional popularitet:

test - Total views: 872855
Views by regions:
Moskva och Moskva oblast 147107, 85%
Centrum 194716, 77%
Nordväst 55815, 70%
Söder 31759, 67%
Volga-regionen 86006, 66%
...
Views by cities:
Tjita 2937, 113%
Sankt Petersburg 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaluga 2196, 64%
Kostroma 1166, 49%

Utdata till CSV-tabell

Resultatformat:

[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Exempel på resultat:

"test",88,"Moskva och Moskva oblast",1902795
"test",96,"Centrum",2992864
"test",95,"Nordväst",926138
"test",112,Söder,647140
"test",124,"Volga-regionen",1927873
"test",64,"Väst",60975
"test",86,"Öst",427304

Spara i SQL-format

Resultatformat:

[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]

Exempel på resultat:

INSERT INTO regions VALUES('test', '88', '1902795', 'Moskva och Moskva oblast')
INSERT INTO regions VALUES('test', '96', '2992864', 'Centrum')
INSERT INTO regions VALUES('test', '95', '926138', 'Nordväst')
INSERT INTO regions VALUES('test', '112', '647140', 'Syd')
INSERT INTO regions VALUES('test', '124', '1927873', 'Volgaregionen')
INSERT INTO regions VALUES('test', '64', '60975', 'Väst')
INSERT INTO regions VALUES('test', '86', '427304', 'Öst')
INSERT INTO regions VALUES('test', '80', '89569', 'Syd')
INSERT INTO regions VALUES('test', '75', '356560', 'Centrum')
INSERT INTO regions VALUES('test', '77', '34894', 'Norr')

Dumpa resultat till JSON

Allmänt resultatformat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;

obj.json %]

Starttext:

[

Sluttext:

]

Exempel på resultat:

[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moskva och Moskva oblast"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centrum"
},
{
"count": "926138",
"popularity": 95,
"region": "Nordväst"
},
{
"count": "647140",
"popularity": 112,
"region": "Söder"
},
{

"count": "34894",
"popularity": 77,
"region": "Norr"
},
],
"totalcount": "10837937"
}
]
tips

Se även: Resultatfilter

Möjliga inställningar

ParameterStandardvärdeBeskrivning
AntiGate presetdefaultDu måste först konfigurera scrapern Util::AntiGateUtil::AntiGate - ange din åtkomstnyckel och andra parametrar, och välj sedan den skapade förinställningen här
AntiGate preset for LogindefaultAntiGate-förinställning för inloggning. Du måste först konfigurera scrapern Util::AntiGateUtil::AntiGate med parametrar, och välj sedan den skapade förinställningen här
TypeAllVal av enhetstyp
AccountsOnly from "accounts.txt"Val av metod för att arbeta med konton: Always auto register - registrera alltid konton automatiskt "i farten", kräver att en konfigurerad förinställning väljs i parametern SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - först används befintliga konton från accounts.txt, och om de tar slut används automatisk registrering "i farten", för vilken en konfigurerad förinställning måste väljas i parametern SE::Yandex::Register preset. Only from "accounts.txt" - använd endast befintliga konton från accounts.txt, och om de tar slut - vänta den angivna tiden (parametern Wait new accounts in "accounts.txt") på att nya ska dyka upp
Wait new accounts in "accounts.txt"0Väntetid för att nya konton ska dyka upp i accounts.txt
Remove bad accountsAlways, except wrong login/passwordAutomatisk borttagning av "dåliga" konton: Always - ta alltid bort. Always, except wrong login/password - ta alltid bort, utom när Yandex meddelat att felaktigt användarnamn/lösenord angivits. Faktum är att Yandex kan ge ett sådant meddelande vid IP-blockering för ett helt fungerande konto, så man kan valfritt behålla sådana konton för återanvändning. Never - ta aldrig bort. Oavsett valt alternativ tas konton inte bort vid proxy-/webbläsarfel
SE::Yandex::Register presetdefaultVal av inställningsförinställning för SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPAuktoriseringsmetod: HTTP - snabbt, inte resurskrävande. Chrome - långsamt, resurskrävande, kan teoretiskt förlänga kontons livslängd
Chrome headlessOm alternativet är aktiverat kommer webbläsaren inte att visas
Use sessionsAnvändning av sessioner
Do not reset session if authorization passedÅterställ inte sessionen vid fel om scrapern redan är auktoriserad
Use Wordstat 2Användning av Wordstat 2
Wordstat 2 parse all table dataGör det möjligt att omedelbart ladda ner alla 2000 resultat för en fråga utan att gå igenom paginering