Ga naar de hoofdinhoud

SE::Yandex::WordStat::ByDate - Scraper voor Yandex WordStat-vertoningsstatistieken per maand of week

Yandex WordStat: ByDate

Overzicht van de scraper

Wordstat is een dienst van Yandex die is ontworpen om de interesse van gebruikers voor verschillende onderwerpen te beoordelen en trefwoorden te selecteren voor SEO-optimalisatie en contextuele reclame. Bovendien kan men met Wordstat Yandex de seizoensgebondenheid en geografische afhankelijkheid van zoekopdrachten evalueren.

De scraper Yandex WordStat by date ondersteunt automatische vermenigvuldiging van query's, zodat u er zeker van kunt zijn dat u het maximale aantal resultaten uit de zoekresultaten krijgt. Ook kan A-Parser automatisch gerelateerde zoekopdrachten volgen tot een opgegeven diepte.

De functionaliteit van A-Parser stelt u in staat om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer. U kunt automatische vermenigvuldiging van query's gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het grootst mogelijke aantal resultaten te verkrijgen.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt exporteren, waaronder JSON, SQL en CSV.

Use cases voor de scraper

Accounts

Voor de werking van de scraper SE::Yandex::WordStat::ByDateSE::Yandex::WordStat::ByDate zijn Yandex-accounts vereist. Accounts kunnen worden geregistreerd met de scraper SE::Yandex::RegisterSE::Yandex::Register of voeg eenvoudig bestaande accounts toe aan het bestand files/SE-Yandex/accounts.txt in het ondersteunde formaat.

Of u kunt accountregistratie "on-the-fly" inschakelen.

Verzamelde gegevens

  • Trefwoordstatistieken per maand of week
  • Datum
  • Absolute waarde
  • Relatieve waarde
Verzamelde gegevens

Mogelijkheden

  • Ondersteunt selectie van zoekregio (met subgroepen)
  • Mogelijkheid om meerdere regio's tegelijk te selecteren voor evaluatie
  • Ondersteuning voor het automatisch omzeilen van Smart captcha en de mogelijkheid om grafische captcha's te omzeilen met de AntiCaptcha-service of een andere service die hun API ondersteunt
  • Keuze van apparaattype
  • Mogelijkheid om de autorisatiemethode te kiezen
  • Mogelijkheid om accounts "on-the-fly" te registreren
  • Ondersteunt het werken met het uitgebreide accountformaat en kan de geheime vraag beantwoorden (als het antwoord in info staat). Gebruikt ook de opgeslagen proxy voor autorisatie (als deze in info staat).

Toepassingen

  • Schatting van de hoeveelheid verkeer per trefwoord
  • Identificatie van seizoensgebonden trefwoorden

Query's

Als query's moeten trefwoorden worden opgegeven, op dezelfde manier als wanneer ze rechtstreeks in het zoekformulier van Wordstat zouden worden ingevoerd, bijvoorbeeld:

test

Opties voor resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.

Standaard uitvoer

Resultaatformaat:

Views:\n$views.format('$date $count $relcount\n')

In het resultaat worden de trefwoordstatistieken per maand en per week weergegeven:

Monthly:  
2011-09-30 3010832 0.0008903808
2011-10-31 681432 0.0001825883
2011-11-30 628532 0.0001575008
2011-12-31 629072 0.0001495699
2012-01-31 561206 0.0001300651
2012-02-29 572039 0.0001290000
2012-03-31 614897 0.0001225754
2012-04-30 520433 0.0001185340
2012-05-31 521967 0.0001235327
2012-06-30 502568 0.0001299958
...
Weekly:
2012-09-16 118715 0.0001222877
2012-09-23 120799 0.0001211773
2012-09-30 137809 0.0001365837
2012-10-07 133929 0.0001313643
2012-10-14 140373 0.0001293922
2012-10-21 136014 0.0001242209
2012-10-28 148350 0.0001293328
2012-11-04 139556 0.0001232566
2012-11-11 154830 0.0001314057
2012-11-18 136458 0.0001147489
2012-11-25 149463 0.0001261401
2012-12-02 144724 0.0001197564
2012-12-09 149142 0.0001212195
2012-12-16 162864 0.0001298181

Uitvoer naar CSV-tabel

Resultaatformaat:

[% FOREACH i IN views;
tools.CSVline(query, i.count, i.date);
END %]

Voorbeeld van resultaat:

"test",9661734,2012-03-31
"test",8567243,2012-04-30
"test",9028986,2012-05-31
"test",6082099,2012-06-30
"test",5531950,2012-07-31
"test",5214663,2012-08-31
"test",6603865,2012-09-30
"test",9127457,2012-10-31
"test",9238652,2012-11-30

Opslaan in SQL-formaat

Resultaatformaat:

[% FOREACH i IN views;
"INSERT INTO views VALUES('" _ query _ "', '"; i.count _ "', '"; i.relcount _ "', '"; i.date _ "')\n";
END %]

Voorbeeld van resultaat:

INSERT INTO serp VALUES('test', '9661734', '0.0019259985', '2012-03-31')
INSERT INTO serp VALUES('test', '8567243', '0.0019512785', '2012-04-30')
INSERT INTO serp VALUES('test', '9028986', '0.0021368683', '2012-05-31')
INSERT INTO serp VALUES('test', '6082099', '0.0015732140', '2012-06-30')
INSERT INTO serp VALUES('test', '5531950', '0.0013160071', '2012-07-31')
INSERT INTO serp VALUES('test', '5214663', '0.0013327945', '2012-08-31')
INSERT INTO serp VALUES('test', '6603865', '0.0015936909', '2012-09-30')
INSERT INTO serp VALUES('test', '9127457', '0.0018740506', '2012-10-31')
INSERT INTO serp VALUES('test', '9238652', '0.0018308715', '2012-11-30')

Dump van resultaten naar JSON

Algemeen resultaatformaat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.views = [];

FOREACH item IN p1.views;
obj.views.push({
date = item.date
relcount = item.relcount
count = item.count
});
END;

obj.json %]

Begintekst:

[

Eindtekst:

]

Voorbeeld van resultaat:

[{
"views": [
{
"count": "9661734",
"date": "2012-03-31",
"relcount": "0.0019259985"
},
{
"count": "8567243",
"date": "2012-04-30",
"relcount": "0.0019512785"
},
{
"count": "9028986",
"date": "2012-05-31",
"relcount": "0.0021368683"
}
]
}]
tip

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
PeriodMonthlySelectie van de periode (Monthly/Weekly/Daily, Daily werkt alleen met de optie Use Wordstat 2 ingeschakeld)
Start date Aangeven vanaf welke datum gezocht moet worden. Werkt alleen met de optie Use Wordstat 2 ingeschakeld. De regels voor het opgeven van de datum moeten strikt worden gevolgd
End date Aangeven tot welke datum gezocht moet worden. Werkt alleen met de optie Use Wordstat 2 ingeschakeld. De regels voor het opgeven van de datum moeten strikt worden gevolgd
RegionAllZoekregio
AntiGate presetdefaultU moet eerst de scraper Util::AntiGateUtil::AntiGate configureren - uw toegangssleutel en andere parameters opgeven, en vervolgens de gemaakte preset hier selecteren
AntiGate preset for LogindefaultAntiGate-preset voor login. U moet eerst de scraper Util::AntiGateUtil::AntiGate configureren met parameters, en vervolgens de gemaakte preset hier selecteren
TypeAllKeuze van apparaattype
AccountsOnly from "accounts.txt"Keuze van de methode voor het werken met accounts: Always auto register - altijd automatisch accounts "on-the-fly" registreren, vereist het selecteren van een geconfigureerde preset in de parameter SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - eerst worden bestaande accounts uit accounts.txt gebruikt, en als deze opraken wordt automatische registratie "on-the-fly" gebruikt, waarvoor een geconfigureerde preset moet worden geselecteerd in de parameter SE::Yandex::Register preset. Only from "accounts.txt" - gebruik alleen bestaande accounts uit accounts.txt, en als deze opraken - wacht de opgegeven tijd (parameter Wait new accounts in "accounts.txt") op nieuwe accounts
Wait new accounts in "accounts.txt"0Wachttijd voor het verschijnen van nieuwe accounts in accounts.txt
Remove bad accountsAlways, except wrong login/passwordAutomatische verwijdering van "slechte" accounts: Always - altijd verwijderen. Always, except wrong login/password - altijd verwijderen, behalve wanneer Yandex meldt dat een onjuiste login/wachtwoord is opgegeven. Het feit is dat Yandex een dergelijke melding kan geven bij een IP-ban voor een volledig werkend account, daarom kunnen dergelijke accounts optioneel worden behouden voor hergebruik. Never - nooit verwijderen. Ongeacht de gekozen optie worden accounts niet verwijderd bij proxy-/browserfouten
SE::Yandex::Register presetdefaultSelectie van de instellingen-preset voor SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPAutorisatiemethode: HTTP - snel, weinig middelen vereist. Chrome - langzaam, veel middelen vereist, kan theoretisch de levensduur van accounts verlengen
Chrome headlessAls de optie is ingeschakeld, wordt de browser niet weergegeven
Use sessionsGebruik van sessies
Do not reset session if authorization passedSessie niet resetten bij fouten als de scraper al is geautoriseerd
Use Wordstat 2Gebruik van Wordstat 2
Wordstat 2 parse all table dataMaakt het mogelijk om direct alle 2000 resultaten per query te downloaden zonder door de paginering te gaan