SE::Yandex::WordStat::ByDate - Scraper voor Yandex WordStat-vertoningsstatistieken per maand of week

Overzicht van de scraper
Wordstat is een dienst van Yandex die is ontworpen om de interesse van gebruikers voor verschillende onderwerpen te beoordelen en trefwoorden te selecteren voor SEO-optimalisatie en contextuele reclame. Bovendien kan men met Wordstat Yandex de seizoensgebondenheid en geografische afhankelijkheid van zoekopdrachten evalueren.
De scraper Yandex WordStat by date ondersteunt automatische vermenigvuldiging van query's, zodat u er zeker van kunt zijn dat u het maximale aantal resultaten uit de zoekresultaten krijgt. Ook kan A-Parser automatisch gerelateerde zoekopdrachten volgen tot een opgegeven diepte.
De functionaliteit van A-Parser stelt u in staat om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer. U kunt automatische vermenigvuldiging van query's gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het grootst mogelijke aantal resultaten te verkrijgen.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt exporteren, waaronder JSON, SQL en CSV.
Use cases voor de scraper
🔗 Automatisering Wordstat bydate
Wordt gebruikt om actuele informatie in de database op te slaan en genereert bij elke run een csv met verse gegevens
Accounts
Voor de werking van de scraper
SE::Yandex::WordStat::ByDate zijn Yandex-accounts vereist. Accounts kunnen worden geregistreerd met de scraper
SE::Yandex::Register of voeg eenvoudig bestaande accounts toe aan het bestand files/SE-Yandex/accounts.txt in het ondersteunde formaat.
Of u kunt accountregistratie "on-the-fly" inschakelen.
Verzamelde gegevens
- Trefwoordstatistieken per maand of week
- Datum
- Absolute waarde
- Relatieve waarde

Mogelijkheden
- Ondersteunt selectie van zoekregio (met subgroepen)
- Mogelijkheid om meerdere regio's tegelijk te selecteren voor evaluatie
- Ondersteuning voor het automatisch omzeilen van Smart captcha en de mogelijkheid om grafische captcha's te omzeilen met de AntiCaptcha-service of een andere service die hun API ondersteunt
- Keuze van apparaattype
- Mogelijkheid om de autorisatiemethode te kiezen
- Mogelijkheid om accounts "on-the-fly" te registreren
- Ondersteunt het werken met het uitgebreide accountformaat en kan de geheime vraag beantwoorden (als het antwoord in
infostaat). Gebruikt ook de opgeslagen proxy voor autorisatie (als deze ininfostaat).
Toepassingen
- Schatting van de hoeveelheid verkeer per trefwoord
- Identificatie van seizoensgebonden trefwoorden
Query's
Als query's moeten trefwoorden worden opgegeven, op dezelfde manier als wanneer ze rechtstreeks in het zoekformulier van Wordstat zouden worden ingevoerd, bijvoorbeeld:
test
Opties voor resultaatweergave
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.
Standaard uitvoer
Resultaatformaat:
Views:\n$views.format('$date $count $relcount\n')
In het resultaat worden de trefwoordstatistieken per maand en per week weergegeven:
Monthly:
2011-09-30 3010832 0.0008903808
2011-10-31 681432 0.0001825883
2011-11-30 628532 0.0001575008
2011-12-31 629072 0.0001495699
2012-01-31 561206 0.0001300651
2012-02-29 572039 0.0001290000
2012-03-31 614897 0.0001225754
2012-04-30 520433 0.0001185340
2012-05-31 521967 0.0001235327
2012-06-30 502568 0.0001299958
...
Weekly:
2012-09-16 118715 0.0001222877
2012-09-23 120799 0.0001211773
2012-09-30 137809 0.0001365837
2012-10-07 133929 0.0001313643
2012-10-14 140373 0.0001293922
2012-10-21 136014 0.0001242209
2012-10-28 148350 0.0001293328
2012-11-04 139556 0.0001232566
2012-11-11 154830 0.0001314057
2012-11-18 136458 0.0001147489
2012-11-25 149463 0.0001261401
2012-12-02 144724 0.0001197564
2012-12-09 149142 0.0001212195
2012-12-16 162864 0.0001298181
Uitvoer naar CSV-tabel
Resultaatformaat:
[% FOREACH i IN views;
tools.CSVline(query, i.count, i.date);
END %]
Voorbeeld van resultaat:
"test",9661734,2012-03-31
"test",8567243,2012-04-30
"test",9028986,2012-05-31
"test",6082099,2012-06-30
"test",5531950,2012-07-31
"test",5214663,2012-08-31
"test",6603865,2012-09-30
"test",9127457,2012-10-31
"test",9238652,2012-11-30
Opslaan in SQL-formaat
Resultaatformaat:
[% FOREACH i IN views;
"INSERT INTO views VALUES('" _ query _ "', '"; i.count _ "', '"; i.relcount _ "', '"; i.date _ "')\n";
END %]
Voorbeeld van resultaat:
INSERT INTO serp VALUES('test', '9661734', '0.0019259985', '2012-03-31')
INSERT INTO serp VALUES('test', '8567243', '0.0019512785', '2012-04-30')
INSERT INTO serp VALUES('test', '9028986', '0.0021368683', '2012-05-31')
INSERT INTO serp VALUES('test', '6082099', '0.0015732140', '2012-06-30')
INSERT INTO serp VALUES('test', '5531950', '0.0013160071', '2012-07-31')
INSERT INTO serp VALUES('test', '5214663', '0.0013327945', '2012-08-31')
INSERT INTO serp VALUES('test', '6603865', '0.0015936909', '2012-09-30')
INSERT INTO serp VALUES('test', '9127457', '0.0018740506', '2012-10-31')
INSERT INTO serp VALUES('test', '9238652', '0.0018308715', '2012-11-30')
Dump van resultaten naar JSON
Algemeen resultaatformaat:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.views = [];
FOREACH item IN p1.views;
obj.views.push({
date = item.date
relcount = item.relcount
count = item.count
});
END;
obj.json %]
Begintekst:
[
Eindtekst:
]
Voorbeeld van resultaat:
[{
"views": [
{
"count": "9661734",
"date": "2012-03-31",
"relcount": "0.0019259985"
},
{
"count": "8567243",
"date": "2012-04-30",
"relcount": "0.0019512785"
},
{
"count": "9028986",
"date": "2012-05-31",
"relcount": "0.0021368683"
}
]
}]
Zie ook: Resultaatfilters
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Period | Monthly | Selectie van de periode (Monthly/Weekly/Daily, Daily werkt alleen met de optie Use Wordstat 2 ingeschakeld) |
| Start date | | Aangeven vanaf welke datum gezocht moet worden. Werkt alleen met de optie Use Wordstat 2 ingeschakeld. De regels voor het opgeven van de datum moeten strikt worden gevolgd |
| End date | | Aangeven tot welke datum gezocht moet worden. Werkt alleen met de optie Use Wordstat 2 ingeschakeld. De regels voor het opgeven van de datum moeten strikt worden gevolgd |
| Region | All | Zoekregio |
| AntiGate preset | default | U moet eerst de scraper Util::AntiGate configureren - uw toegangssleutel en andere parameters opgeven, en vervolgens de gemaakte preset hier selecteren |
| AntiGate preset for Login | default | AntiGate-preset voor login. U moet eerst de scraper Util::AntiGate configureren met parameters, en vervolgens de gemaakte preset hier selecteren |
| Type | All | Keuze van apparaattype |
| Accounts | Only from "accounts.txt" | Keuze van de methode voor het werken met accounts: Always auto register - altijd automatisch accounts "on-the-fly" registreren, vereist het selecteren van een geconfigureerde preset in de parameter SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - eerst worden bestaande accounts uit accounts.txt gebruikt, en als deze opraken wordt automatische registratie "on-the-fly" gebruikt, waarvoor een geconfigureerde preset moet worden geselecteerd in de parameter SE::Yandex::Register preset. Only from "accounts.txt" - gebruik alleen bestaande accounts uit accounts.txt, en als deze opraken - wacht de opgegeven tijd (parameter Wait new accounts in "accounts.txt") op nieuwe accounts |
| Wait new accounts in "accounts.txt" | 0 | Wachttijd voor het verschijnen van nieuwe accounts in accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Automatische verwijdering van "slechte" accounts: Always - altijd verwijderen. Always, except wrong login/password - altijd verwijderen, behalve wanneer Yandex meldt dat een onjuiste login/wachtwoord is opgegeven. Het feit is dat Yandex een dergelijke melding kan geven bij een IP-ban voor een volledig werkend account, daarom kunnen dergelijke accounts optioneel worden behouden voor hergebruik. Never - nooit verwijderen. Ongeacht de gekozen optie worden accounts niet verwijderd bij proxy-/browserfouten |
| SE::Yandex::Register preset | default | Selectie van de instellingen-preset voor SE::Yandex::Register |
| Authorization method | HTTP | Autorisatiemethode: HTTP - snel, weinig middelen vereist. Chrome - langzaam, veel middelen vereist, kan theoretisch de levensduur van accounts verlengen |
| Chrome headless | ☑ | Als de optie is ingeschakeld, wordt de browser niet weergegeven |
| Use sessions | ☑ | Gebruik van sessies |
| Do not reset session if authorization passed | ☑ | Sessie niet resetten bij fouten als de scraper al is geautoriseerd |
| Use Wordstat 2 | ☐ | Gebruik van Wordstat 2 |
| Wordstat 2 parse all table data | ☑ | Maakt het mogelijk om direct alle 2000 resultaten per query te downloaden zonder door de paginering te gaan |
