Zum Hauptinhalt springen

SE::Yandex::WordStat - WordStat-Parser. Erfassung von Keywords und Impression-Statistiken

img

Übersicht des Parsers

Wordstat (Vordstat) ist ein Dienst von Yandex, der zur Bewertung des Nutzerinteresses an verschiedenen Themen und zur Auswahl von Schlüsselwörtern für die SEO-Optimierung und Kontextwerbung entwickelt wurde. Darüber hinaus kann man mit Wordstat Yandex die Saisonalität und geografische Abhängigkeit von Suchanfragen bewerten.

Der Yandex WordStat Keyword-Parser unterstützt die automatische Vervielfachung von Abfragen, sodass Sie sicher sein können, die maximale Anzahl an Ergebnissen aus der Ausgabe zu erhalten. Zudem kann A-Parser automatisch verwandten Abfragen bis zu einer angegebenen Tiefe folgen.

Die Funktionalität von A-Parser ermöglicht es, Datenerfassungseinstellungen für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr. Sie können die automatische Abfragevervielfachung, die Substitution von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen nutzen, um die maximal mögliche Anzahl an Ergebnissen bei der Datenerfassung von Yandex Wordstat zu erzielen.

Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank des integrierten leistungsstarken Template-Engines Template Toolkit, der es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Anwendungsbeispiele des Parsers

Accounts

Für die Arbeit des Parsers SE::Yandex::WordStatSE::Yandex::WordStat sind Yandex-Accounts erforderlich. Accounts können mit dem Parser SE::Yandex::RegisterSE::Yandex::Register registriert oder einfach vorhandene Accounts zur Datei files/SE-Yandex/accounts.txt im unterstützten Format hinzugefügt werden.

Alternativ kann die Registrierung von Accounts "on-the-fly" aktiviert werden.

Für die Arbeit mit der Autorisierung per Sitzung ist es erforderlich, dass die Datenzeile in diesem Format vorliegt: [email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}

Gesammelte Daten

  • Anzahl der Impressionen für die angegebene Abfrage
  • Datum der Statistikaktualisierung
  • Liste aller mit der angegebenen Abfrage verknüpften Keywords und deren monatliche Impressionen
  • Liste aller zusätzlichen Keywords, nach denen Nutzer gesucht haben, und deren monatliche Impressionen

Welche Daten der Scraper SE::Yandex::WordStat sammelt

Funktionen

  • Extrahiert die von Wordstat maximal ausgegebene Anzahl an Ergebnissen - 40 Seiten mit je 50 Elementen
  • Unterstützt die Auswahl der Suchregion (mit Untergruppen)
  • Kann gefundene Keywords automatisch erneut als Abfragen einsetzen (Option Parse to level)
  • Möglichkeit, mehrere Regionen gleichzeitig zur Bewertung auszuwählen
  • Unterstützung für die automatische Umgehung von Smart Captcha und die Möglichkeit, grafische Captchas mit dem AntiCaptcha-Dienst oder einer anderen unterstützten API zu umgehen
  • Auswahl des Gerätetyps
  • Möglichkeit, die Autorisierungsmethode zu wählen
  • Möglichkeit, Accounts "on-the-fly" zu registrieren
  • Unterstützt die Arbeit mit dem erweiterten Account-Format und kann Sicherheitsfragen beantworten (wenn die Antwort in info). Verwendet zudem den gespeicherten Proxy für die Autorisierung (falls in info).

Anwendungsfälle

  • Bewertung des Traffic-Volumens pro Keyword (Häufigkeit)
  • Suche nach neuen Schlüsselwörtern ähnlicher Thematik
  • Erstellung großer Keyword-Datenbanken verschiedener Themen
  • Alle anderen Varianten, die das Scraping von Yandex.WordStat in irgendeiner Form beinhalten

Abfragen

Als Abfragen müssen Schlüsselwörter angegeben werden, genau so, als ob sie direkt in das Suchformular von Wordstat eingegeben würden, zum Beispiel:

fenster moskau    
"fenster moskau"
!fenster !moskau

Beispiele für die Ergebnisausgabe

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank des integrierten Template-Engines Template Toolkit, was die Ausgabe in beliebiger Form sowie in strukturierter Form wie CSV oder JSON ermöglicht

Standardausgabe

Ergebnisformat:

$query - $totalcount, updated: $updatedate\nkeywords:\n$keys.format('$key: $count\n')\nadditional keywords:\n$search.format('$key: $count\n')

Im Ergebnis werden die ursprüngliche Abfrage, die Anzahl ihrer Impressionen, das Datum der Statistikaktualisierung, die Liste der verwandten Keywords und deren monatliche Impressionen sowie die Liste der zusätzlichen Keywords und deren monatliche Impressionen angezeigt:

!fenster !moskau - 10368, updated: 16/05/2013    
keywords:
fenster moskau: 32367
kunststofffenster moskau: 8994
pvc fenster moskau: 4813
fenster kaufen moskau: 2561
fenster preise moskau: 1706
moskau arbeit fenster: 1547
stellenangebote fenster moskau: 1187
holzfenster moskau: 1087
service +eines fensters moskau: 1021
...
additional keywords:
produktion von pvc fenstern: 8512
fenster rehau: 15686
fenster salamander: 1576
fenster kbe: 3798
fenster kbe: 6089
fenster kve: 3227
balkonverglasung: 83216
pavillons: 471213
loggiaverglasung: 26366
bürotrennwände: 18740
fenstermontage: 26223

Ausgabe in eine CSV-Tabelle

Ergebnisformat:

[% FOREACH i IN keys;
tools.CSVline(query, i. key, i.count);
END %]

Beispielergebnis:

website parser, website parser, 8055
website parser, kostenloser website parser, 1122
website parser, parser offizielle website, 666
website parser, websites cloud parser, 507
website parser, email parser +von website, 477
website parser, website parser download, 434
website parser, website adressen parser, 390
website parser, website parser online, 366
website parser, turbo website parser, 342
website parser, turbo parser offizielle website, 309
website parser, cloud parser offizielle website, 308
website parser, website parser excel, 276
website parser, sliza parser website, 259

Speichern im SQL-Format

Ergebnisformat:

[% FOREACH i IN keys;
"INSERT INTO keys VALUES('" _ query _ "', '"; i.key _ "', '"; i.count _ "')\n";
END %]

Beispielergebnis:

INSERT INTO serp VALUES('test', 'test', '10837937')
INSERT INTO serp VALUES('test', 'testdrive', '1164338')
INSERT INTO serp VALUES('test', 'teig +für test', '879980')
INSERT INTO serp VALUES('test', 'tests online', '792560')
INSERT INTO serp VALUES('test', 'testdrive video', '550164')
INSERT INTO serp VALUES('test', 'teigrezept', '484489')
INSERT INTO serp VALUES('test', 'tests +mit antworten', '449401')
INSERT INTO serp VALUES('test', 'test 2014', '427602')
INSERT INTO serp VALUES('test', 'tests kostenlos', '315144')
INSERT INTO serp VALUES('test', 'kostenlose tests', '315096')
INSERT INTO serp VALUES('test', 'tests +für mädchen', '309355')
INSERT INTO serp VALUES('test', 'tests +nach themen', '293917')
INSERT INTO serp VALUES('test', 'spiele tests', '288989')

Ergebnis-Dump in JSON

Allgemeines Ausgabeformat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.updatedate = p1.updatedate;
obj.totalcount = p1.totalcount;
obj.keys = [];

FOREACH item IN p1.keys;
obj.keys.push({
key = item.key
count = item.count
});
END;

obj.json %]

Anfangstext:

[

Endtext:

]

Beispielergebnis:

[{
"updatedate": "12.03.2014",
"totalcount": "10837937",
"keys": [
{
"count": "10837937",
"key": "test"
},
{
"count": "1164338",
"key": "testdrive"
},
{
"count": "879980",
"key": "teig +für test"
},
{
"count": "792560",
"key": "tests online"
},
]
}]
Tipp

Siehe auch: Ergebnisfilter

Mögliche Einstellungen

ParameterStandardwertBeschreibung
Pages count10Anzahl der zu scrapenden Seiten
RegionAllSuchregion
Remove + from keywordsPlus-Symbol (+) aus gefundenen Abfragen entfernen
AntiGate presetdefaultZuerst muss der Scraper Util::AntiGateUtil::AntiGate konfiguriert werden - geben Sie Ihren Zugriffsschlüssel und andere Parameter an und wählen Sie dann hier das erstellte Preset aus
AntiGate preset for LogindefaultAntiGate-Preset für den Login. Zuerst muss der Scraper Util::AntiGateUtil::AntiGate mit Parametern konfiguriert werden, und wählen Sie dann hier das erstellte Preset aus
TypeAllAuswahl des Gerätetyps
AccountsOnly from "accounts.txt"Auswahl der Methode zur Arbeit mit Accounts: Always auto register - Accounts immer automatisch "on-the-fly" registrieren, erfordert die Auswahl eines konfigurierten Presets im Parameter SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - zuerst werden vorhandene Accounts aus accounts.txt verwendet, und wenn diese aufgebraucht sind, wird die automatische Registrierung "on-the-fly" genutzt, wofür entsprechend ein konfiguriertes Preset im Parameter SE::Yandex::Register preset gewählt werden muss. Only from "accounts.txt" - nur vorhandene Accounts aus accounts.txt verwenden, und wenn diese aufgebraucht sind - die festgelegte Zeit warten (Parameter Wait new accounts in "accounts.txt"), bis neue erscheinen. Only by session_id from "accounts.txt" - Autorisierung über Cookies.
Wait new accounts in "accounts.txt"0Wartezeit auf das Erscheinen neuer Accounts in accounts.txt
Remove bad accountsAlways, except wrong login/passwordAutomatisches Löschen "schlechter" Accounts: Always - immer löschen. Always, except wrong login/password - immer löschen, außer wenn Yandex meldet, dass Login/Passwort falsch sind. Dies liegt daran, dass Yandex eine solche Meldung auch bei einer IP-Sperre für einen voll funktionsfähigen Account ausgeben kann, daher können solche Accounts optional zur Wiederverwendung behalten werden. Never - niemals löschen. Unabhängig von der gewählten Option werden Accounts bei Proxy-/Browserfehlern nicht gelöscht
SE::Yandex::Register presetdefaultAuswahl des Einstellungs-Presets für SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPAutorisierungsmethode: HTTP - schnell, ressourcensparend. Chrome - langsam, ressourcenintensiv, kann theoretisch die Lebensdauer von Accounts verlängern
Chrome headlessWenn diese Option aktiviert ist, wird der Browser nicht angezeigt
Use sessionsVerwendung von Sitzungen
Do not reset session if authorization passedSitzung bei Fehlern nicht zurücksetzen, wenn der Parser bereits autorisiert ist
Use Wordstat 2Verwendung von Wordstat 2
Wordstat 2 parse all table dataErmöglicht das sofortige Herunterladen aller 2000 Ergebnisse pro Abfrage, ohne die Paginierung zu durchlaufen