SE::Yandex::WordStat - Scraper Wordstat. Zbieranie słów kluczowych i statystyk wyszukiwań

Przegląd scrapera

Wordstat to usługa firmy Yandex, przeznaczona do oceny zainteresowania użytkowników różnymi tematami oraz doboru słów kluczowych dla optymalizacji SEO i reklamy kontekstowej. Ponadto, za pomocą Wordstat Yandex można ocenić sezonowość i zależność geograficzną zapytań wyszukiwania.

Scraper słów kluczowych Yandex WordStat obsługuje automatyczne powielanie zapytań, dzięki czemu możesz mieć pewność, że otrzymasz maksymalną liczbę wyników z wyników wyszukiwania. Ponadto A-Parser może automatycznie przechodzić przez powiązane zapytania na określoną głębokość.

Funkcjonalność A-Parser pozwala na zapisywanie ustawień scrapowania do późniejszego wykorzystania (presety), ustalanie harmonogramu scrapowania i wiele więcej. Możesz korzystać z automatycznego powielania zapytań, podstawiania podzapytań z plików, iteracji kombinacji alfanumerycznych i list, aby uzyskać maksymalną możliwą liczbę wyników podczas scrapowania Yandex Wordstat.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala na stosowanie dodatkowej logiki do wyników i wyprowadzanie danych w różnych formatach, w tym JSON, SQL i CSV.

Przejdź do DEMO Kup A-Parser Pro ($299)

Przypadki użycia scrapera

🔗 Scrapowanie Wordstat w głąb

Wykorzystanie scrapera Yandex WordStat do scrapowania w głąb.

🔗 Ocena częstotliwości według WordStat

Ocena częstotliwości według WordStat

Konta

Do działania scrapera SE::Yandex::WordStat wymagane są konta Yandex. Konta można zarejestrować za pomocą scrapera SE::Yandex::Register lub po prostu dodać istniejące konta do pliku files/SE-Yandex/accounts.txt w obsługiwanym formacie.

Można również włączyć rejestrację kont "w locie".

Aby korzystać z autoryzacji sesyjnej, ciąg danych musi być w następującym formacie: [email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}

Zbierane dane

Liczba wyświetleń dla określonego zapytania
Data aktualizacji statystyk
Lista wszystkich słów kluczowych powiązanych z podanym oraz liczba ich wyświetleń miesięcznie
Lista wszystkich dodatkowych słów kluczowych, których szukali użytkownicy, oraz liczba ich wyświetleń miesięcznie

jakie dane zbiera scraper SE::Yandex::WordStat

Możliwości

Scrapuje maksymalną liczbę wyników udostępnianą przez Wordstat - 40 stron po 50 elementów wyników
Obsługuje wybór regionu wyszukiwania (z podgrupami)
Może automatycznie podstawiać znalezione słowa kluczowe ponownie do zapytań (opcja Parse to level)
Możliwość wyboru wielu regionów jednocześnie do oceny
Wsparcie dla automatycznego omijania Smart captcha oraz możliwość omijania captcha graficznej za pomocą serwisu AntiCaptcha lub dowolnego innego obsługującego ich API
Wybór typu urządzenia
Możliwość wyboru metody autoryzacji
Możliwość rejestracji kont "w locie"
Obsługuje pracę z rozszerzonym formatem kont i potrafi odpowiadać na pytanie pomocnicze (jeśli odpowiedź znajduje się w info). Wykorzystuje również zapisane proxy do autoryzacji (jeśli znajduje się w info).

Zastosowania

Ocena ilości ruchu dla słowa kluczowego (częstotliwość)
Wyszukiwanie nowych słów kluczowych o podobnej tematyce
Budowanie dużych baz słów kluczowych o różnej tematyce
Wszelkie inne warianty zakładające scrapowanie Yandex.WordStat w tej czy innej formie

Zapytania

Jako zapytania należy podawać słowa kluczowe, dokładnie tak samo, jak gdyby były wpisywane bezpośrednio w formularzu wyszukiwania Wordstat, na przykład:

okna warszawa    
"okna warszawa"    
!okna !warszawa

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu na wyprowadzanie wyników w dowolnej formie, a także w formie ustrukturyzowanej, na przykład CSV lub JSON

Wynik domyślny

Format wyniku:

$query - $totalcount, updated: $updatedate\nkeywords:\n$keys.format('$key: $count\n')\nadditional keywords:\n$search.format('$key: $count\n')

W wyniku wyświetlane jest zapytanie źródłowe, liczba jego wyświetleń, data aktualizacji statystyk, lista powiązanych słów kluczowych i ich wyświetlenia miesięcznie, lista dodatkowych słów kluczowych i ich wyświetlenia miesięcznie:

!okna !moskwa - 10368, updated: 16/05/2013    
keywords:  
okna moskwa: 32367    
okna plastikowe moskwa: 8994    
okna pcv moskwa: 4813    
kupić okna moskwa: 2561    
okna ceny moskwa: 1706    
moskwa praca okna: 1547    
oferty pracy okna moskwa: 1187    
okna drewniane moskwa: 1087    
biuro +jednego okienka moskwa: 1021    
...  
additional keywords:  
produkcja okien pcv: 8512    
okna rehau: 15686    
okna salamander: 1576    
okna kbe: 3798    
okna kbe: 6089    
okna kve: 3227    
przeszklenia balkonów: 83216    
altany: 471213    
przeszklenia loggii: 26366    
ścianki biurowe: 18740    
montaż okien: 26223    

Wynik w tabeli CSV

Format wyniku:

[% FOREACH i IN keys;
  tools.CSVline(query, i. key, i.count);
END %]

Przykład wyniku:

scraper stron,  scraper stron, 8055
scraper stron,  darmowy scraper stron,  1122
scraper stron,  scraper oficjalna strona,   666
scraper stron,  strony scraper chmurowy,    507
scraper stron,  scraper email +ze strony,   477
scraper stron,  scraper strony pobierz, 434
scraper stron,  scraper adresów stron,  390
scraper stron,  scraper stron online,   366
scraper stron,  turbo scraper stron,    342
scraper stron,  turbo scraper oficjalna strona, 309
scraper stron,  scraper chmurowy oficjalna strona,  308
scraper stron,  scraper stron excel,    276
scraper stron,  sliza scraper strona,   259

Zapisywanie w formacie SQL

Format wyniku:

[% FOREACH i IN keys;
  "INSERT INTO keys VALUES('" _ query _ "', '";     i.key _ "', '";     i.count _ "')\n";
END %]

Przykład wyniku:

INSERT INTO serp VALUES('test', 'test', '10837937')
INSERT INTO serp VALUES('test', 'test drive', '1164338')
INSERT INTO serp VALUES('test', 'ciasto +do testu', '879980')
INSERT INTO serp VALUES('test', 'testy online', '792560')
INSERT INTO serp VALUES('test', 'test drive wideo', '550164')
INSERT INTO serp VALUES('test', 'przepis na ciasto', '484489')
INSERT INTO serp VALUES('test', 'testy +z odpowiedziami', '449401')
INSERT INTO serp VALUES('test', 'test 2014', '427602')
INSERT INTO serp VALUES('test', 'testy za darmo', '315144')
INSERT INTO serp VALUES('test', 'darmowe testy', '315096')
INSERT INTO serp VALUES('test', 'testy +dla dziewczyn', '309355')
INSERT INTO serp VALUES('test', 'testy +według tematów', '293917')
INSERT INTO serp VALUES('test', 'gry testy', '288989')

Zrzut wyników do JSON

Ogólny format wyniku:

[% IF notFirst;
  ",\n";
ELSE;
  notFirst = 1;
END;

obj = {};
obj.updatedate = p1.updatedate;
obj.totalcount = p1.totalcount;
obj.keys = [];

FOREACH item IN p1.keys;
    obj.keys.push({
        key = item.key
        count = item.count
    });
END;

obj.json %]

Tekst początkowy:

Tekst końcowy:

Przykład wyniku:

[{
    "updatedate": "12.03.2014",
    "totalcount": "10837937",
    "keys": [
        {
            "count": "10837937",
            "key": "test"
        },
        {
            "count": "1164338",
            "key": "test drive"
        },
        {
            "count": "879980",
            "key": "ciasto +do testu"
        },
        {
            "count": "792560",
            "key": "testy online"
        },
    ]
}]

wskazówka

Zobacz również: Filtry wyników

Możliwe ustawienia

notatka

Ustawienia ogólne dla wszystkich scraperów

Parametr	Wartość domyślna	Opis
Pages count	`10`	Liczba stron do scrapowania
Region	`All`	Region wyszukiwania
Remove + from keywords	`☐`	Usuń symbol plusa (+) ze znalezionych zapytań
AntiGate preset	`default`	Należy wcześniej skonfigurować scraper Util::AntiGate - podać swój klucz dostępu i inne parametry, a następnie wybrać utworzony preset tutaj
AntiGate preset for Login	`default`	Preset AntiGate dla logowania. Należy wcześniej skonfigurować scraper Util::AntiGate z parametrami, a następnie wybrać utworzony preset tutaj
Type	`All`	Wybór typu urządzenia
Accounts	`Only from "accounts.txt"`	Wybór metody pracy z kontami: `Always auto register` - zawsze automatycznie rejestruj konta "w locie", wymaga wybrania skonfigurowanego presetu w parametrze SE::Yandex::Register preset. `Auto register if no more in "accounts.txt"` - najpierw używane są istniejące konta z accounts.txt, a jeśli się skończą - używana jest automatyczna rejestracja "w locie", dla której należy wybrać skonfigurowany preset w parametrze SE::Yandex::Register preset. `Only from "accounts.txt"` - używaj tylko istniejących kont z accounts.txt, a jeśli się skończą - czekaj określony czas (parametr Wait new accounts in "accounts.txt") na pojawienie się nowych. `Only by session_id from "accounts.txt"` - autoryzacja przez ciasteczka.
Wait new accounts in "accounts.txt"	`0`	Czas oczekiwania na nowe konta w accounts.txt
Remove bad accounts	`Always, except wrong login/password`	Automatyczne usuwanie "złych" kont: `Always` - zawsze usuwaj. `Always, except wrong login/password` - usuwaj zawsze, z wyjątkiem sytuacji, gdy Yandex poinformował o błędnym loginie/haśle. Wynika to z faktu, że taki komunikat Yandex może wyświetlać przy blokadzie IP dla całkowicie sprawnego konta, dlatego opcjonalnie można zostawić takie konta do ponownego użycia. `Never` - nigdy nie usuwaj. Niezależnie od wybranej opcji, konta nie są usuwane przy błędach proxy/przeglądarki
SE::Yandex::Register preset	`default`	Wybór presetu ustawień dla SE::Yandex::Register
Authorization method	`HTTP`	Metoda autoryzacji: `HTTP` - szybko, mało wymagające zasobowo. `Chrome` - wolno, wymagające zasobowo, teoretycznie może przedłużać żywotność kont
Chrome headless	`☑`	Jeśli opcja jest włączona, przeglądarka nie będzie wyświetlana
Use sessions	`☑`	Użycie sesji
Do not reset session if authorization passed	`☑`	Nie resetuj sesji przy błędach, jeśli scraper już się autoryzował
Use Wordstat 2	`☐`	Użycie Wordstat 2
Wordstat 2 parse all table data	`☑`	Pozwala na natychmiastowe pobranie wszystkich 2000 wyników dla zapytania bez przechodzenia przez paginację

Przydatne linki

Szczegółowa analiza scrapowania częstotliwości i konkurencji słów kluczowych za pomocą scraperów SE::Yandex i SE::Yandex::WordStat.

Przegląd scrapera​

Przypadki użycia scrapera​

🔗 Scrapowanie Wordstat w głąb

🔗 Ocena częstotliwości według WordStat

Konta​

Zbierane dane​

Możliwości​

Zastosowania​

Zapytania​

Warianty wyprowadzania wyników​

Wynik domyślny​

Wynik w tabeli CSV​

Zapisywanie w formacie SQL​

Zrzut wyników do JSON​

Możliwe ustawienia​

Przydatne linki​

Przegląd scrapera

Przypadki użycia scrapera

Konta

Zbierane dane

Możliwości

Zastosowania

Zapytania

Warianty wyprowadzania wyników

Wynik domyślny

Wynik w tabeli CSV

Zapisywanie w formacie SQL

Zrzut wyników do JSON

Możliwe ustawienia

Przydatne linki