Przejdź do treści głównej

SE::Yandex::WordStat::ByRegion -

Yandex WordStat: ByRegion

Przegląd scrapera

Wordstat to usługa Yandex, przeznaczona do oceny zainteresowania użytkowników różnymi tematami oraz doboru słów kluczowych dla optymalizacji SEO i reklamy kontekstowej. Ponadto, za pomocą Wordstat Yandex można ocenić sezonowość i zależność geograficzną zapytań wyszukiwania.

Scraper Yandex WordStat by region obsługuje automatyczne powielanie zapytań, dzięki czemu możesz mieć pewność, że otrzymasz maksymalną liczbę wyników z wydania. A-Parser może również automatycznie przechodzić przez powiązane zapytania na określoną głębokość.

Funkcjonalność A-Parser pozwala na zapisywanie ustawień scrapowania do późniejszego wykorzystania (presety), ustawianie harmonogramu scrapowania i wiele więcej. Możesz korzystać z automatycznego powielania zapytań, podstawiania podzapytań z plików, iteracji kombinacji alfanumerycznych i list, aby uzyskać maksymalną możliwą liczbę wyników.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala na stosowanie dodatkowej logiki do wyników i wyprowadzanie danych w różnych formatach, w tym JSON, SQL i CSV.

Konta

Do działania scrapera SE::Yandex::WordStat::ByRegionSE::Yandex::WordStat::ByRegion wymagane są konta Yandex. Konta można zarejestrować za pomocą scrapera SE::Yandex::RegisterSE::Yandex::Register lub po prostu dodać istniejące konta do pliku files/SE-Yandex/accounts.txt w obsługiwanym formacie.

Można również włączyć rejestrację kont "w locie".

Zbierane dane

  • Całkowita liczba wyświetleń dla zapytania
  • Statystyki słów kluczowych według regionów i miast:
  • Region/Miasto
  • Liczba wyświetleń miesięcznie
  • Popularność regionalna w %

Możliwości

  • Obsługa automatycznego omijania Smart captcha oraz możliwość omijania captcha graficznej za pomocą serwisu AntiCaptcha lub dowolnego innego obsługującego ich API
  • Wybór typu urządzenia
  • Możliwość wyboru metody autoryzacji
  • Możliwość rejestracji kont "w locie"
  • Obsługuje pracę z rozszerzonym formatem kont i potrafi odpowiadać na pytanie pomocnicze (jeśli odpowiedź znajduje się w info). Używa również zapisanego proxy do autoryzacji (jeśli znajduje się w info).

Warianty wykorzystania

  • Ocena ilości ruchu dla słowa kluczowego w podziale na regiony

Zapytania

Jako zapytania należy podawać słowa kluczowe, dokładnie tak samo, jak gdyby były wpisywane bezpośrednio w formularzu wyszukiwania Wordstat, na przykład:

test

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu na wyprowadzanie wyników w dowolnej formie, a także w formie ustrukturyzowanej, na przykład CSV lub JSON

Wynik domyślny

Format wyniku:

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

W wyniku wyświetlana jest liczba wyświetleń dla zapytania, statystyki słów kluczowych według regionów i miast, liczba wyświetleń miesięcznie oraz popularność regionalna:

test - Total views: 872855
Views by regions:
Moskwa i obwód moskiewski 147107, 85%
Centrum 194716, 77%
Północny Zachód 55815, 70%
Południe 31759, 67%
Nadwołże 86006, 66%
...
Views by cities:
Czyta 2937, 113%
Sankt Petersburg 35713, 73%
Biełgorod 2737, 58%
Iwanowo 1773, 55%
Kaługa 2196, 64%
Kostroma 1166, 49%

Wynik w tabeli CSV

Format wyniku:

[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Przykład wyniku:

"test",88,"Moskwa i obwód moskiewski",1902795
"test",96,"Centrum",2992864
"test",95,"Północny Zachód",926138
"test",112,Południe,647140
"test",124,"Nadwołże",1927873
"test",64,"Zachód",60975
"test",86,"Wschód",427304

Zapisywanie w formacie SQL

Format wyniku:

[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]

Przykład wyniku:

INSERT INTO regions VALUES('test', '88', '1902795', 'Moskwa i obwód moskiewski')
INSERT INTO regions VALUES('test', '96', '2992864', 'Centrum')
INSERT INTO regions VALUES('test', '95', '926138', 'Północny Zachód')
INSERT INTO regions VALUES('test', '112', '647140', 'Południe')
INSERT INTO regions VALUES('test', '124', '1927873', 'Nadwołże')
INSERT INTO regions VALUES('test', '64', '60975', 'Zachód')
INSERT INTO regions VALUES('test', '86', '427304', 'Wschód')
INSERT INTO regions VALUES('test', '80', '89569', 'Południe')
INSERT INTO regions VALUES('test', '75', '356560', 'Centrum')
INSERT INTO regions VALUES('test', '77', '34894', 'Północ')

Zrzut wyników do JSON

Ogólny format wyniku:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;

obj.json %]

Tekst początkowy:

[

Tekst końcowy:

]

Przykład wyniku:

[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moskwa i obwód moskiewski"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centrum"
},
{
"count": "926138",
"popularity": 95,
"region": "Północny Zachód"
},
{
"count": "647140",
"popularity": 112,
"region": "Południe"
},
{

"count": "34894",
"popularity": 77,
"region": "Północ"
},
],
"totalcount": "10837937"
}
]
wskazówka

Zobacz również: Filtry wyników

Możliwe ustawienia

ParametrWartość domyślnaOpis
AntiGate presetdefaultNależy wcześniej skonfigurować scraper Util::AntiGateUtil::AntiGate - podać swój klucz dostępu i inne parametry, a następnie wybrać utworzony preset tutaj
AntiGate preset for LogindefaultPreset AntiGate dla logowania. Należy wcześniej skonfigurować scraper Util::AntiGateUtil::AntiGate z parametrami, a następnie wybrać utworzony preset tutaj
TypeAllWybór typu urządzenia
AccountsOnly from "accounts.txt"Wybór metody pracy z kontami: Always auto register - zawsze automatycznie rejestruj konta "w locie", wymaga wybrania skonfigurowanego presetu w parametrze SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - najpierw używane są istniejące konta z accounts.txt, a jeśli się skończą - używana jest automatyczna rejestracja "w locie", dla której odpowiednio należy wybrać skonfigurowany preset w parametrze SE::Yandex::Register preset. Only from "accounts.txt" - używaj tylko istniejących kont z accounts.txt, a jeśli się skończą - czekaj określony czas (parametr Wait new accounts in "accounts.txt") na pojawienie się nowych
Wait new accounts in "accounts.txt"0Czas oczekiwania na pojawienie się nowych kont w accounts.txt
Remove bad accountsAlways, except wrong login/passwordAutomatyczne usuwanie "złych" kont: Always - zawsze usuwaj. Always, except wrong login/password - usuwaj zawsze, z wyjątkiem przypadków, gdy Yandex poinformował o błędnym loginie/haśle. Wynika to z faktu, że taki komunikat Yandex może wyświetlać przy banie IP dla całkowicie sprawnego konta, dlatego opcjonalnie można pozostawiać takie konta do ponownego użycia. Never - nigdy nie usuwaj. Niezależnie od wybranej opcji, przy błędach proxy/przeglądarki konta nie są usuwane
SE::Yandex::Register presetdefaultWybór presetu ustawień dla SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPMetoda autoryzacji: HTTP - szybko, małe wymagania zasobów. Chrome - wolno, duże wymagania zasobów, teoretycznie może wydłużać żywotność kont
Chrome headlessJeśli opcja jest włączona, przeglądarka nie będzie wyświetlana
Use sessionsUżycie sesji
Do not reset session if authorization passedNie resetuj sesji przy błędach, jeśli scraper już się autoryzował
Use Wordstat 2Użycie Wordstat 2
Wordstat 2 parse all table dataPozwala na natychmiastowe pobranie wszystkich 2000 wyników dla zapytania bez przechodzenia przez paginację