SE::Google - Scraper wyników wyszukiwania Google

Przegląd scrapera

Scraper wyników wyszukiwania Google jest jednym z najbardziej pożądanych, dzięki niemu będziesz mógł otrzymywać ogromne bazy linków, gotowych do dalszego wykorzystania. Możesz używać zapytań w takiej samej formie, w jakiej wpisujesz je w Google, wliczając w to operatory wyszukiwania (inurl, intitle itp.).

Scraper Google obsługuje automatyczne rozmnażanie zapytań, dzięki czemu możesz być pewien, że otrzymasz maksymalną liczbę wyników z wyszukiwarki. Ponadto A-Parser może automatycznie przechodzić po powiązanych zapytaniach na określoną głębokość. Dzięki wielowątkowej pracy A-Parser, prędkość przetwarzania zapytań może osiągać 3000-7000 zapytań na minutę, co średnio pozwala na uzyskanie do 500 000 linków na minutę.

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania do dalszego wykorzystania (presety), ustalać harmonogram scrapowania i wiele więcej. Możesz korzystać z automatycznego rozmnażania zapytań, podstawiania podzapytań z plików, generowania kombinacji alfanumerycznych i list w celu uzyskania maksymalnej możliwej liczby wyników.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala na stosowanie dodatkowej logiki do wyników i wyprowadzanie danych w różnych formatach, w tym JSON, SQL i CSV.

Przejdź do DEMO Kup A-Parser Pro ($299)

Przypadki użycia scrapera

🔗 Scrapowanie domen

Scrapowanie domen tematycznych według frazy kluczowej z Google i pobieranie różnych parametrów domen

🔗 Scrapowanie Google News

Ten preset scrapuje wiadomości Google według zapytania wyszukiwania i zbiera daty tych wiadomości

🔗 Sprawdzanie indeksacji

Preset sprawdza indeksację stron witryny w Google, przechodząc przez listę podanych linków

🔗 Ocena konkurencji

Preset określa konkurencję w wyszukiwarce Google według słów kluczowych

🔗 Scrapowanie wyników top 3

Preset zapisuje pierwsze trzy snippety z wyników wyszukiwania Google

🔗 Pytania i odpowiedzi

Scraper zbierający pytania i odpowiedzi z sekcji People Also Ask

Zbierane dane

Linki, anchory i snippety z wyników wyszukiwania, a także datę ze snippetu (jeśli jest dostępna)
- Zbierane są również informacje o flagach każdego wyniku, obecnie obsługiwane są flagi: Date, AMP, Image Preview, Video, Rich snippet, Featured snippet
Obecność i zawartość bloków reklamowych, a także ich pozycję na stronie
Liczbę wyników dla zapytania (konkurencja)
Listę powiązanych słów kluczowych (Related keywords)
Obecność dodatkowych bloków na stronie: karuzela produktów, wideo itp.
Scraper zbiera również takie dodatkowe dane:
- Obecność literówki w zapytaniu i poprawione zapytanie
- Lokalizację geograficzną określoną przez Google
- Obecność stron AMP
- Listę People also ask: pytania, odpowiedzi, linki do źródeł, ich anchory i linki do mediów (włączane osobną opcją Parse People also ask)
- Odpowiedź AI (AI overview), jej typ oraz listę źródeł

Możliwości

Scraper wyszukiwarki Google posiada wiele możliwości i ustawień:

obsługa wszystkich operatorów wyszukiwania Google (site:, inurl: itp.)
określenie rozmiaru wyników (10, 20, 30, 50 lub 100 wyników) oraz określenie liczby stron (od 1 do 10), przy maksymalnych ustawieniach Google podaje od 300 do 500 wyników na jedno zapytanie, dzięki rozmnażaniu zapytań A-Parser łatwo omija to ograniczenie
możliwość automatycznego przechodzenia po powiązanych słowach kluczowych
określenie języka i kraju wyników, możliwość wyboru lokalnej domeny Google, a także języka interfejsu wyników
możliwość wskazania geolokalizacji, co pozwala na uzyskanie precyzyjnych lokalnych wyników dla dowolnego miejsca na świecie
wybór między widokiem desktop a mobilnym
możliwość wyboru typu wyników, oprócz głównych wyników organicznych scraper Google może zbierać wyniki wiadomości, książek lub wideo
w razie potrzeby można podłączyć automatyczne rozpoznawanie ReCaptcha2 poprzez serwisy rozpoznawania lub przez XEvil/CapMonster
obsługuje określenie czasu publikacji wyników (za cały czas lub za określony interwał od 24 godzin do roku)
możliwość wyłączenia filtra Google ukrywającego podobne wyniki (filter=)
możliwość określenia, czy scrapować wyniki, jeśli Google informuje, że dla danego zapytania nic nie znaleziono i proponuje wyniki dla podobnego zapytania
możliwość ustawienia liczby People also ask, które scraper powinien zebrać, klikając w głąb każdego pytania
możliwość zbierania tagów

Na bazie scrapera Google działają następujące scrapery:

SE::Google::Position - określanie pozycji dowolnych witryn w wynikach wyszukiwania dla listy zapytań
SE::Google::Compromised - sprawdza domeny pod kątem bezpieczeństwa z punktu widzenia Google, potrafi identyfikować witryny zhakowane i phishingowe
SE::Google::TrustCheck - sprawdza Trust (zaufanie) Google do witryny

Warianty użycia

Zbieranie baz linków - dla XRumer, AllSubmitter, GSA Ranker itp.
Pełny zrzut SERP, zawierający linki, anchory, snippety, bloki reklamowe i inne informacje, pozwala na przeprowadzenie głębokiej analizy dla specjalistów SEO i marketerów
Ocena konkurencji dla słów kluczowych
Ocena konkurencji w wynikach PPC (reklamowych)
Wyszukiwanie backlinków i wzmianek o stronach
Sprawdzanie indeksacji stron
Wyszukiwanie podatnych stron
Wszelkie inne warianty zakładające pozyskiwanie wyników wyszukiwania dla nieograniczonej liczby zapytań

Zapytania

Jako zapytania należy podawać frazy wyszukiwania dokładnie tak samo, jak gdyby były wpisywane bezpośrednio w formularzu wyszukiwania Google, na przykład:

zakup auta
okna w warszawie
site:https://lenta.ru
inurl:guestbook

Podstawienia zapytań

Możesz używać wbudowanych makr do rozmnażania zapytań, na przykład chcemy uzyskać bardzo dużą bazę forów, podajmy kilka głównych zapytań w różnych językach:

forum
forum
foro
论坛

W formacie zapytań wskażemy generowanie znaków od a do zzzz, ta metoda pozwala na maksymalną rotację wyników wyszukiwania i uzyskiwanie wielu nowych unikalnych wyników:

$query {az:a:zzzz}

To makro utworzy 475254 dodatkowych zapytań dla każdego bazowego zapytania, co łącznie da 4 x 475254 = 1901016 zapytań wyszukiwania, liczba imponująca, ale nie stanowi to żadnego problemu dla A-Parser. Przy prędkości 2000 zapytań na minutę takie zadanie zostanie przetworzone w zaledwie 16 godzin.

Użycie operatorów

Możesz używać operatorów wyszukiwania w formacie zapytania, dzięki czemu zostaną one automatycznie dodane do każdego zapytania z Twojej listy:

inurl:$query

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu na wyprowadzanie wyników w dowolnej formie, a także w formie strukturalnej, na przykład CSV lub JSON

Eksport listy linków

Format wyniku:

$serp.format('$link\n')

Przykład wyniku:

https://www.weforum.org/open-forum/
https://www.weforum.org/about/world-economic-forum/
https://www.merriam-webster.com/dictionary/forum
https://en.wikipedia.org/wiki/Forum
https://dictionary.cambridge.org/dictionary/english/forum
https://www.collinsdictionary.com/dictionary/english/forum
https://www.linkedin.com/company/world-economic-forum
https://docs.moodle.org/en/Forum_activity
https://wordpress.org/support/forums/
https://www.facebook.com/worldeconomicforum/
...

Linki + anchory + snippety z wyprowadzeniem pozycji

Format wyniku:

[% FOREACH item IN serp;    loop.count _ ' - ' _ item.link _ ' - ' _ item.anchor _ ' - ' _ item.snippet _ "\n"; END %]

Przykład wyniku:

- https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC - Forum — Wikipedia - <em>Fórum</em> (łac. forum — arch. przedsionek grobowca; plac w tłoczni dla winogron podlegających obróbce; plac targowy, rynek miejski;&nbsp;...
- https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC_(%D0%BC%D0%B5%D1%80%D0%BE%D0%BF%D1%80%D0%B8%D1%8F%D1%82%D0%B8%D0%B5) - Forum (wydarzenie) — Wikipedia - <em>Forum</em> — wydarzenie organizowane w celu określenia lub rozwiązania jakich-<wbr>kolwiek w wystarczającym stopniu globalnych problemów. Pojęcie to spotyka się w&nbsp;...
- https://support.google.com/googleplay/community?hl=ru - Witamy na forum pomocy społeczności ... - Witamy na forum pomocy <em>forum</em> społeczności Google Play. Polecane wpisy. Zobacz wszystkie ciekawe wpisy &middot; Potrzebujesz pomocy z grą?
- https://support.google.com/mail/community?hl=en - Gmail Community - Google Support - Welcome to the Gmail Help Community &middot; Featured posts &middot; Categories.
- https://www.weforum.org/ - The World Economic Forum - The World Economic Forum is an independent international organization committed to improving the state of the world by engaging business, political, academic&nbsp;...
- https://www.kunena.org/ - Home - Kunena - To Speak! Next Generation Forum ... - Kunena! - To Speak! Next Generation Forum Component for Joomla.
- https://forum.adguard.com/index.php - AdGuard Forum - <em>Forum</em> beta testerów. Tutaj piszemy raporty o błędach wersji beta. Wątki: 355. Wiadomości: 11.6K. Subfora: Komentarze do wydań wersji beta&nbsp;...
- https://www.sofiaforum.bg/ - Sofia Security Forum: Platforma do dyskusji ... - Sofia <em>Security Forum</em>  / Sofia Security Forum.
- https://forum.keenetic.net/ - Forums - Keenetic Community - Keenetic fan club. A place to meet software developers, get the latest updates, and share experience.
- https://forum.euroaion.com/ - Perfect quality European private server of Aion - EuroAion.com - Perfect quality European private server of Aion!
...

Wyprowadzanie linków, anchorów i snippetów do tabeli CSV

Wbudowane narzędzie $tools.CSVLine pozwala na tworzenie poprawnych dokumentów tabelarycznych, gotowych do importu do Excela lub Google Sheets.

Ogólny format wyniku:

[%  FOREACH i IN p1.serp;    tools.CSVline(i.link, i.anchor, i.snippet); END  %]

Nazwa pliku:

$datefile.format().csv

Tekst początkowy:

Link,Anchor,Snippet

Przykład wyniku:

Link,Anchor,Snippet
https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC,"Forum — Wikipedia",
https://en.wikipedia.org/wiki/Forum,"Forum - Wikipedia","<em>Forum</em> (plural forums or fora) may refer to: Contents. 1 Common uses; 2 Places. 2.1 Natural features; 2.2 Populated places. 3 Arts and entertainment; 4 Media."
https://www.weforum.org/,"The World Economic Forum","The World Economic <em>Forum</em> is an independent international organization committed to improving the state of the world by engaging business, political, academic&nbsp;..."
https://support.google.com/webmasters/community?hl=ru,"Witamy na forum pomocy społeczności ...","Witamy na forum pomocy <em>forum</em> społeczności Centrum wyszukiwarki Google. Polecane wpisy. Zobacz wszystkie ciekawe wpisy &middot; Odpowiedzi na&nbsp;..."
https://support.google.com/chrome/community?hl=ru,"Witamy na forum pomocy społeczności ...","Witamy na forum pomocy <em>forum</em> społeczności Google Chrome. Polecane&nbsp;..."
...

wskazówka

W Ogólnym formacie wyników stosowany jest silnik szablonów Template Toolkit do wyprowadzania tablicy $serp w pętli FOREACH.

W nazwie pliku wyników należy po prostu zmienić rozszerzenie pliku na csv.

Aby opcja "Prepend text" była dostępna w Edytorze zadań, należy aktywować "More options". W "Prepend text" wpisujemy nazwy kolumn oddzielone przecinkami, a drugą linię pozostawiamy pustą.

Wyprowadzanie bloków reklamowych

Format wyniku:

$ads.format('$link - $anchor - $snippet\n')

Przykład wyniku:

https://www.rentalcars.com/ - Rent a Car Worldwide - Best Prices Online Guaranteed - Secure Your <em>Car Hire</em> Today. The Best Price Guaranteed. Book at Over 53,000 Locations. Search, Compare and Save Using the World's Biggest Online <em>Car Rental</em> Service.
https://www.kayak.com/United-States-Car-Rentals.253.crc.html - United States from $9/day - Search for Rental Cars on Kayak - Find and Compare Great <em>Car</em> Deals in USA. Book with Confidence on KAYAK®!
https://www.discovercars.com/ - -70% Worldwide Car Rental - Rent Your Car in 5 Minutes‎ - <em>Car rental</em> prices are rising, but if you act fast, you can get a good deal. Don’t stress! We...
https://www.economybookings.com/ - Rent a Car for Summer Holidays - Car Rentals for the Best Price - Theft protection and Third Party liability part of a great deal. Free Mileage included.
...

Format wyniku:

$related.format('$key\n')

Przykład wyniku:

test <b>speed</b>
<b>net speed</b> test
<b>google speed</b> test
<b>fast speed</b> test
<b>ping</b> test
<b>xfinity speed</b> test
<b>speed</b> test <b>mobile</b>
test <b>my</b>
...

wskazówka

Aby automatycznie usuwać tagi HTML w wyniku, należy użyć Konstruktora wyników, wybrać tablicę $related i zastosować Remove HTML tags.

Konkurencja słów kluczowych

Format wyniku:

$query - $totalcount\n

Przykład wyniku:

speed test mobile - 1080000000
test score - 4020000000
net speed test - 1210000000
fast speed test - 2150000000
speed test - 2500000000
test match - 4160000000
ping test - 425000000
google speed test - 1870000000

Wykrywanie słów kluczowych z błędami

Format wyniku:

$query - $misspell\n

Przykład wyniku:

spead test - 1
test match - 0
speed test - 0
temst match - 1

Sprawdzanie indeksacji linków

Format zapytania:

site:$query

Format wyniku:

$query.orig - $totalcount\n

Przykład wyniku:

https://a-parser.com/pages/buy - 2
https://a-parser.com/wiki/parsers - 4
https://a-parser.com/resources - 883
https://trjkjfkdf.bg.ky - none
https://a-parser.com/forum - 371

wskazówka

Aby sprawdzić indeksację linków, wstawiamy w Formacie zapytania odpowiedni operator: site:.

Format wyniku jest wyprowadzany w postaci "źródłowy url - liczba stron w indeksie".

W rezultacie otrzymujemy adres stron i ich liczbę w indeksie wyszukiwarki.

Jeśli strona nie istnieje w indeksie, wynikiem będzie: none.

Zapisywanie w formacie SQL

Format wyniku:

[%  FOREACH serp;   "INSERT INTO serp VALUES('" _ query _ "', '";   link _ "', '";  anchor _ "')\n"; END  %]

Przykład wyniku:

INSERT INTO serp VALUES('test', 'https://www.speedtest.net/', 'Speedtest by Ookla - The Global Broadband Speed Test')
INSERT INTO serp VALUES('test', 'https://fast.com/', 'Fast.com: Internet Speed Test')
INSERT INTO serp VALUES('test', 'https://www.business-standard.com/article/sports/ind-vs-aus-live-score-4th-day-5-india-vs-australia-live-cricket-score-online-brisbane-weather-121011900103_1.html', 'IND vs AUS 4th Test highlights: India creates history, wins ...')
INSERT INTO serp VALUES('test', 'https://www.test.com/', 'Find online tests, practice test, and test creation software | Test ...')
INSERT INTO serp VALUES('test', 'https://www.espncricinfo.com/series/india-in-australia-2020-21-1223867/australia-vs-india-4th-test-1223872/match-report-4', 'Recent Match Report - Australia vs India 4th Test 2020 ...')
INSERT INTO serp VALUES('test', 'https://www.icc-cricket.com/world-test-championship/standings', 'World Test Championship (2019-2021) Points Table - Live ...')
INSERT INTO serp VALUES('test', 'https://www.icc-cricket.com/rankings/mens/team-rankings/test', 'ICC Test Match Team Rankings International Cricket Council')
INSERT INTO serp VALUES('test', 'https://projectstream.google.com/speedtest', 'Speedtest - Google')
INSERT INTO serp VALUES('test', 'https://www.google.com/search?hl=en&q=Software+Testing&stick=H4sIAAAAAAAAAONgecQ4g5Fb4OWPe8JSfYyT1py8xtjOyMUVnJFf7ppXkllSKaTCxQZlSXHxSHHo5-obmJul5GkwSHFxwXlKwUbuuy5NO8fmKMgABGJm_g5SmlpCXOyexT75yYk5ggpvuB68mfLeXkuYiyMksSI_Lz-3UtCBgcHhx__39kqcnEBND7aoddhrMTTtW3GIjYWDUYCBZxGrQHB-Wkl5YlGqQkhqcUlmXjoAS5B1P7EAAAA&sa=X&ved=2ahUKEwiW-rnmlajuAhWpAGMBHR-JAv4Q6RMwHXoECDQQBQ', '')
...

Zrzut wyników do JSON

Ogólny format wyniku:

[% IF notFirst;
  ",\n";
ELSE;
  notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.links = [];

FOREACH item IN p1.serp;
    obj.links.push(item.link);
END;

obj.json %]

Tekst początkowy:

Tekst końcowy:

Przykład wyniku:

[{"totalcount":"6450000000","links":["https://www.speedtest.net/","https://fast.com/","https://projectstream.google.com/speedtest","https://www.test.com/","https://www.speakeasy.net/speedtest/","https://www.att.com/support/speedtest/","https://speedtest.xfinity.com/","https://developers.google.com/speed/pagespeed/insights/","https://www.espncricinfo.com/series/india-in-australia-2020-21-1223867/australia-vs-india-4th-test-1223872/match-report-4","https://nasional.tempo.co/read/1424570/listyo-sigit-temui-ahy-menjelang-fit-and-profer-test-calon-kapolri","https://www.google.com/search?hl=en&q=Test+Assessment&stick=H4sIAAAAAAAAAONgecRYyC3w8sc9YamMSWtOXmNM4uIKzsgvd80rySypFNLiYoOyFLj4pbj10_UNjQyzKsvyzDQYpHi5kAWUNIxkdl2ado5NTJABCMTKAhyUODmBLIVA-wX2WgxN-1YcYmPhYBRg4FnEyh-SWlyi4FhcnFpcnJuaVwIAwEAP9ogAAAA&sa=X&ved=2ahUKEwj17MzXmajuAhW8CWMBHRlzBP4Q6RMwDHoECBEQBQ"]}]

wskazówka

Aby opcje "Prepend text" i "Append text" były dostępne w Edytorze zadań, należy aktywować "More options".

Przetwarzanie wyników

A-Parser pozwala na przetwarzanie wyników bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera Google

Usuwanie duplikatów linków

Dodaj usuwanie duplikatów i z listy rozwijanej wybierz $serp.$i.link - Link.

Pobierz przykład

Jak importować przykład do A-Parser

eJx9VE1v2zAM/SsFkcMGBEFy2MW3NFiKDVnTNekpyEGNaUOLLGmSnDUw/N9H+ktO
N/Rmko+PfCTlCoLwZ//k0GPwkBwqsM03JLD7miQPxuQK7zZSn/3di5a/S4QpWOE8
OoYfRigKpJiJUgWYVhCuFonEXNA5mXJQpmRbZ96uDoOT6Ml3Eapk2GI+n0P9QZrI
8WRKHWLO4gO44n4tOk4bZcxHKWUvhuRyy8kBSJMlByfDcdoh9i3cU8c6h977oMyr
UJAEV2J9PPYsfm1cIXh4E7uYdZMcgjtxwb2hYCZVrOzXZD2KgqtMUhGQo7OsIfr0
eRbemEGkqQzSaKHaCjz7WLVbTALaEJY+ebprZwpyBWwI2HntuzvApLGjyp9tDiSZ
UB6n4KnVtaBG0vcRGdCJYNzWcj/kr8DopVIbvKCKsIb/vpQqpUNZZpT0rUv8P2T7
D0c9yBuXokX/cdTDwNJY99sfMSs1G5OT8vS1WWYhA9l+1VxPAnNynhHtMLNHnllh
HA5lOuauOr0Ni5qvKq5saaPrRsbNWm6dJ6MzmW+7S+2Rpd7TA9zqlSmsQtalS6Vo
LR6f43ksfbcGNmKD75NXTQmW3r9DCMYo/33XtmqdpPP7wg0WNMlx1Y7yJJR6ed6M
IxBPqjknz7QnutPc0AWRivo4/BGG/0g1/i8kVU1r+eWfWhBrYAj5aBieZs6P+S/t
6pW4

wskazówka

Zobacz również: Usuwanie duplikatów wyników

Usuwanie duplikatów linków według domeny

Dodaj usuwanie duplikatów i z listy rozwijanej wybierz $serp.$i.link - Link. Wybierz typ usuwania duplikatów: Domain.

Pobierz przykład

Jak importować przykład do A-Parser

eJx9VE2P2jAQ/SvI4tBKaAWHXnJj6bJqRZftwp4QB0MmyMXxuLZDF0X89844IQ7b
am+ZmffefDq1CNIf/bMDD8GLbFMLG79FJlYPWfaIeNAwWChz9INXo35XMNidB1+x
lMqIkbDSeXBM3PTwFMihkJUOYlSLcLZAcngC51TOQZWTbR2+nR0Ep8CT7yR1xbDJ
eDwWlw9o8gB7rExInMkHcM2VW3BM6zHGPUoV26IgNc4lZxtBPVlyMFlsRy1i3cDz
a++N91HjTmqRBVfBZbu9qvg5ulLyGId2ctfOtAuu5AnWSMFC6ZTZz8l6kiVnGeYy
AEfviij06fNdeGMFmecqKDRSNxl49ilrsyLiGyQsffJ05w5LcgWIAuw8X6vbiGG0
U5c/G47ICqk9jISnUueSCsnfR1QAJwO6peV6yF8LNFOtF3ACnWBR/75SOqdDmRZE
+tYS/w9Z/qNx6drrp6JF/3FUQ6cSrfvlj8TKcYEHXtkuLrNUgWw/i9eTiTE5jwC2
m9kTz6xEB12aVrnNTq/EguGrSiub2uS6aeNmLbfOPZpCHZbtpV6RlVnTU1yaGZZW
A/dlKq1pLR5e0nlMfbsGNlKB78mzmIJbv75DERC1/75qSrVO0fl94QJLmmQ/ayu5
l1q/viz6EZFOKp6TZ9k93ekB6YKoi8u2+yN0f5S6/1/I6gut5Zd/bkDcA0PIR8Pw
NHN+zH8BRVyZDA==

wskazówka

Zobacz również: Usuwanie duplikatów wyników

Wyodrębnianie domen

Dodaj Result Builders (Konstruktor wyników) i z listy rozwijanej wybierz źródło: $p1.serp.$i.link - Link. Wybierz typ: Extract Domain.

Pobierz przykład

Jak importować przykład do A-Parser

eJx9VE1v2zAM/SuFkMMGBIFz2MW3NGuGDVnTNe0p6EGzaUOLLGqSnCUw8t9HKort
dkNv5scj+cgndyJIv/cPDjwEL/JdJ2z8FrnY3uX5F8Raw83dMThZhJvP2EhlxFRY
6Tw4BuxGeRQooZKtDmLaiXCyQGXwAM6pkoOqJNs6PJ4cBKfAk+8gdctp8yzLxPkd
mKyhwNaEATN/J10rs/cWHMNGiOz88jIVxJBm9Ct0jWSmEzufJdp9cCsP8IQUrFQk
dsWQdS8bbjkpZQCOzqpY6MPHWThyBVmWKig0Ul868JqGrs9G/Y6MDVIuffIiVg4b
cgWIBdh5uk63E5NoCyrRRuyPC0bkldQepsLTqCtJg5RvIyqAkwHdxvI85O8EmoXW
aziAHtJi/dtW6ZJuuqgI9DUB/5+y+afGuac3bkU3+eNohr5KtG433wdUiWusiXn5
k3hr1ahAtl/GQ+ciI+cewPY7u+edNeigb5Mqp+4kZAuGBTCcbGEH1ysar84ycnbC
Y+sK6rfLpjtBQrdxOLMXrJ6kOLi8if5JSOfkifwpPWBSoTgTpkBTqXqTRHrt3Jon
en0bs8TGauA9mVZrOrOHx0FuC5/OysZA+C14GVvwKq9PkGZA7b9tL9StUzTSJybc
0GXGXVPJQmr9/LgeR8Qg0ShPz2UL0n2NpEhiweTSz6D/iXTjX0LenenMv/zDJYk5
cAr5aBmebsjv+C86oZM/

wskazówka

Zobacz również: Konstruktor wyników

Usuwanie tagów z anchorów i snippetów

Dodaj Result Builders (Konstruktor wyników) i z listy rozwijanej wybierz źródło: $p1.serp.$i.anchor - Anchor. Wybierz typ: Remove HTML tags.

Dodaj ponownie Result Builders (Konstruktor wyników) i z listy rozwijanej wybierz źródło: $p1.serp.$i.snippet - Snippet. Wybierz typ: Remove HTML tags.

Pobierz przykład

Jak importować przykład do A-Parser

eJyVVD1v2zAQ/SsC4aEFBEMeumhzjLpp4cSp7UxGBlY6qawpkiUpN4bg/947mpaU
NAjQjby79+7rkR3z3B3cgwUH3rF83zETzixn2895/kXrWkKygUYfIbnd3a0Sz2uX
VFY3yVwVP7V1CVdlslXCGKJImeHWgSWy/YgDHSVUvJWepR3zJwOYAkmtFSU5RYl3
Y/XzyYK3AojpyGVLYbMsy9j5HRivodCt8gNm9k64FOrgDFiCjRDZ+ekpZdg91uiW
2jacpjAxs2kcSe/c8iPsNDorERq7YvB2zxtKOSm5B/JOq0D04ePUPxMDL0vhhVZc
XjLQmIasj0r8Dh0rjbF4pEEscdZo8hAIyHi6Vrdnk3BnSNEG7PcLhuUVlw5S5rDU
JcdCytce4cFyr+3aUD1o75hWcylXcAQ5hAX+m1bIEnc6rxD0NQLfDln/w3Hu2xun
wp38sVhDzxJuN+u7AVXqla6x8/IH9i1FIzze3SIsOmcZGg8App/ZPc2s0Rb6NJE5
ZkeRG1AkgGFlczOYXrTxYi0jY8ecbm2B+fZZumcodENbDS+BkX6i5mx4Mbe+keS2
lp/QGKM9SSdCSKZvMbrLe/ovyivmjJhCq0rU66j8azut2uFzX6uFbowEGr5qpUTt
ONgMGp67qBW6DFN8DV6EFLSf67vGMrR037aXeRorsKpPaSx8nDVSFlzKx81q7GGD
7oPmHdEW+JhqjTLHLqi5+MP0v1Y3/mfy7oza+eUeLkHUA4WgDYfhUBj0OfwFH/O5
UQ==

wskazówka

Konstruktor wyników można dodać tyle razy, ile jest potrzebne.

Zobacz również: Konstruktor wyników

Filtrowanie linków według występowania

Dodaj filtr i z listy rozwijanej wybierz: $serp.$i.link - Link. Wybierz typ: Contain string. Następnie w polu String (Ciąg) wpisz cechę filtrowania.

Pobierz przykład

Jak importować przykład do A-Parser

eJx9VE1v2kAQ/StoxSGVEIJDL74RVKpWNKSBnBCHDR5bG9Y72901DbL83zuzNrZJ
qtw8H+/Nm491JYL0J//owEPwItlXwsZvkYjttyT5jphrGK2UDuCUyUcvl5EP8UuZ
kVbmJCbCSufBMXo/AFEghUyWOohJJcLFAnHiGZxTKQdVSrZ1+HZxQIzgyXeWuuS0
+Ww2E/UnMJnDEUsTesz8k3TW6S04hg0QswEkix1SkLpnycleUE+WHLHJw6TN2DXp
RzRBKjOQPD1iQSbaoNCQ7cF4UR8OV0a/QldInuvYzqftkLvgVp5hh40O6N00d3iQ
BfOPUxmAo9MsEt19mYY3ZpBpqrim1E0F3kNf9dmoP1GfQcqlT570ypHWRASIBOy8
XNXtxTja3HEZsb8bjEgyqT1MhCepK0lC0vcRRfORAd0mzoD8lUCz0HoNZ9B9WuS/
L5VO6WgWGYF+tMD/p2w+cNRde8NStPS/jjR0LNG63/zqUSmuMafO05e42EIFsv0y
XlIiZuQ8AdhuZg88swIddGVa5rY6PRsLhi+sX9nC9q6bNm7Wcuuka8pUvmmv9ppZ
mh29zY1ZYmE1cF+m1JrW4uGpP4+Fb9fARi/wPXgZS3Dr1zcpAqL2P7eNVOsUnd9X
FljQJIdVW8qj1Pr5aT2MiP6k4jl5pj3SneZIF0Rd1Ifu79D9YqrhPyKpalrLq39s
krgHTiEfDcPHlzSv/wHtZp3U

wskazówka

Zobacz również: Filtry wyników

Możliwe ustawienia

notatka

Ogólne ustawienia dla wszystkich scraperów

Parametry regionalne

Google domain - używana domena Google, domyślnie google.com
Results language - wyszukiwanie stron w wybranym języku, w przeglądarce odpowiada to opcji Wyszukiwanie zaawansowane -> Dodatkowe ustawienia -> Szukaj w (parametr url lr). Domyślnie nieustawione, co oznacza automatyczne wykrywanie na podstawie IP
Spoiler: Zrzut ekranu
Interface language - język produktów Google, w przeglądarce to Języki -> Język interfejsu (parametr url hl). Domyślnie wybrany język angielski
Spoiler: Zrzut ekranu
Search from country - wybór regionu wyszukiwania, w przeglądarce to Języki -> Region wyszukiwania (parametr url gl). Domyślnie nieustawione, co oznacza automatyczne wykrywanie na podstawie IP
Spoiler: Zrzut ekranu
Narrow results by region - wyszukiwanie stron utworzonych w konkretnym kraju, w przeglądarce to Wyszukiwanie zaawansowane -> Dodatkowe ustawienia -> Kraj (parametr url cr). Domyślnie nieustawione, co oznacza wyłączenie tej opcji
Spoiler: Zrzut ekranu
Location (city) - dokładna lokalizacja wyszukiwania, w przeglądarce określana automatycznie na podstawie lokalizacji użytkownika. Domyślnie nieustawione, co oznacza automatyczne określanie na podstawie IP zapytania
Spoiler: Zrzut ekranu

Wszystkie parametry regionalne w mniejszym lub większym stopniu wpływają na wyniki.

Nazwa parametru	Wartość domyślna	Opis
Device	`Desktop`	Wybór wyników desktopowych lub mobilnych: Desktop / Mobile
Pages count	`5`	Liczba stron do scrapowania (od 1 do 100)
Parse pages links from first page	`☑`	Z pierwszej strony wyników zbiera linki do wszystkich dostępnych stron paginacji. Uwzględniane tylko przy Device: `Desktop`; nie działa dla wyników mobilnych
Serp type	`Default (All)`	Określa, czy scrapować ze strony głównej, z wiadomości czy z książek (Books, News, Videos)
Hide omitted results	`☑`	Określa, czy ukrywać pominięte wyniki (parametr filter=)
Serp time	`Anytime`	Czas SERP (wyszukiwanie zależne od czasu, parametr tbs=, możliwe wartości: Past 1 hour, Past 24 hours, Past week, Past month, Past year)
Parse not found	`☑`	Określa, czy scrapować wyniki, jeśli Google poinformował, że dla danego zapytania nic nie znaleziono i zaproponował wyniki dla innego zapytania
Disable autocorrect	`☐`	Pozwala wyłączyć autokorektę Google i scrapować wyniki dokładnie dla podanego zapytania
Exact match	`☐`	Odpowiada opcji w wyszukiwarce "Exact match". Uwaga, ta opcja nadpisuje wartość parametru `Serp time` (analogicznie do działania tych opcji w przeglądarce).
Safe search	`Blur`	Możliwość włączenia "Safe search"
Google domain	`www.google.com`	Domena Google do scrapowania, obsługiwane są wszystkie domeny (www.google.ac, www.google.com.af, www.google.co.ck itp.)
Narrow results by region	`Any region`	Możliwość zawężenia wyszukiwania do konkretnego kraju
Results language	`Auto (Based on IP)`	Wybór języka wyników (parametr lr=)
Search from country	`Auto (Based on IP)`	Wybór kraju, z którego realizowane jest wyszukiwanie (wyszukiwanie zależne od geolokalizacji, parametr gl=)
Interface language	`English`	Możliwość wyboru języka interfejsu Google, dla maksymalnej identyczności wyników w scraperze i w przeglądarce
Location (city)		Wyszukiwanie według miasta, regionu. Można podawać miasta w formacie novosibirsk, russia; pełną listę lokalizacji można znaleźć w Geotargets (kopia - należy użyć wartości z kolumny Canonical Name). Należy również ustawić poprawną domenę Google
Util::ReCaptcha2 preset	`default`	Określa, czy używać Util::ReCaptcha2 do omijania reCaptcha
Util::AntiGate preset	`default`	Określa, czy używać Util::AntiGate do omijania graficznych captcha
ReCaptcha2 retries	`3`	Liczba prób wysłania odpowiedzi dla reCaptcha określoną ilość razy, bez zmiany proxy
ReCaptcha2 pass proxy	`☐`	Pozwala przekazywać proxy (używane w zapytaniu do Google) oraz ciasteczka (otrzymane w odpowiedzi od Google) do serwisu rozpoznawania ReCaptcha
Use sessions	`☑`	Zapisuje dobre sesje, co pozwala na jeszcze szybsze scrapowanie przy mniejszej liczbie błędów.
Don't take session	`☐`	Możliwość nieużywania zapisanych dobrych sesji
Additional headers		Pozwala na podanie dowolnych własnych nagłówków
PAA questions count	`0`	Maksymalna liczba pytań i odpowiedzi (People also ask) dla każdego zapytania, które scraper powinien zebrać
Empty totalcount is error	`☐`	Przy włączeniu tego parametru zapytanie zostanie uznane za nieudane, jeśli brakuje wartości dla `$totalcount`, i odpowiednio będą podejmowane ponowne próby
Count of retries when result is empty	`10`	Liczba ponownych prób zapytania, jeśli strona wyników jest całkowicie pusta
Redirect browser max pages	`10`	Liczba stron przeglądarki używanych do omijania zabezpieczeń w formie sprawdzania włączonego JavaScript
Single redirect browser for task	`☑`	Jeśli w zadaniu wskazano kilka scraperów Google — używaj tylko jednej przeglądarki dla wszystkich podzadań; maksymalna liczba stron i pozostałe ustawienia są pobierane z pierwszego scrapera Google w zadaniu

Przegląd scrapera​

Przypadki użycia scrapera​

🔗 Scrapowanie domen

🔗 Scrapowanie Google News

🔗 Sprawdzanie indeksacji

🔗 Ocena konkurencji

🔗 Scrapowanie wyników top 3

🔗 Pytania i odpowiedzi

Zbierane dane​

Możliwości​

Warianty użycia​

Zapytania​

Podstawienia zapytań​

Użycie operatorów​

Warianty wyprowadzania wyników​

Eksport listy linków​

Linki + anchory + snippety z wyprowadzeniem pozycji​

Wyprowadzanie linków, anchorów i snippetów do tabeli CSV​

Wyprowadzanie bloków reklamowych​

Zapisywanie powiązanych słów kluczowych​

Konkurencja słów kluczowych​

Wykrywanie słów kluczowych z błędami​

Sprawdzanie indeksacji linków​

Zapisywanie w formacie SQL​

Zrzut wyników do JSON​

Przetwarzanie wyników​

Usuwanie duplikatów linków​

Usuwanie duplikatów linków według domeny​

Wyodrębnianie domen​

Usuwanie tagów z anchorów i snippetów​

Filtrowanie linków według występowania​

Możliwe ustawienia​

Parametry regionalne​

Przegląd scrapera

Przypadki użycia scrapera

Zbierane dane

Możliwości

Warianty użycia

Zapytania

Podstawienia zapytań

Użycie operatorów

Warianty wyprowadzania wyników

Eksport listy linków

Linki + anchory + snippety z wyprowadzeniem pozycji

Wyprowadzanie linków, anchorów i snippetów do tabeli CSV

Wyprowadzanie bloków reklamowych

Zapisywanie powiązanych słów kluczowych

Konkurencja słów kluczowych

Wykrywanie słów kluczowych z błędami

Sprawdzanie indeksacji linków

Zapisywanie w formacie SQL

Zrzut wyników do JSON

Przetwarzanie wyników

Usuwanie duplikatów linków

Usuwanie duplikatów linków według domeny

Wyodrębnianie domen

Usuwanie tagów z anchorów i snippetów

Filtrowanie linków według występowania

Możliwe ustawienia

Parametry regionalne