Przejdź do treści głównej

SE::Startpage - scraper wyników wyszukiwania startpage.com

Startpage

Przegląd scrapera

Scraper wyników wyszukiwania Startpage. Dzięki scraperowi Startpage będziesz mógł uzyskiwać duże bazy linków, gotowych do dalszego wykorzystania. Możesz używać zapytań w takiej samej formie, w jakiej wpisujesz je w wyszukiwarkę Startpage, włączając w to operatory wyszukiwania (site, inurl itp.).

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera Startpage do dalszego wykorzystania (presety), ustawiać harmonogram scrapowania i wiele więcej. Możesz korzystać z automatycznego mnożenia zapytań, podstawiania podzapytań z plików, generowania kombinacji alfanumerycznych oraz list w celu uzyskania maksymalnej możliwej liczby wyników.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala na stosowanie dodatkowej logiki do wyników i wyprowadzanie danych w różnych formatach, w tym JSON, SQL i CSV.

Zbierane dane

  • Linki, anchory i snippety z wyników wyszukiwania
Zebrane dane

Możliwości

  • Obsługuje wybór kraju, języka wyszukiwania oraz języka strony
  • Możliwość wyprowadzania razem lub osobno anchorów, linków, snippetów
  • Możliwość określenia liczby wyświetlanych wyników
  • Określenie rozmiaru wyników(10 lub 20 wyników)

Warianty użycia

  • Zbieranie baz linków, anchorów i snippetów
  • Uzyskiwanie listy stron, które najczęściej pojawiają się w wyszukiwarkach
  • Wszelkie inne warianty użycia w celu pozyskania informacji

Zapytania

Jako zapytania podaje się słowa, frazy, wyrażenia w takiej samej formie, w jakiej wpisuje się je w wyszukiwarkę. Przykład:

test   
site:http://test.ru
czerwone róże

Podstawianie zapytań

Możesz używać wbudowanych makr do mnożenia zapytań, na przykład chcemy uzyskać bardzo dużą bazę forów, podamy kilka głównych zapytań w różnych językach:

forum
forum
foro
论坛

W formacie zapytań określimy generowanie znaków od a do zzzz, ta metoda pozwala na maksymalną rotację wyników wyszukiwania i uzyskanie wielu nowych unikalnych wyników:

$query {az:a:zzzz}

To makro utworzy 475254 dodatkowych zapytań dla każdego bazowego zapytania, co łącznie da 4 x 475254 = 1901016 zapytań, liczba jest imponująca, ale nie stanowi to żadnego problemu dla A-Parser. Przy prędkości 2000 zapytań na minutę takie zadanie zostanie przetworzone w zaledwie 16 godzin.

Użycie operatorów

Możesz używać operatorów wyszukiwania w formacie zapytania, dzięki czemu zostaną one automatycznie dodane do każdego zapytania z Twojej listy:

site:$query

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w strukturyzowanej, np. CSV lub JSON

Eksport listy linków

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Zapisywanie w formacie SQL

Analogicznie jak w SE::Google.

Zrzut wyników do JSON

Analogicznie jak w SE::Google.

Obróbka wyników

A-Parser pozwala na obróbkę wyników bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera Startpage

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Wyodrębnianie domen

Analogicznie jak w SE::Google.

Usuwanie tagów z anchorów i snippetów

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Możliwe ustawienia

Nazwa parametruWartość domyślnaOpis
Pages count5Liczba stron do scrapowania (od 1 do 50)
Family filterFilter depending on searchWybór poziomu filtrowania (Filter all results / Filter depending on search / Do not filter my results)
PeriodAny timeWybór okresu wyników (Any time / Past 24 hours / Past week / Past month / Past year)
Links per page10Rozmiar wyników (10 / 20)
Results languageEnglishWybór języka wyników
Page languageEnglishWybór języka strony
Search countryAllWybór kraju, z którego wykonywane jest wyszukiwanie