Przejdź do treści głównej

SE::Rambler - scraper wyników wyszukiwania Rambler

img

Przegląd scrapera

Scraper wyników wyszukiwania Rambler. Dzięki scraperowi Rambler będziesz mógł pozyskiwać duże bazy linków, gotowych do dalszego wykorzystania. Możesz używać zapytań w takiej samej formie, w jakiej wpisujesz je w pasek wyszukiwania Rambler, włączając w to operatory wyszukiwania (site, ip itp.).

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera Rambler do dalszego wykorzystania (presety), ustalać harmonogram scrapowania i wiele więcej. Możesz korzystać z automatycznego mnożenia zapytań, podstawiania podzapytań z plików, generowania kombinacji alfanumerycznych i list w celu uzyskania maksymalnej możliwej liczby wyników.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala stosować dodatkową logikę do wyników i wyprowadzać dane w różnych formatach, w tym JSON, SQL i CSV.

Zbierane dane

  • Liczba wyników w wyszukiwarce
  • Linki, anchory i snippety z wyników wyszukiwania
  • Lista powiązanych słów kluczowych (hints)

jakie dane zbiera scraper SE::Rambler

Możliwości

  • Obsługa operatorów wyszukiwania Rambler (url:, site:, inurl:, host:, rhost:, domain:.)
  • Scrapuje do 25 stron, od 10 do 50 wyników na stronę
  • Scrapuje powiązane słowa kluczowe ($hints)
  • Możliwość korzystania z serwisów rozwiązywania dla omijania captch
  • Wybór urządzenia wynikowego: zwykły desktop, mobilny Android lub mobilny iOS

Warianty użycia

  • Zbieranie baz linków
  • Ocena konkurencji dla słów kluczowych
  • Wyszukiwanie backlinków (wspomnień) o stronach
  • Wszystkie przypadki, gdy trzeba scrapować wyniki wyszukiwania Rambler

Zapytania

Wprowadzaj zapytania tak samo, jak w wyszukiwarce Rambler. Załóżmy, że potrzebne są tylko linki z jednej strony. Wpisujemy w pole zapytań:

"kupić drzwi" site:http://kp.ru

Podstawienia zapytań

Możesz użyć wbudowanych makr do mnożenia zapytań, na przykład chcemy uzyskać bardzo dużą bazę forów, podamy kilka głównych zapytań w różnych językach:

forum
forum
foro
论坛

W formacie zapytań wskażemy generowanie znaków od a do zzzz, ta metoda pozwala maksymalnie rotować wyniki wyszukiwania i uzyskiwać mnóstwo nowych unikalnych wyników:

$query {az:a:zzzz}

To makro utworzy 475254 dodatkowych zapytań na każde początkowe zapytanie, co w sumie da 4 x 475254 = 1901016 zapytań do wyszukiwarki, liczba imponująca, ale nie stanowi to żadnego problemu dla A-Parser. Przy prędkości 2000 zapytań na minutę takie zadanie zostanie przetworzone w zaledwie 16 godzin.

Użycie operatorów

Możesz używać operatorów wyszukiwania w formacie zapytania, dzięki czemu zostaną one automatycznie dodane do każdego zapytania z Twojej listy:

site:$query

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w ustrukturyzowanej, np. CSV lub JSON

Eksport listy linków

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Format wyniku:

$hints.format('$hint\n')

Przykład wyniku:

habrahabr
habr
habrahabr ru
xabra
livebusiness
eureka
elektroniczny księgowy
wyspa elba
elba elektroniczny księgowy
habrahabr
...

Zapisywanie w formacie SQL

Analogicznie jak w SE::Google.

Dump wyników do JSON

Analogicznie jak w SE::Google.

Przetwarzanie wyników

A-Parser pozwala przetwarzać wyniki bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera Rambler

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Wyodrębnianie domen

Analogicznie jak w SE::Google.

Usuwanie tagów z anchorów i snippetów

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Możliwe ustawienia

Nazwa parametruWartość domyślnaOpis
DeviceDesktopWybór urządzenia wynikowego: zwykły desktop, mobilny Android lub mobilny iOS
Pages count5Liczba stron do scrapowania (od 1 do 25)
Links per page10Liczba wyników na stronę (10/15/30/50)
Rambler region IDMożliwość ustawienia regionu. Należy podać ID regionu. Jak sprawdzić ID potrzebnego regionu - opisano tutaj
SortSites by relevanceWybór opcji sortowania wyników
Results filteringModerateWybór opcji filtrowania wyników
Results languageAny languageWybór języka wyszukiwania wyników
Serp timeAnytimeWybór okresu wyników
Results typeAny formatWybór typu wyników (mime type)
Exact matchŚcisłe dopasowanie do zapytania
Disable autocorrectWyłącza autokorektę, pozwala scrapować wyniki dokładnie według podanego zapytania
Use sessionsZapisuje dobre sesje, co pozwala scrapować jeszcze szybciej, otrzymując mniejszą liczbę błędów
AntiGate presetdefaultOkreśla, czy używać Util::AntiGateUtil::AntiGate do omijania captch