Przejdź do treści głównej

SE::DuckDuckGo - Scraper wyników wyszukiwania DuckDuckGo

DuckDuckGo

Przegląd scrapera

Scraper wyników wyszukiwania DuckDuckGo. Dzięki scraperowi DuckDuckGo będziesz mógł otrzymywać duże bazy linków, gotowych do dalszego wykorzystania. Możesz używać zapytań w takiej samej formie, w jakiej wpisujesz je w pasek wyszukiwania, włączając w to operatory wyszukiwania (intitle, inurl, site itp.). Więcej szczegółów na oficjalnej stronie DuckDuckGo Search Syntax.

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera DuckDuckGo do dalszego wykorzystania (presety), ustawiać harmonogram scrapowania i wiele więcej. Możesz korzystać z automatycznego mnożenia zapytań, podstawiania podzapytań z plików, generowania kombinacji alfanumerycznych i list w celu uzyskania maksymalnej możliwej liczby wyników.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala stosować dodatkową logikę do wyników i wyprowadzać dane w różnych formatach, w tym JSON, SQL i CSV.

Zbierane dane

  • Linki, kotwice (anchory) i snippety z wyników wyszukiwania
Zbierane dane

Możliwości

  • Wsparcie dla wszystkich operatorów wyszukiwania DuckDuckGo (intitle:, inurl:, site: itp.). Więcej o operatorach wyszukiwania na oficjalnej stronie DuckDuckGo Search Syntax
  • Scrapuje maksymalną liczbę wyników zwracaną przez Bing - 10 stron po 10 elementów w wynikach
  • Całkowita liczba wyników - 100
  • Możliwość scrapowania według wybranej lokalizacji (opcja Location)
  • Możliwość wyboru języka wyników (opcja Language)

Warianty użycia

  • Zbieranie baz linków - dla A-Poster, XRumer, AllSubmitter itp.
  • Sprawdzanie indeksacji stron
  • Wyszukiwanie backlinków (wspomnień) o stronach
  • Wszelkie inne warianty zakładające scrapowanie DuckDuckGo w tej czy innej formie

Zapytania

Jako zapytania należy podawać frazy wyszukiwania, na przykład:

Football  
test
site:a-parser.com
scraper site:a-parser.com
test -site:tests.com
IoT filetype:pdf

Podstawianie zapytań

Możesz użyć wbudowanych makr do mnożenia zapytań, na przykład chcemy uzyskać bardzo dużą bazę forów, podajmy kilka głównych zapytań w różnych językach:

forum
forum
foro
论坛

W formacie zapytań wskażemy generowanie znaków od a do zzzz, ta metoda pozwala maksymalnie rotować wyniki wyszukiwania i uzyskiwać mnóstwo nowych unikalnych wyników:

$query {az:a:zzzz}

To makro utworzy 475254 dodatkowych zapytań dla każdego wyjściowego zapytania, co w sumie da 4 x 475254 = 1901016 zapytań, liczba imponująca, ale to żaden problem dla A-Parser. Przy prędkości 2000 zapytań na minutę takie zadanie zostanie przetworzone w zaledwie 16 godzin.

Użycie operatorów

Możesz używać operatorów wyszukiwania w formacie zapytania, dzięki czemu zostaną one automatycznie dodane do każdego zapytania z Twojej listy:

site:$query

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w ustrukturyzowanej, np. CSV lub JSON

Eksport listy linków

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Sprawdzanie indeksacji linków

Analogicznie jak w SE::Google.

Zapisywanie w formacie SQL

Analogicznie jak w SE::Google.

Zrzut wyników do JSON

Analogicznie jak w SE::Google.

Obróbka wyników

A-Parser pozwala przetwarzać wyniki bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera DuckDuckGo

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Wyodrębnianie domen

Analogicznie jak w SE::Google.

Usuwanie tagów z kotwic i snippetów

Analogicznie jak w SE::Google.

Analogicznie jak w SE::Google.

Możliwe ustawienia

Nazwa parametruWartość domyślnaOpis
Pages count5Liczba stron do scrapowania (od 1 do 10)
RegionUS (English)Wybór lokalizacji
LanguageEnglish (United States)Wybór języka
Safe searchModerateMożliwość włączenia "Safe search"
Serp timeAny timeOkres wyszukiwania
Use HTTP/2Określa, czy używać HTTP/2 zamiast HTTP/1.1
User agentMozilla/5.0 (Windows NT 10.0; Win64; x64; rv:120.0) Gecko/20100101 Firefox/120.0Nagłówek User-Agent przy zapytaniu o strony