Hoppa till huvudinnehåll

SE::DuckDuckGo - Scraper för DuckDuckGo sökresultat

DuckDuckGo

Översikt över scrapern

Scraper för DuckDuckGo-sökresultat. Tack vare DuckDuckGo-scrapern kan du hämta stora databaser med länkar som är redo för vidare användning. Du kan använda sökfrågor på samma sätt som du skriver in dem i DuckDuckGos sökfält, inklusive sökoperatorer (intitle, inurl, site etc.). Mer information finns på den officiella sidan DuckDuckGo Search Syntax.

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för DuckDuckGo-scrapern för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av sökfrågor, infoga undersökfrågor från filer, generera alfanumeriska kombinationer och listor för att få största möjliga antal resultat.

Resultaten kan sparas i det format och den struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Insamlade data

  • Länkar, ankare och snippets från sökresultaten
Insamlade data

Funktioner

  • Stöd för alla DuckDuckGo-sökoperatorer (intitle:, inurl:, site: etc.). Mer information om sökoperatorer finns på den officiella sidan DuckDuckGo Search Syntax
  • Skrapar det maximala antalet resultat som tillhandahålls - 10 sidor med 10 element per sida
  • Totalt antal resultat - 100
  • Möjlighet att skrapa baserat på vald plats (alternativet Location)
  • Möjlighet att välja språk för sökresultaten (alternativet Language)

Användningsfall

  • Insamling av länkdatabaser - för A-Poster, XRumer, AllSubmitter etc.
  • Kontroll av webbplatsers indexering
  • Sökning efter bakåtlänkar (omnämnanden) av webbplatser
  • Alla andra scenarier som innebär dataskrapning av DuckDuckGo i någon form

Sökfrågor

Som sökfrågor ska sökfraser anges, till exempel:

Football  
test
site:a-parser.com
scraper site:a-parser.com
test -site:tests.com
IoT filetype:pdf

Ersättningar i sökfrågor

Du kan använda inbyggda makron för att multiplicera sökfrågor. Om vi till exempel vill få en mycket stor databas med forum, anger vi några huvudsökfrågor på olika språk:

forum
forum
foro
论坛

I sökfrågeformatet anger vi en iteration av tecken från a till zzzz. Denna metod gör det möjligt att rotera sökresultaten maximalt och få många nya unika resultat:

$query {az:a:zzzz}

Detta makro kommer att skapa 475254 ytterligare sökfrågor för varje ursprunglig sökfråga, vilket totalt ger 4 x 475254 = 1901016 sökfrågor. Siffran är imponerande, men det är inga problem för A-Parser. Med en hastighet på 2000 sökfrågor per minut kommer en sådan uppgift att bearbetas på bara 16 timmar.

Användning av operatorer

Du kan använda sökoperatorer i sökfrågeformatet, så att de automatiskt läggs till i varje sökfråga från din lista:

site:$query

Alternativ för resultatvisning

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att visa resultat i valfri form, samt i strukturerad form som CSV eller JSON.

Export av länklista

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Kontroll av länkindexering

På samma sätt som i SE::Google.

Spara i SQL-format

På samma sätt som i SE::Google.

Dumpa resultat till JSON

På samma sätt som i SE::Google.

Bearbetning av resultat

A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen. I det här avsnittet har vi listat de mest populära fallen för DuckDuckGo-scrapern.

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Extrahera domäner

På samma sätt som i SE::Google.

Ta bort taggar från ankare och snippets

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Möjliga inställningar

Namn på parameterStandardvärdeBeskrivning
Pages count5Antal sidor att skrapa (från 1 till 10)
RegionUS (English)Val av plats
LanguageEnglish (United States)Val av språk
Safe searchModerateMöjlighet att aktivera "Safe search"
Serp timeAny timeSökperiod
Use HTTP/2Avgör om HTTP/2 ska användas istället för HTTP/1.1
User agentMozilla/5.0 (Windows NT 10.0; Win64; x64; rv:120.0) Gecko/20100101 Firefox/120.0User-Agent-header vid sidförfrågningar