Hoppa till huvudinnehåll

SE::Startpage - scraper för startpage.com sökresultat

Startpage

Översikt av scrapern

Scraper för Startpage sökresultat. Tack vare Startpage-scrapern kan du få stora baser med länkar, redo för vidare användning. Du kan använda sökfrågor på samma sätt som du skriver in dem i Startpages sökfält, inklusive sökoperatorer (site, inurl etc.).

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för Startpage-scrapern för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av frågor, ersättning av underfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.

Resultaten kan sparas i det format och den struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Data som samlas in

  • Länkar, ankare och snippets från sökresultaten
Data som samlas in

Funktioner

  • Stöder val av land, sökspårk och sidans språk
  • Möjlighet att exportera ankare, länkar och snippets tillsammans eller separat
  • Möjlighet att ange antalet resultat som ska visas
  • Angivelse av resultatstorlek (10 eller 20 resultat)

Användningsfall

  • Insamling av baser med länkar, ankare och snippets
  • Hämta en lista över webbplatser som oftast nämns i sökmotorer
  • Alla andra användningsfall för att inhämta information

Frågor

Som frågor anges ord, fraser eller ordkombinationer på samma sätt som de skrivs i sökmotorn. Exempel:

test   
site:http://test.ru
röda rosor

Frågesubstitutioner

Du kan använda inbyggda makron för att multiplicera frågor, till exempel om vi vill få en mycket stor bas av forum och anger några huvudfrågor på olika språk:

forum
forum
foro
论坛

I frågeformatet anger vi en teckenkombination från a till zzzz, denna metod gör det möjligt att rotera sökresultaten maximalt och få många nya unika resultat:

$query {az:a:zzzz}

Detta makro kommer att skapa 475254 extra frågor för varje ursprunglig sökfråga, vilket totalt ger 4 x 475254 = 1901016 sökfrågor. Siffran är imponerande, men det är inga problem för A-Parser. Med en hastighet på 2000 frågor per minut kommer en sådan uppgift att bearbetas på bara 16 timmar.

Användning av operatorer

Du kan använda sökoperatorer i frågeformatet, så att de automatiskt läggs till i varje fråga från din lista:

site:$query

Exempel på resultatutdata

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att exportera resultat i valfri form, såväl som i strukturerad form som CSV eller JSON

Export av länklista

Samma som i SE::Google.

Samma som i SE::Google.

Samma som i SE::Google.

Spara i SQL-format

Samma som i SE::Google.

Dumpa resultat till JSON

Samma som i SE::Google.

Bearbetning av resultat

A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen. I det här avsnittet har vi listat de mest populära fallen för Startpage-scrapern

Samma som i SE::Google.

Samma som i SE::Google.

Extrahera domäner

Samma som i SE::Google.

Ta bort taggar från ankare och snippets

Samma som i SE::Google.

Samma som i SE::Google.

Möjliga inställningar

Namn på parameterStandardvärdeBeskrivning
Pages count5Antal sidor att skrapa (från 1 till 50)
Family filterFilter depending on searchVal av filtreringsnivå (Filter all results / Filter depending on search / Do not filter my results)
PeriodAny timeVal av tidsperiod för resultat (Any time / Past 24 hours / Past week / Past month / Past year)
Links per page10Resultatstorlek (10 / 20)
Results languageEnglishVal av språk för resultat
Page languageEnglishVal av språk för sidan
Search countryAllVal av land där sökningen utförs