Hoppa till huvudinnehåll

SE::Seznam - Scraper för den tjeckiska sökmotorn seznam.cz

Seznam

Översikt av scrapern

Scraper för Seznams sökresultat. Tack vare Seznam-scrapern kan du få stora baser av länkar redo för vidare användning. Du kan använda sökfrågor på samma sätt som du skriver in dem i Dogpiles sökfält, inklusive sökoperatorer (site, inurl etc.).

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för Seznam-scrapern för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av frågor, ersättning av underfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.

Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Data som samlas in

  • Länkar, ankare och snippets från sökresultaten
  • Lista över relaterade sökord (Related keywords)
Data som samlas in

Funktioner

  • Skrapar det maximala antalet resultat som Seznam tillhandahåller - 50 sidor med 20 objekt per sökresultat
  • Totalt maximalt antal resultat per fråga - 1000

Användningsfall

  • Insamling av länkdatabaser - för A-Poster, XRumer, AllSubmitter etc.
  • Sökning efter bakåtlänkar (omnämnanden) av webbplatser
  • Sökning efter sårbara webbplatser
  • Alla andra scenarier som innebär dataskrapning av Seznam i någon form

Frågor

Som frågor bör du ange sökfraser på samma sätt som om du skrev in dem direkt i Seznams sökformulär, till exempel:

test query
fönster Moskva
site:a-parser.com
inurl:auto

Frågesubstitutioner

Du kan använda inbyggda makron för att multiplicera frågor. Om vi till exempel vill få en mycket stor bas av forum, anger vi några huvudfrågor på olika språk:

forum
forum
foro
论坛

I frågeformatet anger vi en teckenkombination från a till zzzz. Denna metod gör det möjligt att rotera sökresultaten maximalt och få många nya unika resultat:

$query {az:a:zzzz}

Detta makro kommer att skapa 475254 ytterligare frågor för varje ursprunglig sökfråga, vilket totalt ger 4 x 475254 = 1901016 sökfrågor. Siffran är imponerande, men det är inga problem för A-Parser. Med en hastighet på 2000 frågor per minut kommer en sådan uppgift att bearbetas på bara 16 timmar.

Användning av operatorer

Du kan använda sökoperatorer i frågeformatet, så att de automatiskt läggs till i varje fråga från din lista:

site:$query

Exempel på resultatutdata

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör att den kan mata ut resultat i valfri form, såväl som i strukturerad form som CSV eller JSON

Export av länklista

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Spara i SQL-format

På samma sätt som i SE::Google.

Dumpa resultat till JSON

På samma sätt som i SE::Google.

Bearbetning av resultat

A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen. I det här avsnittet har vi listat de mest populära fallen för Seznam-scrapern

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Extrahera domäner

På samma sätt som i SE::Google.

Ta bort taggar från ankare och snippets

På samma sätt som i SE::Google.

På samma sätt som i SE::Google.

Möjliga inställningar

Namn på parameterStandardvärdeBeskrivning
Pages count5Antal sidor att skrapa (från 1 till 50)
Links per page10Antal länkar på en sida (10 / 20)