SE::Seznam - Scraper för den tjeckiska sökmotorn seznam.cz

Översikt av scrapern
Scraper för Seznams sökresultat. Tack vare Seznam-scrapern kan du få stora baser av länkar redo för vidare användning. Du kan använda sökfrågor på samma sätt som du skriver in dem i Dogpiles sökfält, inklusive sökoperatorer (site, inurl etc.).
Funktionaliteten i A-Parser gör det möjligt att spara inställningar för Seznam-scrapern för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av frågor, ersättning av underfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.
Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.
Data som samlas in
- Länkar, ankare och snippets från sökresultaten
- Lista över relaterade sökord (Related keywords)

Funktioner
- Skrapar det maximala antalet resultat som Seznam tillhandahåller - 50 sidor med 20 objekt per sökresultat
- Totalt maximalt antal resultat per fråga - 1000
Användningsfall
- Insamling av länkdatabaser - för A-Poster, XRumer, AllSubmitter etc.
- Sökning efter bakåtlänkar (omnämnanden) av webbplatser
- Sökning efter sårbara webbplatser
- Alla andra scenarier som innebär dataskrapning av Seznam i någon form
Frågor
Som frågor bör du ange sökfraser på samma sätt som om du skrev in dem direkt i Seznams sökformulär, till exempel:
test query
fönster Moskva
site:a-parser.com
inurl:auto
Frågesubstitutioner
Du kan använda inbyggda makron för att multiplicera frågor. Om vi till exempel vill få en mycket stor bas av forum, anger vi några huvudfrågor på olika språk:
forum
forum
foro
论坛
I frågeformatet anger vi en teckenkombination från a till zzzz. Denna metod gör det möjligt att rotera sökresultaten maximalt och få många nya unika resultat:
$query {az:a:zzzz}
Detta makro kommer att skapa 475254 ytterligare frågor för varje ursprunglig sökfråga, vilket totalt ger 4 x 475254 = 1901016 sökfrågor. Siffran är imponerande, men det är inga problem för A-Parser. Med en hastighet på 2000 frågor per minut kommer en sådan uppgift att bearbetas på bara 16 timmar.
Användning av operatorer
Du kan använda sökoperatorer i frågeformatet, så att de automatiskt läggs till i varje fråga från din lista:
site:$query
Exempel på resultatutdata
A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör att den kan mata ut resultat i valfri form, såväl som i strukturerad form som CSV eller JSON
Export av länklista
På samma sätt som i SE::Google.
Länkar + ankare + snippets med position
På samma sätt som i SE::Google.
Utmatning av länkar, ankare och snippets till en CSV-tabell
På samma sätt som i SE::Google.
Spara i SQL-format
På samma sätt som i SE::Google.
Dumpa resultat till JSON
På samma sätt som i SE::Google.
Bearbetning av resultat
A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen. I det här avsnittet har vi listat de mest populära fallen för Seznam-scrapern
Dubblettkontroll av länkar
På samma sätt som i SE::Google.
Dubblettkontroll av länkar per domän
På samma sätt som i SE::Google.
Extrahera domäner
På samma sätt som i SE::Google.
Ta bort taggar från ankare och snippets
På samma sätt som i SE::Google.
Filtrering av länkar efter förekomst
På samma sätt som i SE::Google.
Möjliga inställningar
| Namn på parameter | Standardvärde | Beskrivning |
|---|---|---|
| Pages count | 5 | Antal sidor att skrapa (från 1 till 50) |
| Links per page | 10 | Antal länkar på en sida (10 / 20) |