SE::Seznam - Scraper van de Tsjechische zoekmachine seznam.cz

Overzicht van de scraper
Scraper voor de zoekresultaten van Seznam. Dankzij de Seznam scraper kunt u grote databases met links verkrijgen die klaar zijn voor verder gebruik. U kunt zoekopdrachten gebruiken op dezelfde manier als u ze in de zoekbalk van Dogpile invoert, inclusief zoekoperators (site, inurl, enz.).
De functionaliteit van A-Parser maakt het mogelijk om instellingen voor de Seznam scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer. U kunt automatische query-multiplicatie gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het maximaal mogelijke aantal resultaten te verkrijgen.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
- Links, ankers en snippets uit de zoekresultaten
- Lijst met gerelateerde trefwoorden (Related keywords)

Mogelijkheden
- Scrapt het maximale aantal resultaten dat Seznam biedt - 50 pagina's van 20 elementen in de zoekresultaten
- Totaal maximaal aantal resultaten per zoekopdracht - 1000
Toepassingen
- Verzamelen van linkdatabases - voor A-Poster, XRumer, AllSubmitter, enz.
- Zoeken naar backlinks (vermeldingen) van websites
- Zoeken naar kwetsbare websites
- Alle andere scenario's waarbij Seznam op de een of andere manier moet worden gescrapt
Zoekopdrachten
Als zoekopdrachten moeten zoekfrasen worden opgegeven, precies zoals ze rechtstreeks in het zoekformulier van Seznam zouden worden ingevoerd, bijvoorbeeld:
test query
ramen Amsterdam
site:a-parser.com
inurl:auto
Query-substituties
U kunt ingebouwde macro's gebruiken voor query-multiplicatie, bijvoorbeeld als we een zeer grote database met forums willen verkrijgen, geven we enkele basiszoekopdrachten op in verschillende talen:
forum
forum
foro
论坛
In het query-formaat geven we het doorlopen van tekens aan van a tot zzzz, deze methode maakt het mogelijk om de zoekresultaten maximaal te roteren en veel nieuwe unieke resultaten te verkrijgen:
$query {az:a:zzzz}
Deze macro zal 475254 extra zoekopdrachten maken voor elke oorspronkelijke zoekopdracht, wat in totaal 4 x 475254 = 1901016 zoekopdrachten oplevert, een indrukwekkend getal, maar dat is geen enkel probleem voor A-Parser. Bij een snelheid van 2000 zoekopdrachten per minuut wordt een dergelijke taak in slechts 16 uur verwerkt.
Gebruik van operators
U kunt zoekoperators in het query-formaat gebruiken, zodat deze automatisch aan elke zoekopdracht uit uw lijst worden toegevoegd:
site:$query
Voorbeelden van resultaatuitvoer
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een willekeurige vorm kunnen worden uitgevoerd, evenals in gestructureerde formaten zoals CSV of JSON
Export van linklijst
Links + ankers + snippets met positieweergave
Uitvoer van links, ankers en snippets in een CSV-tabel
Opslaan in SQL-formaat
Resultaten dumpen naar JSON
Verwerking van resultaten
A-Parser maakt het mogelijk om resultaten direct tijdens de gegevensextractie te verwerken, in deze sectie hebben we de meest populaire cases voor de Seznam scraper opgenomen
Link-deduplicatie
Link-deduplicatie per domein
Domeinen extraheren
Tags verwijderen uit ankers en snippets
Links filteren op aanwezigheid
Mogelijke instellingen
| Naam parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Pages count | 5 | Aantal pagina's om te scrapen (van 1 tot 50) |
| Links per page | 10 | Aantal links op één pagina (10 / 20) |