Zum Hauptinhalt springen

SE::Startpage - Parser für startpage.com Suchergebnisse

Startpage

Übersicht über den Parser

Parser für die Startpage-Suchergebnisse. Dank des Startpage-Parsers können Sie große Datenbanken mit Links erhalten, die für die weitere Verwendung bereit sind. Sie können Abfragen in derselben Form verwenden, in der Sie sie in die Startpage-Suchleiste eingeben, einschließlich Suchoperatoren (site, inurl usw.).

Die Funktionalität von A-Parser ermöglicht es Ihnen, die Datenerfassung-Einstellungen für den Startpage-Parser zur späteren Verwendung zu speichern (Presets), einen Zeitplan für die Datenerfassung festzulegen und vieles mehr. Sie können die automatische Abfragevervielfachung, die Ersetzung von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erzielen.

Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Gesammelte Daten

  • Links, Anker und Snippets aus den Suchergebnissen
Gesammelte Daten

Funktionen

  • Unterstützt die Auswahl von Land, Suchsprache und Seitensprache
  • Möglichkeit zur gemeinsamen oder getrennten Ausgabe von Ankern, Links und Snippets
  • Möglichkeit zur Angabe der Anzahl der ausgegebenen Ergebnisse
  • Angabe der Ergebnisgröße (10 oder 20 Ergebnisse)

Anwendungsfälle

  • Sammeln von Datenbanken mit Links, Ankern und Snippets
  • Erhalt einer Liste von Websites, die am häufigsten in Suchmaschinen erwähnt werden
  • Alle anderen Anwendungsfälle zur Informationsbeschaffung

Abfragen

Als Abfragen werden Wörter, Phrasen und Wortkombinationen in der gleichen Form angegeben, wie sie in die Suchmaschine eingegeben werden. Beispiel:

test   
site:http://test.ru
rote Rosen

Abfrage-Ersetzungen

Sie können integrierte Makros zur Abfragevervielfachung verwenden. Wenn wir beispielsweise eine sehr große Forendatenbank erhalten möchten, geben wir einige Hauptabfragen in verschiedenen Sprachen an:

forum
Forum
foro
论坛

Im Abfrageformat geben wir das Durchlaufen von Zeichen von a bis zzzz an. Diese Methode ermöglicht es, die Suchergebnisse maximal zu rotieren und viele neue, einzigartige Ergebnisse zu erhalten:

$query {az:a:zzzz}

Dieser Makro erstellt 475254 zusätzliche Abfragen für jede ursprüngliche Suchanfrage, was insgesamt 4 x 475254 = 1901016 Suchanfragen ergibt. Diese beeindruckende Zahl ist für A-Parser absolut kein Problem. Bei einer Geschwindigkeit von 2000 Abfragen pro Minute wird eine solche Aufgabe in nur 16 Stunden verarbeitet.

Verwendung von Operatoren

Sie können Suchoperatoren im Abfrageformat verwenden, sodass diese automatisch zu jeder Abfrage in Ihrer Liste hinzugefügt werden:

site:$query

Beispiele für die Ergebnisausgabe

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, was die Ausgabe in beliebiger Form sowie in strukturierter Form wie CSV oder JSON ermöglicht.

Export einer Linkliste

Analog wie bei SE::Google.

Analog wie bei SE::Google.

Analog wie bei SE::Google.

Speichern im SQL-Format

Analog wie bei SE::Google.

Ergebnis-Dump in JSON

Analog wie bei SE::Google.

Ergebnisverarbeitung

A-Parser ermöglicht es, Ergebnisse direkt während der Datenerfassung zu verarbeiten. In diesem Abschnitt haben wir die beliebtesten Anwendungsfälle für den Startpage-Parser aufgeführt.

Analog wie bei SE::Google.

Analog wie bei SE::Google.

Domain-Extraktion

Analog wie bei SE::Google.

Entfernen von Tags aus Ankern und Snippets

Analog wie bei SE::Google.

Analog wie bei SE::Google.

Mögliche Einstellungen

Name des ParametersStandardwertBeschreibung
Pages count5Anzahl der zu parsenden Seiten (von 1 bis 50)
Family filterFilter depending on searchAuswahl der Filterstufe (Filter all results / Filter depending on search / Do not filter my results)
PeriodAny timeAuswahl des Zeitraums (Any time / Past 24 hours / Past week / Past month / Past year)
Links per page10Ergebnisgröße (10 / 20)
Results languageEnglishAuswahl der Ergebnissprache
Page languageEnglishAuswahl der Seitensprache
Search countryAllAuswahl des Landes, von dem aus die Suche durchgeführt wird