Zum Hauptinhalt springen

SE::Yandex::Balaboba - Parser für Texte von Balaboba

SE::Yandex::Balaboba

Übersicht des Parsers

SE::Yandex::BalabobaSE::Yandex::Balaboba - Parser für Texte von Balaboba.

Bezieht Texte vom gleichnamigen Dienst.

Sie können die automatische Abfragevervielfachung, die Substitution von Unterabfragen aus Dateien, die Iteration von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten.

Die Funktionalität von A-Parser ermöglicht es, die Datenerfassungseinstellungen des Parsers SE::Yandex::Balaboba für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.

Das Speichern der Ergebnisse ist in jeder von Ihnen benötigten Form und Struktur möglich, dank des integrierten leistungsstarken Template-Engines Template Toolkit, das es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Gesammelte Daten

  • Generierter Text
  • Stil, nach dem der Text generiert wurde
  • Link zum Bild

Funktionen

  • Einzigartige Texte extrahieren mit der Möglichkeit, den Textstil zu wählen (Parameter Style): Rezepte (RU), Kurzgeschichten (RU), Recipies (EN) und andere
  • Auswahl der Stilnummer, die im Browser eingesehen werden kann, um mit dem gewünschten Textstil zu extrahieren, falls dieser nicht in der Stil-Auswahloption vorhanden ist (Parameter ID of custom style)

Anwendungsfälle

  • Massensammlung von einzigartigen Texten

Abfragen

Als Abfragen müssen Phrasen angegeben werden, mit denen die Generierung beginnt, zum Beispiel:

Es waren einmal

Abfrage-Substitutionen

Sie können integrierte Makros für die automatische Substitution von Unterabfragen aus Dateien verwenden. Wenn wir zum Beispiel zu jeder Abfrage eine Liste anderer Wörter hinzufügen möchten, geben wir einige Hauptabfragen an:

Es waren einmal
Fantasy
Tower defense

Im Abfrageformat geben wir das Makro zur Substitution zusätzlicher Wörter aus der Datei keywords.txt an. Diese Methode ermöglicht es, die Variabilität der Abfragen um ein Vielfaches zu erhöhen:

{subs:keywords} $query 

Dieses Makro erstellt für jede ursprüngliche Suchabfrage so viele zusätzliche Abfragen, wie in der Datei enthalten sind, was in der Summe [Anzahl der ursprünglichen Abfragen] x [Anzahl der Abfragen in der Datei Keywords] = [Gesamtanzahl der Abfragen] als Ergebnis der Makroarbeit ergibt.

Wenn die Datei keywords.txt zum Beispiel folgendes enthält:

free
online

Am Ende verwandelt das Substitutionsmakro 3 Hauptabfragen in 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Beispiele für die Ergebnisausgabe

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank des integrierten Template-Engines Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert auszugeben, zum Beispiel als CSV oder JSON.

Standardausgabe

Ergebnisformat:

$style: $text\n

Beispielergebnis:

Ohne Stil (RU): Es waren einmal drei kleine Schweinchen, drei Brüder.
Und jeder von ihnen hatte ein Haus.
Es waren sehr freundliche Schweinchen.
Sie halfen einander in allem, und wenn einem von ihnen etwas passierte, kam der andere Bruder immer zu Hilfe.
Eines Tages fiel starker Schnee, und die Brüder beschlossen, sich davor in ihren Häusern zu verstecken.
Doch da kam ein grauer Wolf um die Ecke.
Er war hungrig und sah, dass die Häuser keine Türen hatten.
Da beschloss der Wolf, in das erste Haus zu gehen und das Schweinchen zu fressen.
Der Wolf öffnete schnell die Tür und schaute hinein.

Mögliche Einstellungen

ParameterStandardwertBeschreibung
StyleRandom (All languages)Auswahl des Textstils
ID of custom styleStilnummer für die Textgenerierung festlegen
Repeat if Balaboba reports about errorDatenerfassung wiederholen, wenn Balaboba eine Fehlermeldung anzeigt
Repeat if Balaboba reports about bad queryDatenerfassung wiederholen, wenn Balaboba eine Meldung aufgrund einer ungültigen Abfrage anzeigt