SE::Yandex::Balaboba - Parser für Texte von Balaboba

Übersicht des Parsers
SE::Yandex::Balaboba - Parser für Texte von Balaboba.Bezieht Texte vom gleichnamigen Dienst.
Sie können die automatische Abfragevervielfachung, die Substitution von Unterabfragen aus Dateien, die Iteration von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten.
Die Funktionalität von A-Parser ermöglicht es, die Datenerfassungseinstellungen des Parsers SE::Yandex::Balaboba für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.
Das Speichern der Ergebnisse ist in jeder von Ihnen benötigten Form und Struktur möglich, dank des integrierten leistungsstarken Template-Engines Template Toolkit, das es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.
Gesammelte Daten
- Generierter Text
- Stil, nach dem der Text generiert wurde
- Link zum Bild
Funktionen
- Einzigartige Texte extrahieren mit der Möglichkeit, den Textstil zu wählen (Parameter Style):
Rezepte (RU),Kurzgeschichten (RU),Recipies (EN)und andere - Auswahl der Stilnummer, die im Browser eingesehen werden kann, um mit dem gewünschten Textstil zu extrahieren, falls dieser nicht in der Stil-Auswahloption vorhanden ist (Parameter ID of custom style)
Anwendungsfälle
- Massensammlung von einzigartigen Texten
Abfragen
Als Abfragen müssen Phrasen angegeben werden, mit denen die Generierung beginnt, zum Beispiel:
Es waren einmal
Abfrage-Substitutionen
Sie können integrierte Makros für die automatische Substitution von Unterabfragen aus Dateien verwenden. Wenn wir zum Beispiel zu jeder Abfrage eine Liste anderer Wörter hinzufügen möchten, geben wir einige Hauptabfragen an:
Es waren einmal
Fantasy
Tower defense
Im Abfrageformat geben wir das Makro zur Substitution zusätzlicher Wörter aus der Datei keywords.txt an. Diese Methode ermöglicht es, die Variabilität der Abfragen um ein Vielfaches zu erhöhen:
{subs:keywords} $query
Dieses Makro erstellt für jede ursprüngliche Suchabfrage so viele zusätzliche Abfragen, wie in der Datei enthalten sind, was in der Summe [Anzahl der ursprünglichen Abfragen] x [Anzahl der Abfragen in der Datei Keywords] = [Gesamtanzahl der Abfragen] als Ergebnis der Makroarbeit ergibt.
Wenn die Datei keywords.txt zum Beispiel folgendes enthält:
free
online
Am Ende verwandelt das Substitutionsmakro 3 Hauptabfragen in 6:
free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg
Beispiele für die Ergebnisausgabe
A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank des integrierten Template-Engines Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert auszugeben, zum Beispiel als CSV oder JSON.
Standardausgabe
Ergebnisformat:
$style: $text\n
Beispielergebnis:
Ohne Stil (RU): Es waren einmal drei kleine Schweinchen, drei Brüder.
Und jeder von ihnen hatte ein Haus.
Es waren sehr freundliche Schweinchen.
Sie halfen einander in allem, und wenn einem von ihnen etwas passierte, kam der andere Bruder immer zu Hilfe.
Eines Tages fiel starker Schnee, und die Brüder beschlossen, sich davor in ihren Häusern zu verstecken.
Doch da kam ein grauer Wolf um die Ecke.
Er war hungrig und sah, dass die Häuser keine Türen hatten.
Da beschloss der Wolf, in das erste Haus zu gehen und das Schweinchen zu fressen.
Der Wolf öffnete schnell die Tür und schaute hinein.
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Style | Random (All languages) | Auswahl des Textstils |
| ID of custom style | Stilnummer für die Textgenerierung festlegen | |
| Repeat if Balaboba reports about error | ☑ | Datenerfassung wiederholen, wenn Balaboba eine Fehlermeldung anzeigt |
| Repeat if Balaboba reports about bad query | ☑ | Datenerfassung wiederholen, wenn Balaboba eine Meldung aufgrund einer ungültigen Abfrage anzeigt |