Przejdź do treści głównej

SE::Yandex::Balaboba - scraper tekstów z Balaboba

SE::Yandex::Balaboba

Przegląd scrapera

SE::Yandex::BalabobaSE::Yandex::Balaboba - scraper tekstów z Balaboba.

Pobiera teksty z serwisu o tej samej nazwie.

Możesz używać automatycznego mnożenia zapytań, podstawiania podzapytań z plików, iteracji kombinacji alfanumerycznych oraz list w celu uzyskania maksymalnej możliwej liczby wyników.

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera SE::Yandex::Balaboba do dalszego wykorzystania (presety), ustawiać harmonogram scrapowania i wiele więcej.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, której potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala stosować dodatkową logikę do wyników i wyprowadzać dane w różnych formatach, w tym JSON, SQL i CSV.

Zbierane dane

  • Wygenerowany tekst
  • Styl, według którego tekst został wygenerowany
  • Link do obrazka

Możliwości

  • Scrapowanie unikalnych tekstów z możliwością wyboru stylu tekstu (parametr Style): Przepisy (RU), Krótkie historie (RU), Recipies (EN) i inne
  • Wybór numeru stylu, który można zobaczyć w przeglądarce i scrapowanie z odpowiednim stylem tekstu, jeśli nie ma go w opcjach wyboru stylu (parametr ID of custom style)

Warianty użycia

  • Masowe zbieranie unikalnych tekstów

Zapytania

Jako zapytania należy podawać frazy, od których rozpocznie się generowanie, na przykład:

Dawno, dawno temu

Podstawianie zapytań

Możesz użyć wbudowanych makr do automatycznego podstawiania podzapytań z plików, na przykład chcemy do każdego zapytania dodać listę innych słów, określmy kilka głównych zapytań:

Dawno, dawno temu
Fantasy
Tower defense

W formacie zapytań podamy makro podstawiania dodatkowych słów z pliku keywords.txt, ta metoda pozwala wielokrotnie zwiększyć wariatywność zapytań:

{subs:keywords} $query 

To makro utworzy tyle samo dodatkowych zapytań, ile znajduje się w pliku dla każdego wyjściowego zapytania, co w sumie da [liczba zapytań wyjściowych] x [liczba zapytań w pliku Keywords] = [całkowita liczba zapytań] w wyniku działania makra.

Na przykład, jeśli plik keywords.txt będzie zawierać:

free
online

W rezultacie makro podstawień zamieni 3 główne zapytania w 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Warianty wyprowadzania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w formie ustrukturyzowanej, np. CSV lub JSON

Domyślne wyjście

Format wyniku:

$style: $text\n

Przykład wyniku:

Bez stylu (RU): Dawno, dawno temu żyły trzy świnki, trzej bracia.
I każda z nich miała dom.
To były bardzo zżyte świnki.
Pomagały sobie nawzajem we wszystkim, a jeśli coś działo się z jedną z nich, drugi brat zawsze przychodził z pomocą.
Pewnego dnia spadł gęsty śnieg i bracia postanowili schować się przed nim w swoich domach.
Ale nagle zza rogu wyszedł szary wilk.
Był głodny i zobaczył, że w domach nie było drzwi.
Wtedy wilk postanowił wejść do pierwszego domu i zjeść świnkę.
Wilk szybko otworzył drzwi i zajrzał do środka.

Możliwe ustawienia

ParametrWartość domyślnaOpis
StyleRandom (All languages)Wybór stylu tekstu
ID of custom styleUstaw numer stylu do generowania tekstu
Repeat if Balaboba reports about errorPonawiaj próby scrapowania, jeśli Balaboba wyświetli komunikat o błędzie
Repeat if Balaboba reports about bad queryPonawiaj próby scrapowania, jeśli Balaboba wyświetli komunikat z powodu błędnego zapytania