Перейти к основному содержимому

SE::Yandex::Balaboba - парсер текстов с Balaboba

SE::Yandex::Balaboba

Обзор парсера

SE::Yandex::BalabobaSE::Yandex::Balaboba - парсер текстов с Balaboba.

Получает тексты из одноимённого сервиса.

Вы можете использовать автоматическое размножение запросов, подстановку подзапросов из файлов, перебор цифро-буквенных комбинаций и списков для получения максимально возможного количества результатов.

Функционал A-Parser позволяет сохранять настройки парсинга парсера SE::Yandex::Balaboba для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

Собираемые данные

  • Сгенерированный текст
  • Стиль по которому был сгенерирован текст
  • Ссылку на картинку

Возможности

  • Парсить уникальные тексты с возможностью выбора стиля текста (параметр Style): Рецепты (RU), Короткие истории (RU), Recipies (EN) и другие
  • Выбор номер стиля который можно увидеть в брузере и парсить с нужным стилем текста если такового нет в опции выбора стиля (параметр ID of custom style)

Варианты использования

  • Массовый сбор уникальных текстов

Запросы

В качестве запросов необходимо указывать фразы с которых начнётся генерация, например:

Жили были

Подстановки запросов

Вы можете использовать встроенные макросы для автоматической подстановки подзапросов из файлов, например мы хотим к кажому запросу добавить какой-то список других слов, укажем несколько основных запросов:

Жили были
Fantasy
Tower defense

В формате запросов укажем макрос подстановки дополнительных слов из файла keywords.txt, данный метод позволяет увеличить вариативность запросов многократно:

{subs:keywords} $query 

Данный макрос создаст столько же дополнительных запросов сколько их находится в файле на каждый исходный поисковый запрос, что в сумме даст [количество исходных запросов] х [количество запросов в файле Keywords] = [общее количество запросов] в результате работы макроса.

Например, если в файл keywords.txt будет содержать:

free
online

В итоге макрос подстановок превратит 3 основных запроса в 6:

free fantasy
online fantasy
free tower defense
online tower defense
free rpg
online rpg

Варианты вывода результатов

A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON

Вывод по умолчанию

Формат результата:

$style: $text\n

Пример результата:

Без стиля (RU): Жили были три поросенка, три брата.
И у каждого из них был дом.
Это были очень дружные поросята.
Они помогали друг другу во всем, а если что-нибудь случалось с одним из них, то другой брат всегда приходил на помощь.
Однажды пошел сильный снег, и братья решили спрятаться от него в своих домах.
Но тут из-за угла вышел серый волк.
Он был голоден и увидел, что в домах не было дверей.
Тогда волк решил зайти в первый дом и съесть поросенка.
Волк быстро открыл дверь и заглянул туда.

Возможные настройки

ПараметрЗначение по умолчаниюОписание
StyleRandom (All languages)Выбор стиля текста
ID of custom styleУстановить номер стиля для генерации текста
Repeat if Balaboba reports about errorПовторять попытки парсинга если Balaboba показал сообщение об ошибке
Repeat if Balaboba reports about bad queryПовторять попытки парсинга если Balaboba показал сообщение из-за неверного запроса