Reddit::PostInfo - парсер информации о посте на Reddit
Обзор парсера Reddit::PostInfo
Reddit::PostInfo - парсер информации о посте на Reddit.Собирает информацию о посте, в том числе комментарии.
Вы можете использовать автоматическое размножение запросов, подстановку подзапросов из файлов, перебор цифро-буквенных комбинаций и списков для получения максимально возможного количества результатов.
Функционал A-Parser позволяет сохранять настройки парсинга парсера Reddit::PostInfo для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Ссылка на пост
- Заголовок и метка (flair)
- Рейтинг, количество комментариев и количество наград
- Дата создания
- Комьюнити, в котором опубликован пост
- Автор и его метка (flair)
- Содержимое поста: текст в markdown, ссылка на медиа содержимое и ссылка на внешний ресурс
- Является ли пост рекламным
Массив комментариев:
- Айди
- Айди родителя
- Ссылка
- Автор
- Текст (очищенный от тегов)
- Текст (с тегами)
Возможности
- Возможность ограничивать количество комментариев для парсинга
Запросы
Поддерживается один вариант запросов:
Ссылки на посты
Пример:
https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/
В результате по-умолчанию будет выведена информация о посте без комментариев
Варианты вывода результатов
A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON.
Возможные настройки
Параметр | Значение по умолчанию | Описание |
---|---|---|
Max comments count | 50 | Количество комментариев для парсинга |