Перейти к основному содержимому

Reddit::PostInfo - парсер информации о посте на Reddit

SE::Quora

Обзор парсера Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - парсер информации о посте на Reddit.

Собирает информацию о посте, в том числе комментарии.

Вы можете использовать автоматическое размножение запросов, подстановку подзапросов из файлов, перебор цифро-буквенных комбинаций и списков для получения максимально возможного количества результатов.

Функционал A-Parser позволяет сохранять настройки парсинга парсера Reddit::PostInfo для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

Собираемые данные

  • Ссылка на пост
  • Заголовок и метка (flair)
  • Рейтинг, количество комментариев и количество наград
  • Дата создания
  • Комьюнити, в котором опубликован пост
  • Автор и его метка (flair)
  • Содержимое поста: текст в markdown, ссылка на медиа содержимое и ссылка на внешний ресурс
  • Является ли пост рекламным

Массив комментариев:

  • Айди
  • Айди родителя
  • Ссылка
  • Автор
  • Текст (очищенный от тегов)
  • Текст (с тегами)

Возможности

  • Возможность ограничивать количество комментариев для парсинга

Запросы

Поддерживается один вариант запросов:

Ссылки на посты

Пример:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

В результате по-умолчанию будет выведена информация о посте без комментариев

Варианты вывода результатов

A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON.

Возможные настройки

ПараметрЗначение по умолчаниюОписание
Max comments count50Количество комментариев для парсинга