Pular para o conteúdo principal

Reddit::PostInfo - scraper de informações de postagens no Reddit

SE::Quora

Visão geral do scraper Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - scraper de informações de posts no Reddit.

Coleta informações sobre a postagem, incluindo comentários.

Você pode usar a multiplicação automática de consultas, substituição de subconsultas de arquivos, busca por combinações alfanuméricas e listas para obter o máximo de resultados possível.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados do scraper Reddit::PostInfo para uso futuro (presets), definir cronogramas de extração de dados e muito mais.

A preservação dos resultados é possível no formato e estrutura que você necessita, graças ao poderoso modelo integrado Template Toolkit que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Dados coletados

  • Link para a postagem
  • Título e rótulo (flair)
  • Classificação, número de comentários e número de prêmios
  • Data de criação
  • Comunidade na qual a postagem foi publicada
  • Autor e seu rótulo (flair)
  • Conteúdo da postagem: texto em markdown, link para conteúdo de mídia e link para recurso externo
  • Se a postagem é publicitária

Array de comentários:

  • ID
  • ID do pai
  • Link
  • Autor
  • Texto (limpo de tags)
  • Texto (com tags)

Recursos

  • Possibilidade de limitar o número de comentários para extração de dados

Consultas

Um tipo de consulta é suportado:

Exemplo:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

Como resultado, por padrão, serão exibidas informações sobre a postagem sem comentários

Opções de exibição de resultados

O A-Parser suporta formatação flexível de resultados graças ao modelo integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.

Configurações possíveis

ParâmetroValor padrãoDescrição
Max comments count50Quantidade de comentários para extração de dados