Ir al contenido principal

Reddit::PostInfo - extractor de información de publicaciones en Reddit

SE::Quora

Revisión del extractor Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - extractor de información de publicaciones en Reddit.

Recopila información sobre la publicación, incluidos los comentarios.

Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.

La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Reddit::PostInfo para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.

Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.

Datos recopilados

  • Enlace a la publicación
  • Título y etiqueta (flair)
  • Calificación, número de comentarios y número de premios
  • Fecha de creación
  • Comunidad en la que se publicó el post
  • Autor y su etiqueta (flair)
  • Contenido de la publicación: texto en markdown, enlace a contenido multimedia y enlace a recurso externo
  • Si la publicación es publicitaria

Matriz de comentarios:

  • ID
  • ID del padre
  • Enlace
  • Autor
  • Texto (limpio de etiquetas)
  • Texto (con etiquetas)

Características

  • Posibilidad de limitar el número de comentarios para la extracción de datos

Consultas

Se admite una variante de consultas:

Enlaces a publicaciones

Ejemplo:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

Como resultado, por defecto se mostrará información sobre la publicación sin comentarios

Opciones de salida de resultados

A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON.

Configuraciones posibles

ParámetroValor por defectoDescripción
Max comments count50Cantidad de comentarios para la extracción de datos