Reddit::PostInfo - extractor de información de publicaciones en Reddit

Revisión del extractor Reddit::PostInfo
Reddit::PostInfo - extractor de información de publicaciones en Reddit.Recopila información sobre la publicación, incluidos los comentarios.
Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Reddit::PostInfo para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.
Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Datos recopilados
- Enlace a la publicación
- Título y etiqueta (flair)
- Calificación, número de comentarios y número de premios
- Fecha de creación
- Comunidad en la que se publicó el post
- Autor y su etiqueta (flair)
- Contenido de la publicación: texto en markdown, enlace a contenido multimedia y enlace a recurso externo
- Si la publicación es publicitaria
Matriz de comentarios:
- ID
- ID del padre
- Enlace
- Autor
- Texto (limpio de etiquetas)
- Texto (con etiquetas)
Características
- Posibilidad de limitar el número de comentarios para la extracción de datos
Consultas
Se admite una variante de consultas:
Enlaces a publicaciones
Ejemplo:
https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/
Como resultado, por defecto se mostrará información sobre la publicación sin comentarios
Opciones de salida de resultados
A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON.
Configuraciones posibles
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| Max comments count | 50 | Cantidad de comentarios para la extracción de datos |