Reddit::Comments - extractor de comentarios en Reddit

Descripción del extractor Reddit::Comments
Reddit::Comments - extractor de mensajes en Reddit.Recopila una lista de comentarios y una gran cantidad de información para cada uno de ellos desde el servicio del mismo nombre.
Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Reddit::Posts para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.
Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Datos recopilados
Matriz de comentarios:
- Enlace al comentario
- Contenido del comentario (en markdown)
- Calificación y número de premios
- Fecha de creación del comentario
- Autor del comentario y su etiqueta (flair)
- Enlace a la publicación a la que pertenece el comentario
- Título de la publicación y su etiqueta (flair)
- Calificación de la publicación, número de comentarios y número de premios
- Fecha de creación de la publicación
- Comunidad en la que se publicó el post
- Autor de la publicación y su etiqueta (flair)
- Contenido de la publicación: texto en markdown, enlace al contenido multimedia y enlace a un recurso externo
Características
- Especificación del número de páginas para la extracción de datos
- Especificación del método de ordenación de los resultados
- Posibilidad de realizar la extracción de datos dentro de una comunidad específica
Casos de uso
- Cualquier escenario donde se requiera recopilar comentarios dejados en mensajes de Reddit
Consultas
Se admiten 2 variantes de consultas:
Palabras clave
Ejemplo:
wordpress features
parser
Por defecto, el resultado mostrará una lista de enlaces a los comentarios, por ejemplo:
https://www.reddit.com/r/node/comments/14lmqbq/how_to_work_with_xlsx_files/jpy3r5a/
https://www.reddit.com/r/StardewValley/comments/14qidly/having_problems_installing_stardew_valley/jqnalwz/
https://www.reddit.com/r/elasticsearch/comments/14pr86i/how_to_parsing_this_lin_logstash/jqkstjw/
https://www.reddit.com/r/vexillology/comments/14fh5th/flag_of_riga_michigan/jp10w17/
https://www.reddit.com/r/Marvel/comments/14otc3t/hank_pym_is_a_really_humble_guy_the_mighty/jqf27xy/
https://www.reddit.com/r/math/comments/14p1lkg/from_the_perspective_of_you_mathematicians_what/jqgug4q/
https://www.reddit.com/r/Wordpress/comments/14okx06/help_looking_for_a_specific_plugin_for_booking/jqhwtu5/
https://www.reddit.com/r/osr/comments/13u8g7s/difference_between_whitebox_whitehack/jlzhthi/
...
Palabras clave y enlaces a comunidades
El extractor admite la búsqueda por palabra clave en una comunidad específica. Para ello, en la consulta debe indicar la palabra clave y, tras un espacio, el enlace a la comunidad. Ejemplo:
jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/
Por defecto, el resultado mostrará una lista de enlaces a las publicaciones, por ejemplo:
https://www.reddit.com/r/atheism/comments/14dp1rv/sen_josh_hawley_shares_his_mindblowingly_stupid/jor20zd/
https://www.reddit.com/r/atheism/comments/14kt69e/why_do_my_christian_friends_view_my_atheism_as_an/jpsgbe5/
https://www.reddit.com/r/atheism/comments/14p6yir/finally_happened_the_one_babysitter_we_can_get/jqhk48s/
https://www.reddit.com/r/Audi/comments/14nyn9m/excuse_me_we_late/jqbdu2a/
https://www.reddit.com/r/Audi/comments/14oqxce/talk_me_inout_of_buying_this_gorgeous_audi_s5/jqev0p6/
https://www.reddit.com/r/Audi/comments/14pqr8a/is_this_a_good_deal_in_your_guys_opinions/jql4wnb/
...
Opciones de salida de resultados
A-Parser admite un formato flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite presentar los resultados en cualquier forma, así como en formatos estructurados como CSV o JSON.
Configuraciones posibles
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 5 | Número de páginas de resultados |
| Sort | Relevance | Ordenación de los resultados |