Ir al contenido principal

Reddit::Comments - extractor de comentarios en Reddit

SE::Quora

Descripción del extractor Reddit::Comments

Reddit::CommentsReddit::Comments - extractor de mensajes en Reddit.

Recopila una lista de comentarios y una gran cantidad de información para cada uno de ellos desde el servicio del mismo nombre.

Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la iteración de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.

La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Reddit::Posts para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más.

Es posible guardar los resultados en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.

Datos recopilados

Matriz de comentarios:

  • Enlace al comentario
  • Contenido del comentario (en markdown)
  • Calificación y número de premios
  • Fecha de creación del comentario
  • Autor del comentario y su etiqueta (flair)
  • Enlace a la publicación a la que pertenece el comentario
  • Título de la publicación y su etiqueta (flair)
  • Calificación de la publicación, número de comentarios y número de premios
  • Fecha de creación de la publicación
  • Comunidad en la que se publicó el post
  • Autor de la publicación y su etiqueta (flair)
  • Contenido de la publicación: texto en markdown, enlace al contenido multimedia y enlace a un recurso externo

Características

  • Especificación del número de páginas para la extracción de datos
  • Especificación del método de ordenación de los resultados
  • Posibilidad de realizar la extracción de datos dentro de una comunidad específica

Casos de uso

  • Cualquier escenario donde se requiera recopilar comentarios dejados en mensajes de Reddit

Consultas

Se admiten 2 variantes de consultas:

Palabras clave

Ejemplo:

wordpress features
parser

Por defecto, el resultado mostrará una lista de enlaces a los comentarios, por ejemplo:

https://www.reddit.com/r/node/comments/14lmqbq/how_to_work_with_xlsx_files/jpy3r5a/
https://www.reddit.com/r/StardewValley/comments/14qidly/having_problems_installing_stardew_valley/jqnalwz/
https://www.reddit.com/r/elasticsearch/comments/14pr86i/how_to_parsing_this_lin_logstash/jqkstjw/
https://www.reddit.com/r/vexillology/comments/14fh5th/flag_of_riga_michigan/jp10w17/
https://www.reddit.com/r/Marvel/comments/14otc3t/hank_pym_is_a_really_humble_guy_the_mighty/jqf27xy/
https://www.reddit.com/r/math/comments/14p1lkg/from_the_perspective_of_you_mathematicians_what/jqgug4q/
https://www.reddit.com/r/Wordpress/comments/14okx06/help_looking_for_a_specific_plugin_for_booking/jqhwtu5/
https://www.reddit.com/r/osr/comments/13u8g7s/difference_between_whitebox_whitehack/jlzhthi/
...

Palabras clave y enlaces a comunidades

El extractor admite la búsqueda por palabra clave en una comunidad específica. Para ello, en la consulta debe indicar la palabra clave y, tras un espacio, el enlace a la comunidad. Ejemplo:

jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/

Por defecto, el resultado mostrará una lista de enlaces a las publicaciones, por ejemplo:

https://www.reddit.com/r/atheism/comments/14dp1rv/sen_josh_hawley_shares_his_mindblowingly_stupid/jor20zd/
https://www.reddit.com/r/atheism/comments/14kt69e/why_do_my_christian_friends_view_my_atheism_as_an/jpsgbe5/
https://www.reddit.com/r/atheism/comments/14p6yir/finally_happened_the_one_babysitter_we_can_get/jqhk48s/
https://www.reddit.com/r/Audi/comments/14nyn9m/excuse_me_we_late/jqbdu2a/
https://www.reddit.com/r/Audi/comments/14oqxce/talk_me_inout_of_buying_this_gorgeous_audi_s5/jqev0p6/
https://www.reddit.com/r/Audi/comments/14pqr8a/is_this_a_good_deal_in_your_guys_opinions/jql4wnb/
...

Opciones de salida de resultados

A-Parser admite un formato flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite presentar los resultados en cualquier forma, así como en formatos estructurados como CSV o JSON.

Configuraciones posibles

ParámetroValor por defectoDescripción
Pages count5Número de páginas de resultados
SortRelevanceOrdenación de los resultados