Hoppa till huvudinnehåll

Reddit::Comments - scraper för kommentarer på Reddit

SE::Quora

Översikt av scrapern Reddit::Comments

Reddit::CommentsReddit::Comments - scraper för meddelanden på Reddit.

Samlar in en lista över kommentarer och omfattande information för var och en av dem från tjänsten med samma namn.

Du kan använda automatisk multiplikation av frågor, ersättning av underfrågor från filer, iteration av alfanumeriska kombinationer och listor för att få största möjliga mängd resultat.

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för scrapern Reddit::Posts för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer.

Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Data som samlas in

Array med kommentarer:

  • Länk till kommentaren
  • Kommentarstext (i markdown)
  • Betyg och antal utmärkelser
  • Datum då kommentaren skapades
  • Kommentarerens författare och dess etikett (flair)
  • Länk till inlägget som kommentaren tillhör
  • Inläggets titel och dess etikett (flair)
  • Inläggets betyg, antal kommentarer och antal utmärkelser
  • Datum då inlägget skapades
  • Community där inlägget publicerades
  • Inläggets författare och dess etikett (flair)
  • Inläggets innehåll: text i markdown, länk till medieinnehåll och länk till extern resurs

Funktioner

  • Angivelse av antal sidor för dataskrapning
  • Angivelse av sorteringsmetod för resultat
  • Möjlighet att skrapa inom ett specifikt community

Användningsfall

  • Alla scenarier där det krävs att samla in kommentarer som lämnats på inlägg på Reddit

Frågor

Två typer av frågor stöds:

Nyckelord

Exempel:

wordpress features
parser

Som standard kommer resultatet att visa en lista med länkar till kommentarer, till exempel:

https://www.reddit.com/r/node/comments/14lmqbq/how_to_work_with_xlsx_files/jpy3r5a/
https://www.reddit.com/r/StardewValley/comments/14qidly/having_problems_installing_stardew_valley/jqnalwz/
https://www.reddit.com/r/elasticsearch/comments/14pr86i/how_to_parsing_this_lin_logstash/jqkstjw/
https://www.reddit.com/r/vexillology/comments/14fh5th/flag_of_riga_michigan/jp10w17/
https://www.reddit.com/r/Marvel/comments/14otc3t/hank_pym_is_a_really_humble_guy_the_mighty/jqf27xy/
https://www.reddit.com/r/math/comments/14p1lkg/from_the_perspective_of_you_mathematicians_what/jqgug4q/
https://www.reddit.com/r/Wordpress/comments/14okx06/help_looking_for_a_specific_plugin_for_booking/jqhwtu5/
https://www.reddit.com/r/osr/comments/13u8g7s/difference_between_whitebox_whitehack/jlzhthi/
...

Nyckelord och länkar till communities

Scrapern stöder sökning efter nyckelord i ett specifikt community. För att göra detta måste du ange nyckelordet följt av ett mellanslag och länken till communityt i frågan. Exempel:

jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/

Som standard kommer resultatet att visa en lista med länkar till inlägg, till exempel:

https://www.reddit.com/r/atheism/comments/14dp1rv/sen_josh_hawley_shares_his_mindblowingly_stupid/jor20zd/
https://www.reddit.com/r/atheism/comments/14kt69e/why_do_my_christian_friends_view_my_atheism_as_an/jpsgbe5/
https://www.reddit.com/r/atheism/comments/14p6yir/finally_happened_the_one_babysitter_we_can_get/jqhk48s/
https://www.reddit.com/r/Audi/comments/14nyn9m/excuse_me_we_late/jqbdu2a/
https://www.reddit.com/r/Audi/comments/14oqxce/talk_me_inout_of_buying_this_gorgeous_audi_s5/jqev0p6/
https://www.reddit.com/r/Audi/comments/14pqr8a/is_this_a_good_deal_in_your_guys_opinions/jql4wnb/
...

Alternativ för resultatutdata

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att mata ut resultat i valfri form, såväl som i strukturerad form som CSV eller JSON.

Möjliga inställningar

ParameterStandardvärdeBeskrivning
Pages count5Antal resultatsidor
SortRelevanceSortering av resultat