Ga naar de hoofdinhoud

Reddit::Comments - scraper voor reacties op Reddit

SE::Quora

Overzicht van de scraper Reddit::Comments

Reddit::CommentsReddit::Comments - scraper voor berichten op Reddit.

Verzamelt een lijst met reacties en een grote hoeveelheid informatie voor elk daarvan van de gelijknamige service.

U kunt automatische query-multiplicatie, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen.

De functionaliteit van A-Parser maakt het mogelijk om instellingen voor de scraper Reddit::Posts op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

Array van reacties:

  • Link naar de reactie
  • Inhoud van de reactie (in markdown)
  • Score en aantal awards
  • Aanmaakdatum van de reactie
  • Auteur van de reactie en diens label (flair)
  • Link naar de post waar de reactie bij hoort
  • Titel van de post en diens label (flair)
  • Score van de post, aantal reacties erop en aantal awards
  • Aanmaakdatum van de post
  • Community waarin de post is gepubliceerd
  • Auteur van de post en diens label (flair)
  • Inhoud van de post: tekst in markdown, link naar media-inhoud en link naar externe bron

Mogelijkheden

  • Opgeven van het aantal pagina's voor gegevensextractie
  • Opgeven van de sorteermethode voor resultaten
  • Mogelijkheid om binnen een specifieke community te scrapen

Toepassingen

  • Alle scenario's waarbij het verzamelen van reacties op Reddit-berichten vereist is

Query's

Er worden 2 varianten van query's ondersteund:

Trefwoorden

Voorbeeld:

wordpress features
parser

In het resultaat wordt standaard een lijst met links naar reacties weergegeven, bijvoorbeeld:

https://www.reddit.com/r/node/comments/14lmqbq/how_to_work_with_xlsx_files/jpy3r5a/
https://www.reddit.com/r/StardewValley/comments/14qidly/having_problems_installing_stardew_valley/jqnalwz/
https://www.reddit.com/r/elasticsearch/comments/14pr86i/how_to_parsing_this_lin_logstash/jqkstjw/
https://www.reddit.com/r/vexillology/comments/14fh5th/flag_of_riga_michigan/jp10w17/
https://www.reddit.com/r/Marvel/comments/14otc3t/hank_pym_is_a_really_humble_guy_the_mighty/jqf27xy/
https://www.reddit.com/r/math/comments/14p1lkg/from_the_perspective_of_you_mathematicians_what/jqgug4q/
https://www.reddit.com/r/Wordpress/comments/14okx06/help_looking_for_a_specific_plugin_for_booking/jqhwtu5/
https://www.reddit.com/r/osr/comments/13u8g7s/difference_between_whitebox_whitehack/jlzhthi/
...

De scraper ondersteunt het zoeken op trefwoord in een specifieke community. Hiervoor moet in de query het trefwoord worden opgegeven, gevolgd door een spatie en de link naar de community. Voorbeeld:

jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/

In het resultaat wordt standaard een lijst met links naar posts weergegeven, bijvoorbeeld:

https://www.reddit.com/r/atheism/comments/14dp1rv/sen_josh_hawley_shares_his_mindblowingly_stupid/jor20zd/
https://www.reddit.com/r/atheism/comments/14kt69e/why_do_my_christian_friends_view_my_atheism_as_an/jpsgbe5/
https://www.reddit.com/r/atheism/comments/14p6yir/finally_happened_the_one_babysitter_we_can_get/jqhk48s/
https://www.reddit.com/r/Audi/comments/14nyn9m/excuse_me_we_late/jqbdu2a/
https://www.reddit.com/r/Audi/comments/14oqxce/talk_me_inout_of_buying_this_gorgeous_audi_s5/jqev0p6/
https://www.reddit.com/r/Audi/comments/14pqr8a/is_this_a_good_deal_in_your_guys_opinions/jql4wnb/
...

Opties voor resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in elke gewenste vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
Pages count5Aantal resultaatpagina's
SortRelevanceSortering van resultaten