Reddit::Comments - scraper voor reacties op Reddit

Overzicht van de scraper Reddit::Comments
Reddit::Comments - scraper voor berichten op Reddit.Verzamelt een lijst met reacties en een grote hoeveelheid informatie voor elk daarvan van de gelijknamige service.
U kunt automatische query-multiplicatie, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen.
De functionaliteit van A-Parser maakt het mogelijk om instellingen voor de scraper Reddit::Posts op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
Array van reacties:
- Link naar de reactie
- Inhoud van de reactie (in markdown)
- Score en aantal awards
- Aanmaakdatum van de reactie
- Auteur van de reactie en diens label (flair)
- Link naar de post waar de reactie bij hoort
- Titel van de post en diens label (flair)
- Score van de post, aantal reacties erop en aantal awards
- Aanmaakdatum van de post
- Community waarin de post is gepubliceerd
- Auteur van de post en diens label (flair)
- Inhoud van de post: tekst in markdown, link naar media-inhoud en link naar externe bron
Mogelijkheden
- Opgeven van het aantal pagina's voor gegevensextractie
- Opgeven van de sorteermethode voor resultaten
- Mogelijkheid om binnen een specifieke community te scrapen
Toepassingen
- Alle scenario's waarbij het verzamelen van reacties op Reddit-berichten vereist is
Query's
Er worden 2 varianten van query's ondersteund:
Trefwoorden
Voorbeeld:
wordpress features
parser
In het resultaat wordt standaard een lijst met links naar reacties weergegeven, bijvoorbeeld:
https://www.reddit.com/r/node/comments/14lmqbq/how_to_work_with_xlsx_files/jpy3r5a/
https://www.reddit.com/r/StardewValley/comments/14qidly/having_problems_installing_stardew_valley/jqnalwz/
https://www.reddit.com/r/elasticsearch/comments/14pr86i/how_to_parsing_this_lin_logstash/jqkstjw/
https://www.reddit.com/r/vexillology/comments/14fh5th/flag_of_riga_michigan/jp10w17/
https://www.reddit.com/r/Marvel/comments/14otc3t/hank_pym_is_a_really_humble_guy_the_mighty/jqf27xy/
https://www.reddit.com/r/math/comments/14p1lkg/from_the_perspective_of_you_mathematicians_what/jqgug4q/
https://www.reddit.com/r/Wordpress/comments/14okx06/help_looking_for_a_specific_plugin_for_booking/jqhwtu5/
https://www.reddit.com/r/osr/comments/13u8g7s/difference_between_whitebox_whitehack/jlzhthi/
...
Trefwoorden en links naar communities
De scraper ondersteunt het zoeken op trefwoord in een specifieke community. Hiervoor moet in de query het trefwoord worden opgegeven, gevolgd door een spatie en de link naar de community. Voorbeeld:
jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/
In het resultaat wordt standaard een lijst met links naar posts weergegeven, bijvoorbeeld:
https://www.reddit.com/r/atheism/comments/14dp1rv/sen_josh_hawley_shares_his_mindblowingly_stupid/jor20zd/
https://www.reddit.com/r/atheism/comments/14kt69e/why_do_my_christian_friends_view_my_atheism_as_an/jpsgbe5/
https://www.reddit.com/r/atheism/comments/14p6yir/finally_happened_the_one_babysitter_we_can_get/jqhk48s/
https://www.reddit.com/r/Audi/comments/14nyn9m/excuse_me_we_late/jqbdu2a/
https://www.reddit.com/r/Audi/comments/14oqxce/talk_me_inout_of_buying_this_gorgeous_audi_s5/jqev0p6/
https://www.reddit.com/r/Audi/comments/14pqr8a/is_this_a_good_deal_in_your_guys_opinions/jql4wnb/
...
Opties voor resultaatweergave
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in elke gewenste vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Pages count | 5 | Aantal resultaatpagina's |
| Sort | Relevance | Sortering van resultaten |