Reddit::Posts - Reddit-Beiträge Parser

Übersicht des Parsers Reddit::Posts
Reddit::Posts - ein Parser für Beiträge auf Reddit.Sammelt eine Liste von Nachrichten (Posts) und eine Vielzahl von Informationen für jeden von ihnen aus dem gleichnamigen Dienst.
Sie können die automatische Abfragevervielfachung, die Substitution von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten.
Die Funktionalität von A-Parser ermöglicht es Ihnen, die Einstellungen für den Reddit::Posts-Parser für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.
Das Speichern der Ergebnisse ist in jeder von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.
Gesammelte Daten
Array von Nachrichten (Posts):
- Link zum Post
- Titel und Label (Flair)
- Bewertung, Anzahl der Kommentare und Anzahl der Auszeichnungen
- Erstellungsdatum
- Community, in der der Post veröffentlicht wurde
- Autor und sein Label (Flair)
- Inhalt des Posts: Text in Markdown, Link zu Medieninhalten und Link zu einer externen Ressource
- Ob der Post werblich ist
Funktionen
- Angabe der Anzahl der zu scrapenden Seiten
- Angabe der Sortiermethode für die Ergebnisse
- Auswahl des Zeitraums der Ergebnisse
- Möglichkeit, innerhalb einer bestimmten Community zu extrahieren
Anwendungsfälle
- Alle Szenarien, in denen Daten über Nachrichten (Posts) auf Reddit abgerufen werden müssen
Abfragen
Es werden mehrere Abfragevarianten unterstützt:
Links zu Themen
Beispiel:
https://www.reddit.com/t/bitcoin/
https://www.reddit.com/t/kim_kardashian/
Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:
https://www.reddit.com/r/Bitcoin/comments/14nbyy2/i_took_out_a_35000_loan_to_buy_bitcoin_1_year/
https://www.reddit.com/r/CryptoCurrency/comments/14guprs/bitcoin_is_up_75_since_jim_cramer_told_investors/
https://www.reddit.com/r/Bitcoin/comments/14opp2t/this_guy_was_paid_32_bitcoin_to_hold_up_this_sign/
https://www.reddit.com/r/CryptoCurrency/comments/14ivx43/nearly_69_of_all_bitcoin_supply_did_not_move_in/
https://www.reddit.com/r/CryptoCurrency/comments/149vy0o/bitcoin_dips_below_25k_for_the_first_time_in_3/
...
Links zu Communities
Parameter in den Links, die auf Zeit und Sortierung der Ergebnisse hinweisen, werden ebenfalls berücksichtigt, wobei die in den Einstellungen festgelegten ignoriert werden. Beispiel:
https://www.reddit.com/r/nba/
https://www.reddit.com/r/OrlandoMagic/top/?t=month
Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:
https://www.reddit.com/r/OrlandoMagic/comments/14a5br2/
https://www.reddit.com/r/OrlandoMagic/comments/14nqfk1/keep_mo_or_no_mo/
https://www.reddit.com/r/nba/comments/14nfzki/202324_nba_free_agent_tracker/
https://www.reddit.com/user/Grammarly/comments/14ghtld/verbessere_deine_schreibfertigkeit_auf_englisch/
https://www.reddit.com/r/nba/comments/14r4l4s/vernon_dillon_brooks_took_991_shots_last_year_he/
https://www.reddit.com/r/nba/comments/14ql1es/highlight_matt_devlin_inexplicably_yells_punjabi/
https://www.reddit.com/user/TelekomShop/comments/yqkina/der_highspeedhotspot_zum_mitnehmen_die_speedbox/
https://www.reddit.com/r/nba/comments/14qysvi/michael_jordan_with_the_spin_hanging_onehanded/
https://www.reddit.com/r/nba/comments/14qxrep/dwyane_wade_leads_the_redeem_team_with_27_points/
...
Schlüsselwörter
Beispiel:
wordpress features
parser
Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:
https://www.reddit.com/r/ShitpostXIV/comments/14511em/i_am_a_proud_grey_parser/
https://www.reddit.com/r/opengl/comments/147sbjk/4_hours_of_my_obj_parser_so_far/
https://www.reddit.com/r/Compilers/comments/14pi9xh/demystifying_pratt_parsers/
https://www.reddit.com/r/ZETTAHOST/comments/11qdg99/how_to_change_the_wordpress_featured_image_size/
https://www.reddit.com/r/Wordpress/comments/14p1k2p/what_features_is_wordpress_missing_i_want_to_help/
https://www.reddit.com/r/Wordpress/comments/13q8g5x/is_it_possible_and_advisable_to_build_a_website/
...
Schlüsselwörter und Links zu Communities
Der Parser unterstützt die Suche nach einem Schlüsselwort in einer bestimmten Community. Dazu müssen in der Abfrage das Schlüsselwort und nach einem Leerzeichen der Link zur Community angegeben werden. Beispiel:
jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/
Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:
https://www.reddit.com/r/Audi/comments/vi6cs5/thoughts_on_used_stage_3_2017_a3/
https://www.reddit.com/r/Audi/comments/lfvjuo/just_picked_up_this_beauty_stage_3_b5_s4/
https://www.reddit.com/r/Audi/comments/ssr8ui/anyone_else_track_their_audis_ttrs_stage_3_big/
https://www.reddit.com/r/atheism/comments/14lq0y6/heaven_and_hell_are_not_what_jesus_preached/
https://www.reddit.com/r/atheism/comments/13gxzj6/so_jesus_freaks_can_shove_their_religion_onto/
https://www.reddit.com/r/atheism/comments/13b8kl6/chris_pratt_compares_his_struggles_to_jesus/
https://www.reddit.com/r/atheism/comments/137k88b/artwork_of_jesus_surrounded_by_hot_leather/
...
Ausgabeoptionen
A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, die es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.
Mögliche Einstellungen
| Parameter | Standardwert | Beschreibung |
|---|---|---|
| Pages count | 5 | Anzahl der Ergebnisseiten |
| Sort | Relevance | Sortierung der Ergebnisse |
| Time | All time | Zeitraum der Ergebnisse |
| Use HTTP/2 transport | ☑ | Bestimmt, ob HTTP/2 anstelle von HTTP/1.1 verwendet werden soll |