Zum Hauptinhalt springen

Reddit::Posts - Reddit-Beiträge Parser

SE::Quora

Übersicht des Parsers Reddit::Posts

Reddit::PostsReddit::Posts - ein Parser für Beiträge auf Reddit.

Sammelt eine Liste von Nachrichten (Posts) und eine Vielzahl von Informationen für jeden von ihnen aus dem gleichnamigen Dienst.

Sie können die automatische Abfragevervielfachung, die Substitution von Unterabfragen aus Dateien, das Durchlaufen von alphanumerischen Kombinationen und Listen verwenden, um die maximal mögliche Anzahl an Ergebnissen zu erhalten.

Die Funktionalität von A-Parser ermöglicht es Ihnen, die Einstellungen für den Reddit::Posts-Parser für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.

Das Speichern der Ergebnisse ist in jeder von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Gesammelte Daten

Array von Nachrichten (Posts):

  • Link zum Post
  • Titel und Label (Flair)
  • Bewertung, Anzahl der Kommentare und Anzahl der Auszeichnungen
  • Erstellungsdatum
  • Community, in der der Post veröffentlicht wurde
  • Autor und sein Label (Flair)
  • Inhalt des Posts: Text in Markdown, Link zu Medieninhalten und Link zu einer externen Ressource
  • Ob der Post werblich ist

Funktionen

  • Angabe der Anzahl der zu scrapenden Seiten
  • Angabe der Sortiermethode für die Ergebnisse
  • Auswahl des Zeitraums der Ergebnisse
  • Möglichkeit, innerhalb einer bestimmten Community zu extrahieren

Anwendungsfälle

  • Alle Szenarien, in denen Daten über Nachrichten (Posts) auf Reddit abgerufen werden müssen

Abfragen

Es werden mehrere Abfragevarianten unterstützt:

Beispiel:

https://www.reddit.com/t/bitcoin/
https://www.reddit.com/t/kim_kardashian/

Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:

https://www.reddit.com/r/Bitcoin/comments/14nbyy2/i_took_out_a_35000_loan_to_buy_bitcoin_1_year/
https://www.reddit.com/r/CryptoCurrency/comments/14guprs/bitcoin_is_up_75_since_jim_cramer_told_investors/
https://www.reddit.com/r/Bitcoin/comments/14opp2t/this_guy_was_paid_32_bitcoin_to_hold_up_this_sign/
https://www.reddit.com/r/CryptoCurrency/comments/14ivx43/nearly_69_of_all_bitcoin_supply_did_not_move_in/
https://www.reddit.com/r/CryptoCurrency/comments/149vy0o/bitcoin_dips_below_25k_for_the_first_time_in_3/
...

Parameter in den Links, die auf Zeit und Sortierung der Ergebnisse hinweisen, werden ebenfalls berücksichtigt, wobei die in den Einstellungen festgelegten ignoriert werden. Beispiel:

https://www.reddit.com/r/nba/
https://www.reddit.com/r/OrlandoMagic/top/?t=month

Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:

https://www.reddit.com/r/OrlandoMagic/comments/14a5br2/
https://www.reddit.com/r/OrlandoMagic/comments/14nqfk1/keep_mo_or_no_mo/
https://www.reddit.com/r/nba/comments/14nfzki/202324_nba_free_agent_tracker/
https://www.reddit.com/user/Grammarly/comments/14ghtld/verbessere_deine_schreibfertigkeit_auf_englisch/
https://www.reddit.com/r/nba/comments/14r4l4s/vernon_dillon_brooks_took_991_shots_last_year_he/
https://www.reddit.com/r/nba/comments/14ql1es/highlight_matt_devlin_inexplicably_yells_punjabi/
https://www.reddit.com/user/TelekomShop/comments/yqkina/der_highspeedhotspot_zum_mitnehmen_die_speedbox/
https://www.reddit.com/r/nba/comments/14qysvi/michael_jordan_with_the_spin_hanging_onehanded/
https://www.reddit.com/r/nba/comments/14qxrep/dwyane_wade_leads_the_redeem_team_with_27_points/
...

Schlüsselwörter

Beispiel:

wordpress features
parser

Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:

https://www.reddit.com/r/ShitpostXIV/comments/14511em/i_am_a_proud_grey_parser/
https://www.reddit.com/r/opengl/comments/147sbjk/4_hours_of_my_obj_parser_so_far/
https://www.reddit.com/r/Compilers/comments/14pi9xh/demystifying_pratt_parsers/
https://www.reddit.com/r/ZETTAHOST/comments/11qdg99/how_to_change_the_wordpress_featured_image_size/
https://www.reddit.com/r/Wordpress/comments/14p1k2p/what_features_is_wordpress_missing_i_want_to_help/
https://www.reddit.com/r/Wordpress/comments/13q8g5x/is_it_possible_and_advisable_to_build_a_website/
...

Der Parser unterstützt die Suche nach einem Schlüsselwort in einer bestimmten Community. Dazu müssen in der Abfrage das Schlüsselwort und nach einem Leerzeichen der Link zur Community angegeben werden. Beispiel:

jesus https://www.reddit.com/r/atheism/
stage 3 https://www.reddit.com/r/Audi/

Standardmäßig wird eine Liste von Links zu Posts ausgegeben, zum Beispiel:

https://www.reddit.com/r/Audi/comments/vi6cs5/thoughts_on_used_stage_3_2017_a3/
https://www.reddit.com/r/Audi/comments/lfvjuo/just_picked_up_this_beauty_stage_3_b5_s4/
https://www.reddit.com/r/Audi/comments/ssr8ui/anyone_else_track_their_audis_ttrs_stage_3_big/
https://www.reddit.com/r/atheism/comments/14lq0y6/heaven_and_hell_are_not_what_jesus_preached/
https://www.reddit.com/r/atheism/comments/13gxzj6/so_jesus_freaks_can_shove_their_religion_onto/
https://www.reddit.com/r/atheism/comments/13b8kl6/chris_pratt_compares_his_struggles_to_jesus/
https://www.reddit.com/r/atheism/comments/137k88b/artwork_of_jesus_surrounded_by_hot_leather/
...

Ausgabeoptionen

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, die es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.

Mögliche Einstellungen

ParameterStandardwertBeschreibung
Pages count5Anzahl der Ergebnisseiten
SortRelevanceSortierung der Ergebnisse
TimeAll timeZeitraum der Ergebnisse
Use HTTP/2 transportBestimmt, ob HTTP/2 anstelle von HTTP/1.1 verwendet werden soll