Hoppa till huvudinnehåll

Reddit::PostInfo - scraper för information om inlägg på Reddit

SE::Quora

Översikt av scrapers Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - scraper för information om inlägg på Reddit.

Samlar in information om inlägg, inklusive kommentarer.

Du kan använda automatisk frågemultiplikation, substitution av underfrågor från filer, iteration av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för dataskrapning för Reddit::PostInfo för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer.

Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Data som samlas in

  • Länk till inlägg
  • Rubrik och etikett (flair)
  • Betyg, antal kommentarer och antal utmärkelser
  • Skapandedatum
  • Community där inlägget publicerades
  • Författare och dennes etikett (flair)
  • Inläggets innehåll: text i markdown, länk till medieinnehåll och länk till extern resurs
  • Om inlägget är ett annonsinlägg

Array med kommentarer:

  • ID
  • Föräldra-ID
  • Länk
  • Författare
  • Text (rensad från taggar)
  • Text (med taggar)

Funktioner

  • Möjlighet att begränsa antalet kommentarer för dataskrapning

Frågor

Ett frågealternativ stöds:

Länkar till inlägg

Exempel:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

Som standard kommer information om inlägget att visas utan kommentarer

Alternativ för resultatvisning

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att visa resultat i valfri form, samt i strukturerad form som CSV eller JSON.

Möjliga inställningar

ParameterStandardvärdeBeskrivning
Max comments count50Antal kommentarer för dataskrapning