Reddit::PostInfo - scraper för information om inlägg på Reddit

Översikt av scrapers Reddit::PostInfo
Reddit::PostInfo - scraper för information om inlägg på Reddit.Samlar in information om inlägg, inklusive kommentarer.
Du kan använda automatisk frågemultiplikation, substitution av underfrågor från filer, iteration av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.
Funktionaliteten i A-Parser gör det möjligt att spara inställningar för dataskrapning för Reddit::PostInfo för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer.
Resultaten kan sparas i den form och struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.
Data som samlas in
- Länk till inlägg
- Rubrik och etikett (flair)
- Betyg, antal kommentarer och antal utmärkelser
- Skapandedatum
- Community där inlägget publicerades
- Författare och dennes etikett (flair)
- Inläggets innehåll: text i markdown, länk till medieinnehåll och länk till extern resurs
- Om inlägget är ett annonsinlägg
Array med kommentarer:
- ID
- Föräldra-ID
- Länk
- Författare
- Text (rensad från taggar)
- Text (med taggar)
Funktioner
- Möjlighet att begränsa antalet kommentarer för dataskrapning
Frågor
Ett frågealternativ stöds:
Länkar till inlägg
Exempel:
https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/
Som standard kommer information om inlägget att visas utan kommentarer
Alternativ för resultatvisning
A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör det möjligt att visa resultat i valfri form, samt i strukturerad form som CSV eller JSON.
Möjliga inställningar
| Parameter | Standardvärde | Beskrivning |
|---|---|---|
| Max comments count | 50 | Antal kommentarer för dataskrapning |