Reddit::PostInfo - scraper di informazioni sui post di Reddit

Panoramica dello scraper Reddit::PostInfo
Reddit::PostInfo - scraper di informazioni sui post di Reddit.Raccoglie informazioni sul post, inclusi i commenti.
È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, la generazione di combinazioni alfanumeriche e di elenchi per ottenere il massimo numero possibile di risultati.
La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Reddit::PostInfo per un uso futuro (preset), impostare pianificazioni di scraping e molto altro ancora.
Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.
Dati raccolti
- Link al post
- Titolo e etichetta (flair)
- Valutazione, numero di commenti e numero di premi
- Data di creazione
- Community in cui è pubblicato il post
- Autore e sua etichetta (flair)
- Contenuto del post: testo in markdown, link al contenuto multimediale e link a risorse esterne
- Se il post è pubblicitario
Array di commenti:
- ID
- ID genitore
- Link
- Autore
- Testo (senza tag)
- Testo (con tag)
Funzionalità
- Possibilità di limitare il numero di commenti per lo scraping
Query
È supportata un'unica variante di query:
Link ai post
Esempio:
https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/
Come risultato predefinito, verranno visualizzate le informazioni sul post senza commenti
Opzioni di output dei risultati
A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON.
Impostazioni possibili
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Max comments count | 50 | Numero di commenti per lo scraping |