Vai al contenuto principale

Reddit::PostInfo - scraper di informazioni sui post di Reddit

SE::Quora

Panoramica dello scraper Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - scraper di informazioni sui post di Reddit.

Raccoglie informazioni sul post, inclusi i commenti.

È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, la generazione di combinazioni alfanumeriche e di elenchi per ottenere il massimo numero possibile di risultati.

La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Reddit::PostInfo per un uso futuro (preset), impostare pianificazioni di scraping e molto altro ancora.

Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.

Dati raccolti

  • Link al post
  • Titolo e etichetta (flair)
  • Valutazione, numero di commenti e numero di premi
  • Data di creazione
  • Community in cui è pubblicato il post
  • Autore e sua etichetta (flair)
  • Contenuto del post: testo in markdown, link al contenuto multimediale e link a risorse esterne
  • Se il post è pubblicitario

Array di commenti:

  • ID
  • ID genitore
  • Link
  • Autore
  • Testo (senza tag)
  • Testo (con tag)

Funzionalità

  • Possibilità di limitare il numero di commenti per lo scraping

Query

È supportata un'unica variante di query:

Link ai post

Esempio:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

Come risultato predefinito, verranno visualizzate le informazioni sul post senza commenti

Opzioni di output dei risultati

A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON.

Impostazioni possibili

ParametroValore predefinitoDescrizione
Max comments count50Numero di commenti per lo scraping