Ga naar de hoofdinhoud

Reddit::PostInfo - scraper voor postinformatie op Reddit

SE::Quora

Overzicht van de scraper Reddit::PostInfo

Reddit::PostInfoReddit::PostInfo - scraper voor informatie over Reddit-posts.

Verzamelt informatie over een post, inclusief reacties.

U kunt automatische query-multiplicatie, substitutie van subquery's uit bestanden, iteratie van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen.

De functionaliteit van A-Parser maakt het mogelijk om instellingen voor de scraper Reddit::PostInfo op te slaan voor toekomstig gebruik (presets), schema's voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt exporteren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • Link naar de post
  • Titel en label (flair)
  • Score, aantal reacties en aantal awards
  • Aanmaakdatum
  • Community waarin de post is gepubliceerd
  • Auteur en diens label (flair)
  • Inhoud van de post: tekst in markdown, link naar media-inhoud en link naar externe bron
  • Of de post een advertentie is

Array van reacties:

  • ID
  • Parent ID
  • Link
  • Auteur
  • Tekst (zonder tags)
  • Tekst (met tags)

Mogelijkheden

  • Mogelijkheid om het aantal reacties voor gegevensextractie te beperken

Query's

Eén type query wordt ondersteund:

Voorbeeld:

https://www.reddit.com/r/Audi/comments/151atr5/audi_r8_high_speed_crash_294_km/
https://www.reddit.com/r/Lexus/comments/1dc7r2m/anyone_come_from_audi_to_lexus/

Standaard wordt informatie over de post zonder reacties weergegeven.

Opties voor resultaatweergave

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm kunnen worden weergegeven, evenals in gestructureerde formaten zoals CSV of JSON.

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
Max comments count50Aantal reacties voor gegevensextractie