Ga naar de hoofdinhoud

Social::Instagram::Tag - Scraper voor Instagram-posts op basis van tags

Social::Instagram::Tag

Overzicht van de scraper

Social::Instagram::TagSocial::Instagram::Tag – scrapet posts op basis van tags van Instagram. Geautomatiseerde verzameling van alle gegevens: posttype, tekst, publicatiedatum, aantal reacties, aantal likes en nog veel meer. Samen met de tekst van de reactie wordt ook de link naar het profiel van de auteur, het aantal likes eronder en het tijdstip waarop deze is geplaatst verzameld.

U kunt automatische query-vermenigvuldiging, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen. Met behulp van resultaatfiltering kunt u het resultaat direct opschonen door alle ongewenste ruis te verwijderen (met behulp van uitsluitingswoorden).

De functionaliteit van A-Parser maakt het mogelijk om de instellingen voor de Social::Instagram::Tag scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

opmerking

De scraper gebruikt gegevens van een geautoriseerd account. Voor de werking van de scraper is het verplicht om een waarde op te geven voor de optie cookie.

Use cases voor de scraper

Alle berichten verzamelen op basis van tags

Voorbeeld van gebruik
  1. Overschrijf de optie Count of pages with posts, selecteer 100 in de lijst.
  2. Overschrijf de optie Result format, geef als waarde $posts.format('$link\n') op.
  3. Geef de tags op als query's.
Voorbeeld downloaden

Hoe een preset te importeren in A-Parser

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Verzamelde gegevens

Twee arrays met normale berichten en berichten uit de TOP:

  • Type bericht
  • Link naar het bericht
  • Tekst
  • Publicatiedatum (in Unix-formaat)
  • Aantal reacties
  • Aantal likes
  • Link naar het icoon
  • Breedte en hoogte van de afbeelding
  • Link naar de avatar
  • Aantal berichten

Toepassingen

  • Berichten verzamelen op basis van tags

Instellingen

Verkrijgen van de verplichte optie voor autorisatie

Spoiler: hoe vind je de cookie?

Ga naar een willekeurig profiel en open eerst de debug-modus door op F12 te drukken. Debug Zoek met de regel graphql/query (type json) naar de gewenste aanvraag waarin de waarden voor de scraper zijn opgeslagen. Zoeken Ga naar de aanvraag en kopieer de waarde uit de parameter cookie. Waarden

Query's

Als query's moeten tags worden opgegeven, bijvoorbeeld:

sport  
cpu

Voorbeelden van resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd zoals CSV of JSON kunnen worden uitgevoerd.

Standaard uitvoer

Resultaatformaat:

$query:\nPosts:\n$posts.format('$link\n')

Voorbeeld van resultaat:

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Links naar berichten uit de top

Resultaatformaat:

$top.format('$link\n')

Voorbeeld van resultaat:

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Mogelijke instellingen

ParameterStandaardwaardeBeschrijving
Count of pages with posts10Aantal pagina's met berichten
Treat disconnect as IP banVerbindingsverbreking beschouwen als IP-ban