Social::Instagram::Tag - Scraper voor Instagram-posts op basis van tags

Overzicht van de scraper
Social::Instagram::Tag – scrapet posts op basis van tags van Instagram. Geautomatiseerde verzameling van alle gegevens: posttype, tekst, publicatiedatum, aantal reacties, aantal likes en nog veel meer. Samen met de tekst van de reactie wordt ook de link naar het profiel van de auteur, het aantal likes eronder en het tijdstip waarop deze is geplaatst verzameld.U kunt automatische query-vermenigvuldiging, substitutie van subquery's uit bestanden, het doorlopen van alfanumerieke combinaties en lijsten gebruiken om het maximaal mogelijke aantal resultaten te verkrijgen. Met behulp van resultaatfiltering kunt u het resultaat direct opschonen door alle ongewenste ruis te verwijderen (met behulp van uitsluitingswoorden).
De functionaliteit van A-Parser maakt het mogelijk om de instellingen voor de Social::Instagram::Tag scraper op te slaan voor toekomstig gebruik (presets), een schema voor gegevensextractie in te stellen en nog veel meer.
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
De scraper gebruikt gegevens van een geautoriseerd account. Voor de werking van de scraper is het verplicht om een waarde op te geven voor de optie cookie.
Use cases voor de scraper
Alle berichten verzamelen op basis van tags

- Overschrijf de optie Count of pages with posts, selecteer
100in de lijst. - Overschrijf de optie Result format, geef als waarde
$posts.format('$link\n')op. - Geef de tags op als query's.
Voorbeeld downloaden
Hoe een preset te importeren in A-Parser
eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=
Verzamelde gegevens
Twee arrays met normale berichten en berichten uit de TOP:
- Type bericht
- Link naar het bericht
- Tekst
- Publicatiedatum (in Unix-formaat)
- Aantal reacties
- Aantal likes
- Link naar het icoon
- Breedte en hoogte van de afbeelding
- Link naar de avatar
- Aantal berichten
Toepassingen
- Berichten verzamelen op basis van tags
Instellingen
Verkrijgen van de verplichte optie voor autorisatie
Spoiler: hoe vind je de cookie?
Ga naar een willekeurig profiel en open eerst de debug-modus door op F12 te drukken.
Zoek met de regel graphql/query (type json) naar de gewenste aanvraag waarin de waarden voor de scraper zijn opgeslagen.
Ga naar de aanvraag en kopieer de waarde uit de parameter cookie.

Query's
Als query's moeten tags worden opgegeven, bijvoorbeeld:
sport
cpu
Voorbeelden van resultaatuitvoer
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd zoals CSV of JSON kunnen worden uitgevoerd.
Standaard uitvoer
Resultaatformaat:
$query:\nPosts:\n$posts.format('$link\n')
Voorbeeld van resultaat:
Posts:
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/
Links naar berichten uit de top
Resultaatformaat:
$top.format('$link\n')
Voorbeeld van resultaat:
https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Count of pages with posts | 10 | Aantal pagina's met berichten |
| Treat disconnect as IP ban | ☑ | Verbindingsverbreking beschouwen als IP-ban |