Hoppa till huvudinnehåll

Social::Instagram::Tag - Scraper för Instagram-inlägg via taggar

Social::Instagram::Tag

Översikt av scrapern

Social::Instagram::TagSocial::Instagram::Tag – skrapar inlägg efter taggar från Instagram. Automatiserad insamling av all data: inläggstyp, text, publiceringsdatum, antal kommentarer, antal likes och mycket mer. Tillsammans med kommentarstexten samlas även länk till författarens profil, antal likes för den och tiden då den skapades in.

Du kan använda automatisk multiplikation av frågor, infogning av underfrågor från filer, iteration av alfanumeriska kombinationer och listor för att få största möjliga mängd resultat. Genom att använda resultatfiltrering kan du omedelbart rensa resultatet genom att ta bort allt onödigt skräp (med hjälp av minusord).

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för Social::Instagram::Tag för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer.

Resultaten kan sparas i det format och den struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

anteckning

Scrapern använder data från ett auktoriserat konto. För att scrapern ska fungera måste ett värde anges för alternativet cookie.

Användningsfall för scrapern

Samla alla inlägg efter taggar

Exempel på användning
  1. Åsidosätt alternativet Count of pages with posts, välj 100 i listan.
  2. Åsidosätt alternativet Result format, ange $posts.format('$link\n') som värde.
  3. Ange taggar som frågor.
Ladda ner exempel

Hur man importerar ett exempel till A-Parser

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Insamlade data

Två arrayer med vanliga inlägg och inlägg från TOPP:

  • Typ av inlägg
  • Länk till inlägget
  • Text
  • Publiceringsdatum (i Unix-format)
  • Antal kommentarer
  • Antal likes
  • Länk till ikon
  • Bildens bredd och höjd
  • Länk till avatar
  • Antal inlägg

Användningsområden

  • Insamling av inlägg efter taggar

Inställning

Hämta obligatoriskt alternativ för auktorisering

Spoiler: hur hittar man cookie?

Gå till valfri profil och öppna först felsökningsläget genom att trycka på F12. Debug Använd strängen graphql/query (typ json) för att leta efter den relevanta förfrågan där värdena för scrapern lagras. Sök Gå till förfrågan och kopiera värdet från parametern cookie. Värden

Frågor

Som frågor måste taggar anges, till exempel:

sport  
cpu

Exempel på resultatutdata

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör att den kan mata ut resultat i valfri form, såväl som i strukturerad form, till exempel CSV eller JSON

Standardutdata

Resultatformat:

$query:\nPosts:\n$posts.format('$link\n')

Exempel på resultat:

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Länkar till inlägg från topplistan

Resultatformat:

$top.format('$link\n')

Exempel på resultat:

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Möjliga inställningar

ParameterStandardvärdeBeskrivning
Count of pages with posts10Antal sidor med inlägg
Treat disconnect as IP banBetrakta anslutningsavbrott som IP-bannlysning