Passer au contenu principal

Social::Instagram::Tag - Scraper de publications par tags sur Instagram

Social::Instagram::Tag

Présentation du scraper

Social::Instagram::TagSocial::Instagram::Tag – collecte les publications par tags sur Instagram. Collecte automatisée de toutes les données : type de publication, texte, date de publication, nombre de commentaires, nombre de likes et bien plus encore. En plus du texte du commentaire, le lien vers le profil de l'auteur, le nombre de likes sous celui-ci et l'heure à laquelle il a été créé sont également collectés.

Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, l'itération de combinaisons alphanumériques et de listes pour obtenir le maximum de résultats possible. En utilisant le filtrage des résultats, vous pouvez immédiatement nettoyer le résultat en supprimant tout contenu inutile (en utilisant des mots-clés négatifs).

La fonctionnalité d'A-Parser permet d'enregistrer les paramètres de collecte de données du scraper Social::Instagram::Tag pour une utilisation ultérieure (présélections), de définir un calendrier de collecte et bien plus encore.

La conservation des résultats est possible dans le format et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'exporter les données dans divers formats, y compris JSON, SQL et CSV.

note

Le scraper utilise les données d'un compte autorisé. Pour le fonctionnement du scraper, il est impératif d'indiquer une valeur pour l'option cookie.

Cas d'utilisation du scraper

Collecte de tous les posts par tags

Exemple d'utilisation
  1. Redéfinir l'option Count of pages with posts, choisir 100 dans la liste.
  2. Redéfinir l'option Result format, indiquer $posts.format('$link\n') comme valeur.
  3. Indiquer les tags comme requêtes.
Télécharger l'exemple

Comment importer un exemple dans A-Parser

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Données collectées

Deux tableaux avec les posts classiques et les posts du TOP :

  • Type de post
  • Lien vers le post
  • Texte
  • Date de publication (au format Unix)
  • Nombre de commentaires
  • Nombre de likes
  • Lien vers l'icône
  • Largeur et hauteur de l'image
  • Lien vers l'avatar
  • Nombre de posts

Variantes d'utilisation

  • Collecte de posts par tags

Configuration

Obtention de l'option obligatoire pour l'autorisation

Spoiler : comment trouver le cookie ?

Allez sur n'importe quel profil après avoir ouvert le mode débogage en appuyant sur F12. Débogage À l'aide de la chaîne graphql/query (type json), recherchez la requête correspondante contenant les valeurs pour le scraper. Recherche Allez sur la requête et copiez la valeur du paramètre cookie. Valeurs

Requêtes

Il est nécessaire d'indiquer le tag comme requête, par exemple :

sport  
cpu

Variantes d'affichage des résultats

A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous forme libre ou structurée, comme CSV ou JSON

Affichage par défaut

Format du résultat :

$query:\nPosts:\n$posts.format('$link\n')

Exemple de résultat :

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Liens vers les posts du top

Format du résultat :

$top.format('$link\n')

Exemple de résultat :

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Paramètres possibles

ParamètreValeur par défautDescription
Count of pages with posts10Nombre de pages avec des posts
Treat disconnect as IP banConsidérer la déconnexion comme un bannissement d'IP