Social::Instagram::Tag - Scraper de publications par tags sur Instagram

Présentation du scraper
Social::Instagram::Tag – collecte les publications par tags sur Instagram. Collecte automatisée de toutes les données : type de publication, texte, date de publication, nombre de commentaires, nombre de likes et bien plus encore. En plus du texte du commentaire, le lien vers le profil de l'auteur, le nombre de likes sous celui-ci et l'heure à laquelle il a été créé sont également collectés.Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, l'itération de combinaisons alphanumériques et de listes pour obtenir le maximum de résultats possible. En utilisant le filtrage des résultats, vous pouvez immédiatement nettoyer le résultat en supprimant tout contenu inutile (en utilisant des mots-clés négatifs).
La fonctionnalité d'A-Parser permet d'enregistrer les paramètres de collecte de données du scraper Social::Instagram::Tag pour une utilisation ultérieure (présélections), de définir un calendrier de collecte et bien plus encore.
La conservation des résultats est possible dans le format et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'exporter les données dans divers formats, y compris JSON, SQL et CSV.
Le scraper utilise les données d'un compte autorisé. Pour le fonctionnement du scraper, il est impératif d'indiquer une valeur pour l'option cookie.
Cas d'utilisation du scraper
Collecte de tous les posts par tags

- Redéfinir l'option Count of pages with posts, choisir
100dans la liste. - Redéfinir l'option Result format, indiquer
$posts.format('$link\n')comme valeur. - Indiquer les tags comme requêtes.
Télécharger l'exemple
Comment importer un exemple dans A-Parser
eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=
Données collectées
Deux tableaux avec les posts classiques et les posts du TOP :
- Type de post
- Lien vers le post
- Texte
- Date de publication (au format Unix)
- Nombre de commentaires
- Nombre de likes
- Lien vers l'icône
- Largeur et hauteur de l'image
- Lien vers l'avatar
- Nombre de posts
Variantes d'utilisation
- Collecte de posts par tags
Configuration
Obtention de l'option obligatoire pour l'autorisation
Spoiler : comment trouver le cookie ?
Allez sur n'importe quel profil après avoir ouvert le mode débogage en appuyant sur F12.
À l'aide de la chaîne graphql/query (type json), recherchez la requête correspondante contenant les valeurs pour le scraper.
Allez sur la requête et copiez la valeur du paramètre cookie.

Requêtes
Il est nécessaire d'indiquer le tag comme requête, par exemple :
sport
cpu
Variantes d'affichage des résultats
A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous forme libre ou structurée, comme CSV ou JSON
Affichage par défaut
Format du résultat :
$query:\nPosts:\n$posts.format('$link\n')
Exemple de résultat :
Posts:
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/
Liens vers les posts du top
Format du résultat :
$top.format('$link\n')
Exemple de résultat :
https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/
Paramètres possibles
| Paramètre | Valeur par défaut | Description |
|---|---|---|
| Count of pages with posts | 10 | Nombre de pages avec des posts |
| Treat disconnect as IP ban | ☑ | Considérer la déconnexion comme un bannissement d'IP |