Social::Instagram::Tag - Scraper di post per tag su Instagram

Panoramica dello scraper
Social::Instagram::Tag – esegue lo scraping dei post da Instagram in base ai tag. Raccolta automatizzata di tutti i dati: tipo di post, testo, data di pubblicazione, numero di commenti, numero di like e molto altro. Insieme al testo del commento, vengono raccolti anche il link al profilo dell'autore, il numero di like ricevuti e l'ora in cui è stato creato.È possibile utilizzare la moltiplicazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche e liste per ottenere il massimo numero possibile di risultati. Utilizzando il filtraggio dei risultati è possibile pulire immediatamente il risultato, rimuovendo tutta la spazzatura non necessaria (utilizzando le parole chiave negative).
La funzionalità di A-Parser consente di salvare le impostazioni di scraping dello scraper Social::Instagram::Tag per un uso futuro (preset), impostare pianificazioni di scraping e molto altro ancora.
Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logica aggiuntiva ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.
Lo scraper utilizza i dati di un account autorizzato. Per il funzionamento dello scraper è obbligatorio specificare un valore per l'opzione cookie.
Casi d'uso dello scraper
Raccolta di tutti i post per tag

- Sovrascrivere l'opzione Count of pages with posts, selezionando
100nell'elenco. - Sovrascrivere l'opzione Result format, specificando come valore
$posts.format('$link\n'). - Specificare i tag come query.
Scarica esempio
Come importare un esempio in A-Parser
eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=
Dati raccolti
Due array con post normali e post in TOP:
- Tipo di post
- Link al post
- Testo
- Data di pubblicazione (in formato Unix)
- Numero di commenti
- Numero di like
- Link all'icona
- Larghezza e altezza dell'immagine
- Link all'avatar
- Numero di post
Casi d'uso
- Raccolta di post per tag
Configurazione
Ottenimento dell'opzione obbligatoria per l'autorizzazione
Spoiler: come trovare i cookie?
Andare su qualsiasi profilo dopo aver aperto la modalità debug premendo F12.
Utilizzando la stringa graphql/query (tipo json) cercare la query necessaria in cui sono memorizzati i valori per lo scraper.
Andare sulla query e copiare il valore dal parametro cookie.

Query
Come query è necessario indicare il tag, ad esempio:
sport
cpu
Esempi di output dei risultati
A-Parser supporta una formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON.
Output predefinito
Formato del risultato:
$query:\nPosts:\n$posts.format('$link\n')
Esempio di risultato:
Posts:
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/
Link ai post in top
Formato del risultato:
$top.format('$link\n')
Esempio di risultato:
https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/
Impostazioni possibili
| Parametro | Valore predefinito | Descrizione |
|---|---|---|
| Count of pages with posts | 10 | Numero di pagine con i post |
| Treat disconnect as IP ban | ☑ | Considerare l'interruzione della connessione come ban dell'IP |