Przejdź do treści głównej

Social::Instagram::Tag - Scraper postów według tagów na Instagramie

Social::Instagram::Tag

Przegląd scrapera

Social::Instagram::TagSocial::Instagram::Tag – scrapuje posty według tagów z Instagrama. Automatyczne zbieranie wszystkich danych: typ posta, tekst, data publikacji, liczba komentarzy, liczba polubień i wiele więcej. Wraz z tekstem komentarza zbierany jest również link do profilu autora, liczba polubień pod nim oraz czas, w którym został utworzony.

Możesz używać automatycznego powielania zapytań, podstawiania podzapytań z plików, iteracji kombinacji alfanumerycznych oraz list w celu uzyskania maksymalnej możliwej liczby wyników. Korzystając z filtrowania wyników, możesz natychmiast wyczyścić wynik, usuwając zbędne śmieci (używając słów wykluczających).

Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera Social::Instagram::Tag do dalszego wykorzystania (presety), ustawiać harmonogram scrapowania i wiele więcej.

Zapisywanie wyników jest możliwe w dowolnej formie i strukturze, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala stosować dodatkową logikę do wyników i wyprowadzać dane w różnych formatach, w tym JSON, SQL i CSV.

notatka

Scraper korzysta z danych autoryzowanego konta. Do działania scrapera konieczne jest podanie wartości dla opcji cookie.

Przypadki użycia scrapera

Zbieranie wszystkich postów według tagów

Przykład użycia
  1. Zmień opcję Count of pages with posts, wybierając z listy 100.
  2. Zmień opcję Result format, wpisując jako wartość $posts.format('$link\n').
  3. Jako zapytania podaj tagi.
Pobierz przykład

Jak zaimportować przykład do A-Parser

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Zbierane dane

Dwie tablice z normalnymi postami oraz postami z TOP:

  • Typ posta
  • Link do posta
  • Tekst
  • Data publikacji (w formacie Unix)
  • Liczba komentarzy
  • Liczba polubień
  • Link do ikony
  • Szerokość i wysokość obrazka
  • Link do awatara
  • Liczba postów

Zastosowania

  • Zbieranie postów według tagów

Konfiguracja

Uzyskanie wymaganej opcji do autoryzacji

Spoiler: jak znaleźć cookie?

Przejdź do dowolnego profilu, otwierając wcześniej tryb debugowania klawiszem F12. Debugowanie Za pomocą ciągu graphql/query (typ json) wyszukaj odpowiednie zapytanie, w którym przechowywane są wartości dla scrapera. Wyszukiwanie Przejdź do zapytania i skopiuj wartość z parametru cookie. Wartości

Zapytania

Jako zapytania należy podawać tagi, na przykład:

sport  
cpu

Przykłady formatowania wyników

A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala na wyprowadzanie wyników w dowolnej formie, a także w ustrukturyzowanej, np. CSV lub JSON

Wynik domyślny

Format wyniku:

$query:\nPosts:\n$posts.format('$link\n')

Przykład wyniku:

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Linki do postów z topu

Format wyniku:

$top.format('$link\n')

Przykład wyniku:

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Dostępne ustawienia

ParametrWartość domyślnaOpis
Count of pages with posts10Liczba stron z postami
Treat disconnect as IP banTraktuj zerwanie połączenia jako ban IP