Перейти к основному содержимому

Social::Instagram::Tag - Парсер постов по тегам в Instagram

Social::Instagram::Tag

Обзор парсера

Social::Instagram::TagSocial::Instagram::Tag – парсит посты по тегам из Instagram. Автоматизированный сбор всех данных: тип поста, текст, дата публикации, количество комментариев, количество лайков и многое другое. Вместе с текстом комментария собирается также ссылка на профиль автора, кол-во лайков под ним и время, в которое он был создан.

Вы можете использовать автоматическое размножение запросов, подстановку подзапросов из файлов, перебор цифро-буквенных комбинаций и списков для получения максимально возможного количества результатов. Используя фильтрацию результатов вы можете сразу почистить результат, удалив весь не нужный мусор (использовав минус-слова).

Функционал A-Parser позволяет сохранять настройки парсинга парсера Social::Instagram::Tag для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

примечание

Парсер использует данные авторизированного аккаунта. Для работы парсера обязательно нужно указать значение для опции cookie.

Кейсы по применению парсера

Сбор всех постов по тегам

Пример использования
  1. Переопределить опцию Count of pages with posts, в списке выбрать 100.
  2. Переопределить опцию Result format, в качестве значения указать $posts.format('$link\n').
  3. В качестве запросов указать теги.
Скачать пример

Как импортировать пример в А-Парсер

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Собираемые данные

Два массива с обычными постами и постами из ТОПа:

  • Тип поста
  • Ссылка на пост
  • Текст
  • Дата публикации (в Unix формате)
  • Количество комментариев
  • Количество лайков
  • Ссылка на иконку
  • Ширина и высота картинки
  • Ссылка на аватарку
  • Количество постов

Варианты использования

  • Сбор постов по тегам

Настройка

Получение обязательной опции для авторизации

Спойлер: как найти cookie?

Переходим на любой профиль предварительно открыв дебаг режим нажав F12. Debug С помощью строки graphql/query (тип json) ищем нужный запрос, в котором хранятся значения для парсера. Search Переходим по запросу и копируем значение из параметра cookie. Values

Запросы

В качестве запросов необходимо указывать тег, например:

sport  
cpu

Варианты вывода результатов

A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON

Вывод по умолчанию

Формат результата:

$query:\nPosts:\n$posts.format('$link\n')

Пример результата:

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Ссылки на посты из топа

Формат результата:

$top.format('$link\n')

Пример результата:

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Возможные настройки

ПараметрЗначение по умолчаниюОписание
Count of pages with posts10Количество страниц с постами
Treat disconnect as IP banСчитать разрыв соединения баном IP