Pular para o conteúdo principal

Social::Instagram::Tag - Scraper de posts por tags no Instagram

Social::Instagram::Tag

Visão geral do scraper

Social::Instagram::TagSocial::Instagram::Tag – realiza a extração de dados de postagens por tags do Instagram. Coleta automatizada de todos os dados: tipo de postagem, texto, data de publicação, número de comentários, número de curtidas e muito mais. Junto com o texto do comentário, também são coletados o link para o perfil do autor, o número de curtidas nele e o horário em que foi criado.

Você pode usar a multiplicação automática de consultas, substituição de subconsultas de arquivos, busca por combinações alfanuméricas e listas para obter o máximo de resultados possível. Usando a filtragem de resultados, você pode limpar imediatamente o resultado, removendo todo o lixo desnecessário (usando palavras-chave negativas).

A funcionalidade do A-Parser permite salvar as configurações de extração de dados do scraper Social::Instagram::Tag para uso futuro (presets), definir agendamentos de extração de dados e muito mais.

A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

nota

O scraper utiliza dados de uma conta autenticada. Para o funcionamento do scraper, é obrigatório especificar um valor para a opção cookie.

Casos de uso do scraper

Coleta de todos os posts por tags

Exemplo de uso
  1. Redefinir a opção Count of pages with posts, selecionando 100 na lista.
  2. Redefinir a opção Result format, especificando $posts.format('$link\n') como valor.
  3. Especificar as tags como consultas.
Baixar exemplo

Como importar um exemplo para o A-Parser

eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=

Dados coletados

Dois arrays com posts comuns e posts do TOP:

  • Tipo de post
  • Link para o post
  • Texto
  • Data de publicação (em formato Unix)
  • Número de comentários
  • Número de curtidas
  • Link para o ícone
  • Largura e altura da imagem
  • Link para o avatar
  • Número de posts

Opções de uso

  • Coleta de posts por tags

Configuração

Obtenção da opção obrigatória para autenticação

Spoiler: como encontrar o cookie?

Acesse qualquer perfil abrindo previamente o modo de depuração pressionando F12. Depuração Usando a string graphql/query (tipo json), procure a consulta necessária onde os valores para o scraper estão armazenados. Pesquisa Acesse a consulta e copie o valor do parâmetro cookie. Valores

Consultas

Como consultas, é necessário indicar a tag, por exemplo:

sport  
cpu

Exemplos de saída de resultados

O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados de forma arbitrária, bem como estruturada, como CSV ou JSON.

Saída padrão

Formato do resultado:

$query:\nPosts:\n$posts.format('$link\n')

Exemplo de resultado:

Posts:  
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/

Links para posts do topo

Formato do resultado:

$top.format('$link\n')

Exemplo de resultado:

https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/

Configurações possíveis

ParâmetroValor padrãoDescrição
Count of pages with posts10Número de páginas com posts
Treat disconnect as IP banConsiderar queda de conexão como banimento de IP