Chuyển đến nội dung chính

Social::Instagram::Profile - Công cụ cào dữ liệu Instagram. Thu thập dữ liệu từ hồ sơ trên Instagram

Social::Instagram::Profile

Tổng quan về công cụ cào dữ liệu

Social::Instagram::ProfileSocial::Instagram::Profile – cào dữ liệu hồ sơ từ Instagram. Công cụ cào dữ liệu Instagram cho phép tổ chức cào dữ liệu hàng loạt từ hồ sơ người dùng. Các dữ liệu thu thập được bao gồm nickname, tên, tiểu sử, trang web, số lượng bài viết, v.v. Danh sách đầy đủ các dữ liệu thu thập được nằm trong phần tương ứng.

Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu của công cụ cào dữ liệu Social::Instagram::Profile để sử dụng sau này (mẫu thiết lập sẵn), đặt lịch trình cào dữ liệu và nhiều tính năng khác.

Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit, cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.

ghi chú

Công cụ cào dữ liệu sử dụng dữ liệu của tài khoản đã đăng nhập. Để công cụ cào dữ liệu hoạt động, bắt buộc phải chỉ định giá trị cho tùy chọn cookie.

Các trường hợp sử dụng công cụ cào dữ liệu

Thu thập liên kết đến các bài đăng
  1. Ghi đè tùy chọn Result format, nhập giá trị là $posts.format('$link\n').
  2. Ghi đè tùy chọn Posts pages count, chọn All trong danh sách.
  3. Nhập các liên kết đến hồ sơ làm truy vấn.
Tải xuống ví dụ

Cách nhập ví dụ vào A-Parser

eJx9U01v2zAM/SuBkMMGBEF72MUYBqTBArTI6qxpT0EOhEVnamRRk+RsneH/Pkpx
7CT78Mn8eI98ItmIAH7vVw49Bi+yTSNs+heZkFhCrYOYCAvOo4vhjVhToUBn2b3x
AXYOqixbOSqVRk7sIY0IbxaZhA7onJIxqCTbBdFeResAuo4JH+fJ40dUjsCMoA7f
yKlfKEdQFFSb8Em0/6az5INfwQ7nMXWgvb3hr91uJ4LVcEd+Qa6CqGpsb6edxD64
hgM+Ewc7GScMW49QxbpjCQFjdFomonfvp+FnZAApVVBkQB8rxEcaqr4Y9T2pNMS5
/OtY6cJRxa6AiSA6307dbcQ42YIp6oT9esSIrATtcSI8t7oAbkReR1RAB4FcbmM/
7G8EmZnWSzygHtIS/12ttOSJzkoG3XfAv6fkf3C0vbzzUjyYH4576FmSdZd/GVCS
lrQ7PYZWlQps++PkMnHDzj2i7d/sMaZV5LAv0zF31XlpLZq4BcPIZnZwXci4GMul
syBTql3ebdYpszbPfBm5mVNlNUZdptaax+LxaViPme/GEI2hwWvwPJW4uKlApP3D
+tiqdYrX70NssOKXPK/aURag9cvT8jwSgT6Qzc1n567GlxZDFE75oCC9d8ELvCNe
LZbXbvub7i+/+d9lZ03L83vlS0ugKDZC2Mev5nk4fHHtb+bPg/A=

Dữ liệu thu thập được

  • Tên người dùng (Nickname)
  • Họ tên đầy đủ
  • Tiểu sử (Bio)
  • Trang web
  • Số lượng bài đăng
  • Số lượng người theo dõi
  • Số lượng đang theo dõi
  • Liên kết đến hồ sơ tác giả
  • Kênh
  • Hồ sơ có phải là hồ sơ doanh nghiệp không
  • Hồ sơ có phải là riêng tư không
  • Hồ sơ có phải là đã xác minh không
  • Liên kết đến ảnh đại diện
  • Liên kết đến trang Facebook
  • Thông tin về các bài đăng
  • Số lượt xem video
  • Email của hồ sơ
  • Vị trí của hồ sơ
  • Số điện thoại (từ tiểu sử hồ sơ)
  • Các bài đăng của tác giả
    • Loại
    • Liên kết
    • Văn bản
    • Thời gian
    • Số lượng bình luận
    • Số lượng lượt thích
    • Liên kết đến phương tiện truyền thông
    • Chiều cao bài đăng
    • Chiều rộng bài đăng
    • Liên kết đến tác giả bài đăng
    • Vị trí
    • Số lượt xem (video)
  • Đang theo dõi và người theo dõi
    • Định danh (ID)
    • Liên kết đến hồ sơ
    • Tên người dùng
    • Họ tên đầy đủ
    • Hồ sơ có phải là riêng tư không
    • Hồ sơ có phải là đã xác minh không
    • Liên kết đến ảnh đại diện
    • Người dùng có khả năng là kẻ lừa đảo không
  • Các liên kết đính kèm
    • Tiêu đề
    • Liên kết
    • Loại

Biến thể sử dụng

  • Thu thập thông tin về hồ sơ
  • Thu thập các bài đăng
  • Thu thập người theo dõi
  • Thu thập đang theo dõi
  • Cào liên kết bài viết để sử dụng trong Social::Instagram::PostSocial::Instagram::Post

Cài đặt

Lấy tùy chọn bắt buộc để xác thực

Spoiler: làm thế nào để tìm cookie?

Truy cập vào bất kỳ hồ sơ nào sau khi đã mở chế độ debug bằng cách nhấn F12. Debug Sử dụng dòng graphql/query (loại json) để tìm truy vấn cần thiết chứa các giá trị cho công cụ cào dữ liệu. Search Chọn truy vấn và sao chép giá trị từ tham số cookie. Values

Truy vấn

Trong phần truy vấn, bạn cần chỉ định tên người dùng của hồ sơ, ví dụ:

cristiano 
kyliejenner

Các ví dụ về kết quả đầu ra

A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả dưới dạng tùy ý cũng như có cấu trúc như CSV hoặc JSON

Đầu ra mặc định

Định dạng kết quả:

$query: $full_name, followers: $followers_count, following: $following_count\nPosts:\n$posts.format('$link\n')

Ví dụ kết quả:

cristiano: Cristiano Ronaldo, followers: 579975336, following: 558
Posts:
https://www.instagram.com/p/CrmIE7tNddZ/
https://www.instagram.com/p/Crg1arRNXvX/
https://www.instagram.com/p/CrUE3a6tRs4/
https://www.instagram.com/p/CrK_zvLAofv/
https://www.instagram.com/p/CrGMggNq1Cb/
https://www.instagram.com/p/CrEHoMbK0_C/
https://www.instagram.com/p/Cq8QZGDIix1/
https://www.instagram.com/p/CqxINLiOCPK/
https://www.instagram.com/p/CqoZ8pRo91y/
https://www.instagram.com/p/CqjQjCII98k/
https://www.instagram.com/p/CqeFZMFotaH/
https://www.instagram.com/p/CqcihSbAxaH/

Liên kết đến hồ sơ đang theo dõi và người theo dõi

Định dạng kết quả:

Followers:\n$followers.format('$link\n')\nFollowings:\n$followings.format('$link\n')

Ví dụ kết quả:

Followers:
https://www.instagram.com/madhu55745/
https://www.instagram.com/akoy4615/
https://www.instagram.com/kiiitank/
https://www.instagram.com/erzhi19/
https://www.instagram.com/na898poli/
https://www.instagram.com/omronnmaaj/
https://www.instagram.com/abhishak8474/
https://www.instagram.com/karankumarkaran110/
https://www.instagram.com/engin_altannnn/
https://www.instagram.com/biel.full/

Followings:
https://www.instagram.com/rafanery.hrpz/
https://www.instagram.com/hubermanlab/
https://www.instagram.com/insparya_italy/
https://www.instagram.com/gerson_rodrigues_11/
https://www.instagram.com/bernardorsousa/
https://www.instagram.com/eminem/
https://www.instagram.com/spl/
https://www.instagram.com/toto.restaurants/
https://www.instagram.com/thetoolsbook/
https://www.instagram.com/rauwalejandro/
https://www.instagram.com/francisngannou/
https://www.instagram.com/sultan_alghannam/

Các cài đặt có thể có

Tham sốGiá trị mặc địnhMô tả
cookieCần phải chỉ định Cookie trước
x-csrftokenKhả năng chỉ định x-csrftoken (nếu cần)
x-ig-app-id936619743392459Khả năng chỉ định x-ig-app-id (nếu cần)
Posts pages count1Số lượng trang bài đăng
Followers pages count1Số lượng trang người theo dõi
Followings pages count1Số lượng trang đang theo dõi