Social::Instagram::Tag - Công cụ cào dữ liệu bài viết theo hashtag trên Instagram

Tổng quan về công cụ cào dữ liệu
Social::Instagram::Tag – cào dữ liệu bài viết theo thẻ từ Instagram. Tự động thu thập tất cả dữ liệu: loại bài viết, văn bản, ngày đăng, số lượng bình luận, số lượng lượt thích và nhiều thông tin khác. Cùng với văn bản bình luận, công cụ cũng thu thập liên kết đến hồ sơ của tác giả, số lượng lượt thích của bình luận và thời gian bình luận được tạo.Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế các truy vấn phụ từ tệp, lặp qua các tổ hợp chữ-số và danh sách để nhận được số lượng kết quả tối đa có thể. Bằng cách sử dụng lọc kết quả, bạn có thể làm sạch kết quả ngay lập tức, loại bỏ tất cả rác không cần thiết (sử dụng từ khóa loại trừ).
Chức năng của A-Parser cho phép lưu các cài đặt cào dữ liệu của công cụ Social::Instagram::Tag để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác.
Việc lưu kết quả có thể thực hiện theo định dạng và cấu trúc mà bạn cần, nhờ vào bộ tạo mẫu tích hợp mạnh mẽ Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Công cụ cào dữ liệu sử dụng dữ liệu từ tài khoản đã đăng nhập. Để công cụ cào dữ liệu hoạt động, bắt buộc phải chỉ định giá trị cho tùy chọn cookie.
Các trường hợp sử dụng công cụ cào dữ liệu
Thu thập tất cả bài viết theo thẻ (tag)

- Ghi đè tùy chọn Count of pages with posts, chọn
100trong danh sách. - Ghi đè tùy chọn Result format, nhập giá trị
$posts.format('$link\n'). - Nhập các thẻ (tag) làm truy vấn.
Tải xuống ví dụ
eJx1U01v2zAM/S9CgK5AEKSHXXxLAwTokNVdk56SHAibNrTIoibJWQvD/72U7NhJ
P24i+fj4KJKN8OCO7smiQ+9EsmuEiW+RiBwLqJUXU2HAOrQhvBMbyiSoJHnQzkNp
oUqSLZQMGuCN8G8GmYBOaK3MkYMyZ9tAiRnVOlCeQNWMuZvP2+8TCrIVeNbTyehz
xMSQ827WRX/cTJTUx/1e39yK9nCYig7vVjEc4XezvqkhuIETbimUkApH94qtR6hi
kRw8hui5zu3MvwYGyHPpJWlQXYXwLWPVFy3/RZGaGMtPK9GtLFXs8hgJgvPtrG4n
JtEWTFHH3D9djkgKUA6nwrHUFbCQ/GNEerTgyaYm6GF/I0gvlFrjCdUIi/z3tVQ5
z3BRcNJDn/g1JP3E0Q7tXZbiYf23rGFgidZ9+nvMymlN5fkzlKykZ9st4w4kYs7O
I6IZ/uwxwCqyOJTpmfvqvKYGddiMcWQLM7qu2rgay7UzI13IMu237Yys9ZZvIdVL
qozC0JeuleKxOHwe12Ph+jEEYxT4MXkZS1xdkSdS7temk2qs5PX7GQRW/JOXVXvK
DJR6eV5fRsS4Umxkpt5rZ8gG8oy3tSTeI+6lPQwnOxx2893hJk3Lg/rrnrqE0FWA
s4+/x/EU+Ejbd0hbdis=
Dữ liệu thu thập được
Hai mảng chứa các bài viết thông thường và các bài viết hàng đầu (TOP):
- Loại bài viết
- Liên kết đến bài viết
- Văn bản
- Ngày đăng (định dạng Unix)
- Số lượng bình luận
- Số lượng lượt thích
- Liên kết đến biểu tượng
- Chiều rộng và chiều cao của ảnh
- Liên kết đến ảnh đại diện
- Số lượng bài viết
Các phương án sử dụng
- Thu thập bài viết theo thẻ (tag)
Cài đặt
Lấy tùy chọn bắt buộc để xác thực
Spoiler: làm thế nào để tìm cookie?
Truy cập vào bất kỳ hồ sơ nào, trước đó hãy mở chế độ debug bằng cách nhấn F12.
Sử dụng dòng graphql/query (loại json) để tìm truy vấn cần thiết chứa các giá trị cho công cụ cào dữ liệu.
Truy cập vào truy vấn và sao chép giá trị từ tham số cookie.

Truy vấn
Các truy vấn cần được nhập dưới dạng thẻ (tag), ví dụ:
sport
cpu
Các ví dụ về xuất kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý cũng như dạng cấu trúc như CSV hoặc JSON.
Xuất mặc định
Định dạng kết quả:
$query:\nPosts:\n$posts.format('$link\n')
Ví dụ kết quả:
Posts:
https://www.instagram.com/p/B0FtUJboZC0/
https://www.instagram.com/p/B0Fs7maCIvq/
https://www.instagram.com/p/B0FszBRgOoS/
https://www.instagram.com/p/B0FrgVTBgFI/
https://www.instagram.com/p/B0FqeKvBSjC/
https://www.instagram.com/p/B0FogPGnOIG/
https://www.instagram.com/p/B0FoHSuCSUr/
https://www.instagram.com/p/B0Fl5JWgWts/
https://www.instagram.com/p/B0Fj_P0ji83/
https://www.instagram.com/p/B0Fgn5YHCiC/
https://www.instagram.com/p/B0Fd4uvAOyf/
https://www.instagram.com/p/B0FdfGjnVVs/
https://www.instagram.com/p/B0FdLEDgrTe/
https://www.instagram.com/p/B0FdEORCa0Z/
Liên kết đến các bài viết từ top
Định dạng kết quả:
$top.format('$link\n')
Ví dụ kết quả:
https://www.instagram.com/p/CMMKTr4pi3o/
https://www.instagram.com/p/CMMKTCGHZ1c/
https://www.instagram.com/p/CMMKStkF59q/
https://www.instagram.com/p/CMMKRNun5Jg/
https://www.instagram.com/p/CMMKRI-JTp8/
https://www.instagram.com/p/CMMKQmfBD9O/
https://www.instagram.com/p/CMMKHsiF5GT/
https://www.instagram.com/p/CMMKQUpHXy4/
https://www.instagram.com/p/CMMKPL1HxTx/
https://www.instagram.com/p/CMMKOAkn1mP/
Các cài đặt có thể có
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Count of pages with posts | 10 | Số lượng trang chứa bài viết |
| Treat disconnect as IP ban | ☑ | Coi việc ngắt kết nối là bị chặn IP |