Social::Instagram::Profile - Instagramスクレイパー。Instagramプロフィールのデータ収集

スクレイパーの概要
Social::Instagram::Profile – Instagramのプロフィールデータをスクレイピングします。Instagramスクレイパーを使用すると、ユーザープロフィールから大量のデータを効率的にスクレイピングできます。収集可能なデータには、ユーザー名、名前、自己紹介、ウェブサイト、投稿数などが含まれます。収集データの全リストは、該当するセクションに記載されています。A-Parserの機能により、Social::Instagram::Profile スクレイパーのスクレイピング設定を後で利用するために保存(プリセット)したり、スクレイピングのスケジュールを設定したりすることが可能です。
結果の保存は、内蔵の強力なテンプレートエンジン Template Toolkit により、必要な形式や構造で保存できます。これにより、結果に追加のロジックを適用したり、JSON、SQL、CSV を含む様々なフォーマットでデータを出力したりできます。
注記
スクレイパーは認証済みアカウントのデータを使用します。 スクレイパーを動作させるには、cookie オプションの値を必ず指定する必要があります。
スクレイパーのユースケース
投稿へのリンク収集

- Result format オプションを上書きし、値として
$posts.format('$link\n')を指定します。 - Posts pages count オプションを上書きし、リストから
Allを選択します。 - クエリとしてプロフィールのリンクを指定します。
例をダウンロード
eJx9U01v2zAM/SuBkMMGBEF72MUYBqTBArTI6qxpT0EOhEVnamRRk+RsneH/Pkpx
7CT78Mn8eI98ItmIAH7vVw49Bi+yTSNs+heZkFhCrYOYCAvOo4vhjVhToUBn2b3x
AXYOqixbOSqVRk7sIY0IbxaZhA7onJIxqCTbBdFeResAuo4JH+fJ40dUjsCMoA7f
yKlfKEdQFFSb8Em0/6az5INfwQ7nMXWgvb3hr91uJ4LVcEd+Qa6CqGpsb6edxD64
hgM+Ewc7GScMW49QxbpjCQFjdFomonfvp+FnZAApVVBkQB8rxEcaqr4Y9T2pNMS5
/OtY6cJRxa6AiSA6307dbcQ42YIp6oT9esSIrATtcSI8t7oAbkReR1RAB4FcbmM/
7G8EmZnWSzygHtIS/12ttOSJzkoG3XfAv6fkf3C0vbzzUjyYH4576FmSdZd/GVCS
lrQ7PYZWlQps++PkMnHDzj2i7d/sMaZV5LAv0zF31XlpLZq4BcPIZnZwXci4GMul
syBTql3ebdYpszbPfBm5mVNlNUZdptaax+LxaViPme/GEI2hwWvwPJW4uKlApP3D
+tiqdYrX70NssOKXPK/aURag9cvT8jwSgT6Qzc1n567GlxZDFE75oCC9d8ELvCNe
LZbXbvub7i+/+d9lZ03L83vlS0ugKDZC2Mev5nk4fHHtb+bPg/A=
収集されるデータ
- ユーザー名
- フルネーム
- 自己紹介(バイオグラフィー)
- ウェブサイト
- 投稿数
- フォロワー数
- フォロー数
- 著者のプロフィールリンク
- チャンネル
- ビジネスプロフィールかどうか
- 非公開プロフィールかどうか
- 認証済みプロフィールかどうか
- アバターのリンク
- Facebookページのリンク
- 投稿に関する情報
- 動画再生回数
- プロフィールのメールアドレス
- プロフィールの所在地
- 電話番号(プロフィールの自己紹介から)
- 著者の投稿
- タイプ
- リンク
- テキスト
- 時間
- コメント数
- いいね数
- メディアへのリンク
- 投稿の高さ
- 投稿の幅
- 投稿者へのリンク
- 所在地
- 再生回数(動画)
- フォローとフォロワー
- 識別子
- プロフィールへのリンク
- ユーザー名
- フルネーム
- 非公開プロフィールかどうか
- 認証済みプロフィールかどうか
- アバターへのリンク
- 潜在的なスパムユーザーかどうか
- 添付リンク
- タイトル
- リンク
- タイプ
ユースケース
- プロフィール情報の収集
- 投稿の収集
- フォロワーの収集
- フォローの収集
Social::Instagram::Postで使用するための投稿URLのスクレイピング
設定
認証のための必須オプションの取得
スポイラー: cookieの見つけ方は?
F12キーを押してデバッグモードを開いた状態で、任意のプロフィールに移動します。
graphql/query 文字列(jsonタイプ)を使用して、スクレイパーに必要な値が格納されているリクエストを探します。
リクエストを選択し、cookie パラメータから値をコピーします。

クエリ
クエリとしてプロフィールのユーザー名を指定する必要があります。例:
cristiano
kyliejenner
結果の出力例
A-Parserは、内蔵のテンプレートエンジン Template Toolkit により柔軟な結果のフォーマットをサポートしており、任意の形式や、CSVやJSONなどの構造化された形式で結果を出力できます。
デフォルト出力
結果フォーマット:
$query: $full_name, followers: $followers_count, following: $following_count\nPosts:\n$posts.format('$link\n')
結果の例:
cristiano: Cristiano Ronaldo, followers: 579975336, following: 558
Posts:
https://www.instagram.com/p/CrmIE7tNddZ/
https://www.instagram.com/p/Crg1arRNXvX/
https://www.instagram.com/p/CrUE3a6tRs4/
https://www.instagram.com/p/CrK_zvLAofv/
https://www.instagram.com/p/CrGMggNq1Cb/
https://www.instagram.com/p/CrEHoMbK0_C/
https://www.instagram.com/p/Cq8QZGDIix1/
https://www.instagram.com/p/CqxINLiOCPK/
https://www.instagram.com/p/CqoZ8pRo91y/
https://www.instagram.com/p/CqjQjCII98k/
https://www.instagram.com/p/CqeFZMFotaH/
https://www.instagram.com/p/CqcihSbAxaH/
フォローおよびフォロワーのプロフィールリンク
結果フォーマット:
Followers:\n$followers.format('$link\n')\nFollowings:\n$followings.format('$link\n')
結果の例:
Followers:
https://www.instagram.com/madhu55745/
https://www.instagram.com/akoy4615/
https://www.instagram.com/kiiitank/
https://www.instagram.com/erzhi19/
https://www.instagram.com/na898poli/
https://www.instagram.com/omronnmaaj/
https://www.instagram.com/abhishak8474/
https://www.instagram.com/karankumarkaran110/
https://www.instagram.com/engin_altannnn/
https://www.instagram.com/biel.full/
Followings:
https://www.instagram.com/rafanery.hrpz/
https://www.instagram.com/hubermanlab/
https://www.instagram.com/insparya_italy/
https://www.instagram.com/gerson_rodrigues_11/
https://www.instagram.com/bernardorsousa/
https://www.instagram.com/eminem/
https://www.instagram.com/spl/
https://www.instagram.com/toto.restaurants/
https://www.instagram.com/thetoolsbook/
https://www.instagram.com/rauwalejandro/
https://www.instagram.com/francisngannou/
https://www.instagram.com/sultan_alghannam/
可能な設定
| パラメータ | デフォルト値 | 説明 |
|---|---|---|
| cookie | 事前にCookieを指定する必要があります | |
| x-csrftoken | x-csrftoken を指定可能(必要な場合) | |
| x-ig-app-id | 936619743392459 | x-ig-app-id を指定可能(必要な場合) |
| Posts pages count | 1 | 投稿のページ数 |
| Followers pages count | 1 | フォロワーのページ数 |
| Followings pages count | 1 | フォローのページ数 |