メインコンテンツへスキップ

Social::Instagram::Profile - Instagramスクレイパー。Instagramプロフィールのデータ収集

Social::Instagram::Profile

スクレイパーの概要

Social::Instagram::ProfileSocial::Instagram::Profile – Instagramのプロフィールデータをスクレイピングします。Instagramスクレイパーを使用すると、ユーザープロフィールから大量のデータを効率的にスクレイピングできます。収集可能なデータには、ユーザー名、名前、自己紹介、ウェブサイト、投稿数などが含まれます。収集データの全リストは、該当するセクションに記載されています。

A-Parserの機能により、Social::Instagram::Profile スクレイパーのスクレイピング設定を後で利用するために保存(プリセット)したり、スクレイピングのスケジュールを設定したりすることが可能です。

結果の保存は、内蔵の強力なテンプレートエンジン Template Toolkit により、必要な形式や構造で保存できます。これにより、結果に追加のロジックを適用したり、JSON、SQL、CSV を含む様々なフォーマットでデータを出力したりできます。

注記

スクレイパーは認証済みアカウントのデータを使用します。 スクレイパーを動作させるには、cookie オプションの値を必ず指定する必要があります。

スクレイパーのユースケース

投稿へのリンク収集
  1. Result format オプションを上書きし、値として $posts.format('$link\n') を指定します。
  2. Posts pages count オプションを上書きし、リストから All を選択します。
  3. クエリとしてプロフィールのリンクを指定します。
例をダウンロード

A-Parserへのプリセットインポート方法

eJx9U01v2zAM/SuBkMMGBEF72MUYBqTBArTI6qxpT0EOhEVnamRRk+RsneH/Pkpx
7CT78Mn8eI98ItmIAH7vVw49Bi+yTSNs+heZkFhCrYOYCAvOo4vhjVhToUBn2b3x
AXYOqixbOSqVRk7sIY0IbxaZhA7onJIxqCTbBdFeResAuo4JH+fJ40dUjsCMoA7f
yKlfKEdQFFSb8Em0/6az5INfwQ7nMXWgvb3hr91uJ4LVcEd+Qa6CqGpsb6edxD64
hgM+Ewc7GScMW49QxbpjCQFjdFomonfvp+FnZAApVVBkQB8rxEcaqr4Y9T2pNMS5
/OtY6cJRxa6AiSA6307dbcQ42YIp6oT9esSIrATtcSI8t7oAbkReR1RAB4FcbmM/
7G8EmZnWSzygHtIS/12ttOSJzkoG3XfAv6fkf3C0vbzzUjyYH4576FmSdZd/GVCS
lrQ7PYZWlQps++PkMnHDzj2i7d/sMaZV5LAv0zF31XlpLZq4BcPIZnZwXci4GMul
syBTql3ebdYpszbPfBm5mVNlNUZdptaax+LxaViPme/GEI2hwWvwPJW4uKlApP3D
+tiqdYrX70NssOKXPK/aURag9cvT8jwSgT6Qzc1n567GlxZDFE75oCC9d8ELvCNe
LZbXbvub7i+/+d9lZ03L83vlS0ugKDZC2Mev5nk4fHHtb+bPg/A=

収集されるデータ

  • ユーザー名
  • フルネーム
  • 自己紹介(バイオグラフィー)
  • ウェブサイト
  • 投稿数
  • フォロワー数
  • フォロー数
  • 著者のプロフィールリンク
  • チャンネル
  • ビジネスプロフィールかどうか
  • 非公開プロフィールかどうか
  • 認証済みプロフィールかどうか
  • アバターのリンク
  • Facebookページのリンク
  • 投稿に関する情報
  • 動画再生回数
  • プロフィールのメールアドレス
  • プロフィールの所在地
  • 電話番号(プロフィールの自己紹介から)
  • 著者の投稿
    • タイプ
    • リンク
    • テキスト
    • 時間
    • コメント数
    • いいね数
    • メディアへのリンク
    • 投稿の高さ
    • 投稿の幅
    • 投稿者へのリンク
    • 所在地
    • 再生回数(動画)
  • フォローとフォロワー
    • 識別子
    • プロフィールへのリンク
    • ユーザー名
    • フルネーム
    • 非公開プロフィールかどうか
    • 認証済みプロフィールかどうか
    • アバターへのリンク
    • 潜在的なスパムユーザーかどうか
  • 添付リンク
    • タイトル
    • リンク
    • タイプ

ユースケース

  • プロフィール情報の収集
  • 投稿の収集
  • フォロワーの収集
  • フォローの収集
  • Social::Instagram::PostSocial::Instagram::Postで使用するための投稿URLのスクレイピング

設定

認証のための必須オプションの取得

スポイラー: cookieの見つけ方は?

F12キーを押してデバッグモードを開いた状態で、任意のプロフィールに移動します。 デバッグ graphql/query 文字列(jsonタイプ)を使用して、スクレイパーに必要な値が格納されているリクエストを探します。 検索 リクエストを選択し、cookie パラメータから値をコピーします。 値

クエリ

クエリとしてプロフィールのユーザー名を指定する必要があります。例:

cristiano 
kyliejenner

結果の出力例

A-Parserは、内蔵のテンプレートエンジン Template Toolkit により柔軟な結果のフォーマットをサポートしており、任意の形式や、CSVやJSONなどの構造化された形式で結果を出力できます。

デフォルト出力

結果フォーマット:

$query: $full_name, followers: $followers_count, following: $following_count\nPosts:\n$posts.format('$link\n')

結果の例:

cristiano: Cristiano Ronaldo, followers: 579975336, following: 558
Posts:
https://www.instagram.com/p/CrmIE7tNddZ/
https://www.instagram.com/p/Crg1arRNXvX/
https://www.instagram.com/p/CrUE3a6tRs4/
https://www.instagram.com/p/CrK_zvLAofv/
https://www.instagram.com/p/CrGMggNq1Cb/
https://www.instagram.com/p/CrEHoMbK0_C/
https://www.instagram.com/p/Cq8QZGDIix1/
https://www.instagram.com/p/CqxINLiOCPK/
https://www.instagram.com/p/CqoZ8pRo91y/
https://www.instagram.com/p/CqjQjCII98k/
https://www.instagram.com/p/CqeFZMFotaH/
https://www.instagram.com/p/CqcihSbAxaH/

フォローおよびフォロワーのプロフィールリンク

結果フォーマット:

Followers:\n$followers.format('$link\n')\nFollowings:\n$followings.format('$link\n')

結果の例:

Followers:
https://www.instagram.com/madhu55745/
https://www.instagram.com/akoy4615/
https://www.instagram.com/kiiitank/
https://www.instagram.com/erzhi19/
https://www.instagram.com/na898poli/
https://www.instagram.com/omronnmaaj/
https://www.instagram.com/abhishak8474/
https://www.instagram.com/karankumarkaran110/
https://www.instagram.com/engin_altannnn/
https://www.instagram.com/biel.full/

Followings:
https://www.instagram.com/rafanery.hrpz/
https://www.instagram.com/hubermanlab/
https://www.instagram.com/insparya_italy/
https://www.instagram.com/gerson_rodrigues_11/
https://www.instagram.com/bernardorsousa/
https://www.instagram.com/eminem/
https://www.instagram.com/spl/
https://www.instagram.com/toto.restaurants/
https://www.instagram.com/thetoolsbook/
https://www.instagram.com/rauwalejandro/
https://www.instagram.com/francisngannou/
https://www.instagram.com/sultan_alghannam/

可能な設定

パラメータデフォルト値説明
cookie事前にCookieを指定する必要があります
x-csrftokenx-csrftoken を指定可能(必要な場合)
x-ig-app-id936619743392459x-ig-app-id を指定可能(必要な場合)
Posts pages count1投稿のページ数
Followers pages count1フォロワーのページ数
Followings pages count1フォローのページ数