メインコンテンツへスキップ

Shop::Wildberries::ProductInfo - Wildberries商品ページスクレイパー

img

スクレイパーの概要

Wildberries商品スクレイパーを使用すると、商品ページのリンクのリストから商品データを取得できます。

A-Parserの機能により、スクレイピング設定を後で再利用するために保存(プリセット)したり、スクレイピングのスケジュールを設定したりすることが可能です。クエリの自動展開、ファイルからのサブクエリの置換、英数字の組み合わせやリストの総当たりを使用して、最大限の結果を取得できます。

収集データ

img

基本情報

  • 商品名 (title)
  • WB上のカテゴリパス (category)
  • ブランド (brand)
  • WB上のブランド/カテゴリへのリンク (brandSubUrl)
  • 商品番号、nm ID (sku)
  • 商品説明 (description)
  • 製造国 (country)
  • カラー(; 区切り) (colors)

価格と在庫

  • 旧価格、サイト上の取り消し線価格 (price) — 送料別
  • 割引価格 (discountPrice) — 送料別
  • 別途送料 (logisticsPrice);ない場合は 0
  • WB Wallet価格 (walletPrice) — Currency = RUB の場合のみ;discountPrice から約2%割引、送料別;すべての商品にあるわけではなく、その場合は 0 または空
  • 在庫数 (qty) — 販売数ではありません

サイト上の「最終価格」は、テンプレート内でご自身で計算してください(例:discountPrice + logisticsPrice)。WBの店頭価格は受け取り場所によって異なる場合があるため、スクレイパーは各構成要素を個別に返します。

販売者

  • 販売者名 (seller)
  • 販売者リンク (sellerUrl)
  • 法人名 (sellerLegalName)
  • 納税者番号 (inn)
  • 州登録番号 (ogrn)
  • 商標 (trademark)
  • 法人住所 (legalAddress)

レビュー

  • レビュー数 (comments)
  • 商品評価 (rating)

配列

  • 写真 (photos, フィールド url) — 商品画像のリンク
  • 価格履歴 (prices, フィールド date, price) — フィールドの値が欠落していたり、数が異なったりする場合があります。つまり、商品によって履歴内の日付と価格の数が異なる場合があり、一部の商品ではこの情報が全く提供されないこともあります。
  • WB検索タグ (tags, フィールド tag) — 「この商品と一緒に検索されたキーワード」

ユースケース

  • 商品価格の動向追跡
  • 評価、レビュー、在庫状況による商品の評価
  • すべての商品画像の収集

クエリ

クエリとして、以下のような商品リンクを指定する必要があります:

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

クエリの置換

組み込みのクエリ置換マクロを使用できます。 例えば、スクレイパーが 1 から 100,000 までの商品番号を自動的にリンクに代入するようにしたい場合、{num:START:END} マクロを使用できます。 クエリとして任意の商品のリンクを指定し、商品番号の部分にマクロを記述します:

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

この方法により、商品番号を知らなくてもWildberriesの商品を非常に簡単に自動スクレイピングできます。A-Parserが自動的に番号を順番に代入し、ページにアクセスしてデータがあれば収集します。

可能な設定

パラメータデフォルト値説明
CurrencyRUB結果の価格通貨:RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL。変数 walletPrice は RUB の場合のみ入力されます
Address受け取り場所の住所;座標と共に地域を指定し、価格に影響します
Longitude受け取り場所の経度
Latitude受け取り場所の緯度
Max concurrent browser pages5スクレイパーが同時に開くことができる Chrome ページの数。スレッド数が多い場合は慎重に増やしてください。メモリと CPU の負荷が増大します
Chrome Headlessブラウザをバックグラウンドモード(ウィンドウを表示しない)で起動します。サイトのチェックを通過できない場合やデバッグが必要な場合は、チェックを外してください
注記

デフォルトでは、Wildberries はモスクワの結果を表示します。スクレイパーでは受け取り場所を指定することができ、結果リストを特定の場所に紐付けることが可能です。これを行うには、AddressLongitudeLatitude の 3 つのパラメータを上書きする必要があります。これらのパラメータに必要な値は、ブラウザで取得できます:

1. デベロッパーツール(Chrome では F12 キー)を開いた状態で、目的の受け取り場所を選択します

img

2. 「ネットワーク」タブで create?version=1 というリクエストを探し、データをスクレイパーの設定にコピーします

受け取り場所を選択した後、ネットワーク(英語では Network)タブを開きます。create?version=1 というリクエストを探し、そのレスポンス(Preview)から addresslatlon をそれぞれスクレイパーの AddressLatitudeLongitude フィールドにコピーします。

img