Shop::Wildberries::ProductInfo - Wildberries商品ページスクレイパー

スクレイパーの概要
Wildberries商品スクレイパーを使用すると、商品ページのリンクのリストから商品データを取得できます。
A-Parserの機能により、スクレイピング設定を後で再利用するために保存(プリセット)したり、スクレイピングのスケジュールを設定したりすることが可能です。クエリの自動展開、ファイルからのサブクエリの置換、英数字の組み合わせやリストの総当たりを使用して、最大限の結果を取得できます。
収集データ

基本情報
- 商品名 (
title) - WB上のカテゴリパス (
category) - ブランド (
brand) - WB上のブランド/カテゴリへのリンク (
brandSubUrl) - 商品番号、nm ID (
sku) - 商品説明 (
description) - 製造国 (
country) - カラー(
;区切り) (colors)
価格と在庫
- 旧価格、サイト上の取り消し線価格 (
price) — 送料別 - 割引価格 (
discountPrice) — 送料別 - 別途送料 (
logisticsPrice);ない場合は0 - WB Wallet価格 (
walletPrice) — Currency = RUB の場合のみ;discountPriceから約2%割引、送料別;すべての商品にあるわけではなく、その場合は0または空 - 在庫数 (
qty) — 販売数ではありません
サイト上の「最終価格」は、テンプレート内でご自身で計算してください(例:discountPrice + logisticsPrice)。WBの店頭価格は受け取り場所によって異なる場合があるため、スクレイパーは各構成要素を個別に返します。
販売者
- 販売者名 (
seller) - 販売者リンク (
sellerUrl) - 法人名 (
sellerLegalName) - 納税者番号 (
inn) - 州登録番号 (
ogrn) - 商標 (
trademark) - 法人住所 (
legalAddress)
レビュー
- レビュー数 (
comments) - 商品評価 (
rating)
配列
- 写真 (
photos, フィールドurl) — 商品画像のリンク - 価格履歴 (
prices, フィールドdate,price) — フィールドの値が欠落していたり、数が異なったりする場合があります。つまり、商品によって履歴内の日付と価格の数が異なる場合があり、一部の商品ではこの情報が全く提供されないこともあります。 - WB検索タグ (
tags, フィールドtag) — 「この商品と一緒に検索されたキーワード」
ユースケース
- 商品価格の動向追跡
- 評価、レビュー、在庫状況による商品の評価
- すべての商品画像の収集
クエリ
クエリとして、以下のような商品リンクを指定する必要があります:
https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP
クエリの置換
組み込みのクエリ置換マクロを使用できます。
例えば、スクレイパーが 1 から 100,000 までの商品番号を自動的にリンクに代入するようにしたい場合、{num:START:END} マクロを使用できます。
クエリとして任意の商品のリンクを指定し、商品番号の部分にマクロを記述します:
https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx
この方法により、商品番号を知らなくてもWildberriesの商品を非常に簡単に自動スクレイピングできます。A-Parserが自動的に番号を順番に代入し、ページにアクセスしてデータがあれば収集します。
可能な設定
| パラメータ | デフォルト値 | 説明 |
|---|---|---|
| Currency | RUB | 結果の価格通貨:RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL。変数 walletPrice は RUB の場合のみ入力されます |
| Address | 受け取り場所の住所;座標と共に地域を指定し、価格に影響します | |
| Longitude | 受け取り場所の経度 | |
| Latitude | 受け取り場所の緯度 | |
| Max concurrent browser pages | 5 | スクレイパーが同時に開くことができる Chrome ページの数。スレッド数が多い場合は慎重に増やしてください。メモリと CPU の負荷が増大します |
| Chrome Headless | ☑ | ブラウザをバックグラウンドモード(ウィンドウを表示しない)で起動します。サイトのチェックを通過できない場合やデバッグが必要な場合は、チェックを外してください |
デフォルトでは、Wildberries はモスクワの結果を表示します。スクレイパーでは受け取り場所を指定することができ、結果リストを特定の場所に紐付けることが可能です。これを行うには、Address、Longitude、Latitude の 3 つのパラメータを上書きする必要があります。これらのパラメータに必要な値は、ブラウザで取得できます:
1. デベロッパーツール(Chrome では F12 キー)を開いた状態で、目的の受け取り場所を選択します

2. 「ネットワーク」タブで create?version=1 というリクエストを探し、データをスクレイパーの設定にコピーします
受け取り場所を選択した後、ネットワーク(英語では Network)タブを開きます。create?version=1 というリクエストを探し、そのレスポンス(Preview)から address、lat、lon をそれぞれスクレイパーの Address、Latitude、Longitude フィールドにコピーします。
