跳转到主要内容

Shop::Wildberries::ProductInfo - Wildberries 商品详情页爬虫工具

图片

爬虫工具概览

通过使用 Wildberries 商品爬虫工具,您可以根据商品页面链接列表获取商品数据。

A-Parser 的功能允许您保存数据抓取设置以便后续使用(预设)、设置数据抓取计划等。您可以使用自动查询扩展、从文件中替换子查询、遍历数字字母组合和列表,以获取尽可能多的结果。

采集的数据

图片

基础信息

  • 商品名称 (title)
  • WB 上的分类路径 (category)
  • 品牌 (brand)
  • WB 上的品牌/分类链接 (brandSubUrl)
  • 货号, nm ID (sku)
  • 描述 (description)
  • 产地 (country)
  • 颜色,以 ; 分隔 (colors)

价格与库存

  • 原价,网站上的划线价 (price) —— 不含运费
  • 折扣价 (discountPrice) —— 不含运费
  • 运费单独显示 (logisticsPrice);如果没有则为 0
  • WB 钱包价格 (walletPrice) —— 仅在 Currency = RUB 时有效;约为 discountPrice 的 2% 折扣,不含运费;并非所有商品都有 —— 此时为 0 或为空
  • 库存余额 (qty) —— 并非销量

请在模板中自行计算“与网站一致”的最终价格,例如 discountPrice + logisticsPrice(WB 前台显示的总额可能取决于自提点,爬虫工具分别提供各组成部分)。

卖家信息

  • 卖家名称 (seller)
  • 卖家链接 (sellerUrl)
  • 法定名称 (sellerLegalName)
  • 纳税人识别号 (inn)
  • 主体登记号 (ogrn)
  • 注册商标 (trademark)
  • 注册地址 (legalAddress)

评价

  • 评价数量 (comments)
  • 商品评分 (rating)

数组

  • 照片 (photos, 字段 url) —— 商品图片链接
  • 价格历史 (prices, 字段 date, price) —— 字段值可能缺失或数量不一,即不同商品的历史日期和价格数量可能不同,部分商品可能完全没有此信息
  • WB 搜索标签 (tags, 字段 tag) —— “搜索此商品的用户还看了”

应用场景

  • 监控商品价格动态
  • 根据评分、评价和库存评估商品
  • 采集所有商品图片

查询

查询时需要指定商品链接,例如:

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

查询宏替换

您可以使用内置查询替换宏。 例如,我们希望爬虫工具自动按顺序将 1100 000 的货号代入商品链接。为此可以使用宏 {num:START:END}。 在查询中指定任意商品链接,并将货号部分替换为宏:

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

这种方法可以非常轻松地自动抓取 Wildberries 商品,甚至无需预先知道它们的货号。A-Parser 将自动按顺序替换编号,访问页面并在数据存在时进行采集。

可用设置

参数默认值描述
CurrencyRUB结果中的价格货币:RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL。变量 walletPrice 仅在 RUB 时填充
Address自提点地址;与坐标一起定义区域并影响价格
Longitude自提点经度
Latitude自提点纬度
Max concurrent browser pages5爬虫工具可同时打开的 Chrome 页面数量。在高线程数下请谨慎增加 —— 会增加内存和 CPU 负载
Chrome Headless在后台模式下启动浏览器(无可见窗口)。如果网站校验不通过或需要调试 —— 请取消勾选
备注

默认情况下,Wildberries 显示莫斯科的结果。在爬虫工具中可以设置自提点,结果列表将绑定到特定位置。为此需要重写 3 个参数:AddressLongitudeLatitude。可以在浏览器中获取这些参数所需的值:

1. 预先打开开发者工具(Chrome 中按 F12 键),选择所需的自提点

图片

2. 在“网络”选项卡中查找请求 create?version=1 并将数据复制到爬虫工具设置中

选择自提点后,打开 网络 选项卡(Chrome 英文版为 Network)。找到请求 create?version=1,在响应(Preview)中将 addresslatlon 分别复制到爬虫工具的 AddressLatitudeLongitude 字段中。

图片