Shop::Wildberries::ProductInfo - Wildberries 商品详情页爬虫工具

爬虫工具概览
通过使用 Wildberries 商品爬虫工具,您可以根据商品页面链接列表获取商品数据。
A-Parser 的功能允许您保存数据抓取设置以便后续使用(预设)、设置数据抓取计划等。您可以使用自动查询扩展、从文件中替换子查询、遍历数字字母组合和列表,以获取尽可能多的结果。
采集的数据

基础信息
- 商品名称 (
title) - WB 上的分类路径 (
category) - 品牌 (
brand) - WB 上的品牌/分类链接 (
brandSubUrl) - 货号, nm ID (
sku) - 描述 (
description) - 产地 (
country) - 颜色,以
;分隔 (colors)
价格与库存
- 原价,网站上的划线价 (
price) —— 不含运费 - 折扣价 (
discountPrice) —— 不含运费 - 运费单独显示 (
logisticsPrice);如果没有则为0 - WB 钱包价格 (
walletPrice) —— 仅在 Currency = RUB 时有效;约为discountPrice的 2% 折扣,不含运费;并非所有商品都有 —— 此时为0或为空 - 库存余额 (
qty) —— 并非销量
请在模板中自行计算“与网站一致”的最终价格,例如 discountPrice + logisticsPrice(WB 前台显示的总额可能取决于自提点,爬虫工具分别提供各组成部分)。
卖家信息
- 卖家名称 (
seller) - 卖家链接 (
sellerUrl) - 法定名称 (
sellerLegalName) - 纳税人识别号 (
inn) - 主体登记号 (
ogrn) - 注册商标 (
trademark) - 注册地址 (
legalAddress)
评价
- 评价数量 (
comments) - 商品评分 (
rating)
数组
- 照片 (
photos, 字段url) —— 商品图片链接 - 价格历史 (
prices, 字段date,price) —— 字段值可能缺失或数量不一,即不同商品的历史日期和价格数量可能不同,部分商品可能完全没有此信息 - WB 搜索标签 (
tags, 字段tag) —— “搜索此商品的用户还看了”
应用场景
- 监控商品价格动态
- 根据评分、评价和库存评估商品
- 采集所有商品图片
查询
查询时需要指定商品链接,例如:
https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP
查询宏替换
您可以使用内置查询替换宏。
例如,我们希望爬虫工具自动按顺序将 1 到 100 000 的货号代入商品链接。为此可以使用宏 {num:START:END}。
在查询中指定任意商品链接,并将货号部分替换为宏:
https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx
这种方法可以非常轻松地自动抓取 Wildberries 商品,甚至无需预先知道它们的货号。A-Parser 将自动按顺序替换编号,访问页面并在数据存在时进行采集。
可用设置
| 参数 | 默认值 | 描述 |
|---|---|---|
| Currency | RUB | 结果中的价格货币:RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL。变量 walletPrice 仅在 RUB 时填充 |
| Address | 自提点地址;与坐标一起定义区域并影响价格 | |
| Longitude | 自提点经度 | |
| Latitude | 自提点纬度 | |
| Max concurrent browser pages | 5 | 爬虫工具可同时打开的 Chrome 页面数量。在高线程数下请谨慎增加 —— 会增加内存和 CPU 负载 |
| Chrome Headless | ☑ | 在后台模式下启动浏览器(无可见窗口)。如果网站校验不通过或需要调试 —— 请取消勾选 |
备注
默认情况下,Wildberries 显示莫斯科的结果。在爬虫工具中可以设置自提点,结果列表将绑定到特定位置。为此需要重写 3 个参数:Address、Longitude 和 Latitude。可以在浏览器中获取这些参数所需的值:
1. 预先打开开发者工具(Chrome 中按 F12 键),选择所需的自提点

2. 在“网络”选项卡中查找请求 create?version=1 并将数据复制到爬虫工具设置中
选择自提点后,打开 网络 选项卡(Chrome 英文版为 Network)。找到请求 create?version=1,在响应(Preview)中将 address、lat 和 lon 分别复制到爬虫工具的 Address、Latitude 和 Longitude 字段中。
