Shop::Wildberries::ProductInfo - công cụ cào dữ liệu trang sản phẩm Wildberries

Tổng quan về công cụ cào dữ liệu
Sử dụng công cụ cào dữ liệu sản phẩm Wildberries, bạn có thể nhận dữ liệu về sản phẩm theo danh sách liên kết đến các trang sản phẩm đó.
Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế truy vấn con từ tệp, lặp qua các tổ hợp chữ-số và danh sách để nhận được số lượng kết quả tối đa có thể.
Dữ liệu thu thập được

Cơ bản
- Tên sản phẩm (
title) - Đường dẫn danh mục trên WB (
category) - Thương hiệu (
brand) - Liên kết đến thương hiệu/danh mục trên WB (
brandSubUrl) - Mã sản phẩm, nm ID (
sku) - Mô tả (
description) - Quốc gia sản xuất (
country) - Màu sắc, phân cách bằng
;(colors)
Giá và tình trạng hàng
- Giá cũ, giá gạch ngang trên trang web (
price) — không bao gồm phí vận chuyển - Giá sau khi giảm giá (
discountPrice) — không bao gồm phí vận chuyển - Phí vận chuyển riêng (
logisticsPrice); nếu không có —0 - Giá với Ví WB (
walletPrice) — chỉ khi Currency = RUB; giảm khoảng 2% từdiscountPrice, không bao gồm phí vận chuyển; không phải sản phẩm nào cũng có — khi đó là0hoặc để trống - Tồn kho (
qty) — không phải số lượng bán
Tự tính giá cuối cùng "như trên trang web" trong mẫu của bạn, ví dụ discountPrice + logisticsPrice (trên giao diện WB, tổng số tiền có thể phụ thuộc vào điểm nhận hàng, công cụ cào dữ liệu trả về các thành phần riêng biệt).
Người bán
- Tên người bán (
seller) - Liên kết đến người bán (
sellerUrl) - Tên pháp nhân (
sellerLegalName) - Mã số thuế (
inn) - Mã số đăng ký kinh doanh (
ogrn) - Nhãn hiệu thương mại (
trademark) - Địa chỉ pháp lý (
legalAddress)
Đánh giá
- Số lượng đánh giá (
comments) - Xếp hạng sản phẩm (
rating)
Mảng dữ liệu
- Ảnh (
photos, trườngurl) — liên kết đến hình ảnh sản phẩm - Lịch sử giá (
prices, các trườngdate,price) — giá trị các trường có thể thiếu hoặc khác nhau về số lượng, nghĩa là các sản phẩm khác nhau có thể có số lượng ngày và giá khác nhau trong lịch sử, và đối với một số sản phẩm, thông tin này có thể không hiển thị - Thẻ tìm kiếm WB (
tags, trườngtag) — "Người dùng cũng tìm kiếm với sản phẩm này"
Ứng dụng
- Theo dõi biến động giá sản phẩm
- Đánh giá sản phẩm theo xếp hạng, đánh giá và tình trạng hàng
- Thu thập tất cả hình ảnh sản phẩm
Truy vấn
Trong các truy vấn, bạn cần chỉ định liên kết đến sản phẩm, ví dụ:
https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP
Thay thế truy vấn
Bạn có thể sử dụng macro tích hợp để thay thế truy vấn.
Ví dụ: chúng ta muốn công cụ cào dữ liệu tự động thay thế số mã sản phẩm vào liên kết sản phẩm theo thứ tự từ 1 đến 100 000. Để làm điều này, bạn có thể áp dụng macro {num:START:END}.
Trong truy vấn, hãy chỉ định liên kết đến bất kỳ sản phẩm nào và thay thế mã sản phẩm bằng macro:
https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx
Phương pháp này cho phép cào dữ liệu sản phẩm Wildberries một cách dễ dàng và tự động nhất ngay cả khi không biết mã sản phẩm của chúng. A-Parser sẽ tự động thay thế số theo thứ tự, truy cập trang và thu thập dữ liệu nếu có.
Các cài đặt có thể
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Currency | RUB | Đơn vị tiền tệ của giá trong kết quả: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. Biến walletPrice chỉ được điền khi chọn RUB |
| Address | Địa chỉ điểm nhận hàng; cùng với tọa độ xác định khu vực và ảnh hưởng đến giá cả | |
| Longitude | Kinh độ của điểm nhận hàng | |
| Latitude | Vĩ độ của điểm nhận hàng | |
| Max concurrent browser pages | 5 | Số lượng trang Chrome mà công cụ cào dữ liệu có thể mở đồng thời. Khi có số lượng luồng lớn, hãy tăng cẩn thận — tải trọng lên bộ nhớ và CPU sẽ tăng |
| Chrome Headless | ☑ | Chạy trình duyệt ở chế độ ẩn (không có cửa sổ hiển thị). Nếu việc kiểm tra trên trang web không vượt qua hoặc cần gỡ lỗi — hãy bỏ chọn |
Theo mặc định, Wildberries hiển thị kết quả cho Moscow. Trong công cụ cào dữ liệu, có khả năng thiết lập điểm nhận hàng và danh sách kết quả sẽ được gắn với một địa điểm cụ thể. Để làm điều này, bạn cần xác định lại 3 tham số: Address, Longitude và Latitude. Bạn có thể lấy các giá trị cần thiết cho các tham số này trong trình duyệt:
1. Chọn điểm nhận hàng mong muốn, sau khi đã mở Công cụ dành cho nhà phát triển (trong Chrome nhấn phím F12)

2. Trong tab «Mạng», tìm yêu cầu create?version=1 và sao chép dữ liệu vào cài đặt công cụ cào dữ liệu
Sau khi chọn điểm nhận hàng, hãy mở tab Mạng (trong Chrome tiếng Anh là Network). Tìm yêu cầu create?version=1, trong phản hồi (Preview), hãy sao chép address, lat và lon vào các trường Address, Latitude và Longitude của công cụ cào dữ liệu tương ứng.
