Chuyển đến nội dung chính

Shop::Wildberries::ProductInfo - công cụ cào dữ liệu trang sản phẩm Wildberries

img

Tổng quan về công cụ cào dữ liệu

Sử dụng công cụ cào dữ liệu sản phẩm Wildberries, bạn có thể nhận dữ liệu về sản phẩm theo danh sách liên kết đến các trang sản phẩm đó.

Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế truy vấn con từ tệp, lặp qua các tổ hợp chữ-số và danh sách để nhận được số lượng kết quả tối đa có thể.

Dữ liệu thu thập được

img

Cơ bản

  • Tên sản phẩm (title)
  • Đường dẫn danh mục trên WB (category)
  • Thương hiệu (brand)
  • Liên kết đến thương hiệu/danh mục trên WB (brandSubUrl)
  • Mã sản phẩm, nm ID (sku)
  • Mô tả (description)
  • Quốc gia sản xuất (country)
  • Màu sắc, phân cách bằng ; (colors)

Giá và tình trạng hàng

  • Giá cũ, giá gạch ngang trên trang web (price) — không bao gồm phí vận chuyển
  • Giá sau khi giảm giá (discountPrice) — không bao gồm phí vận chuyển
  • Phí vận chuyển riêng (logisticsPrice); nếu không có — 0
  • Giá với Ví WB (walletPrice) — chỉ khi Currency = RUB; giảm khoảng 2% từ discountPrice, không bao gồm phí vận chuyển; không phải sản phẩm nào cũng có — khi đó là 0 hoặc để trống
  • Tồn kho (qty) — không phải số lượng bán

Tự tính giá cuối cùng "như trên trang web" trong mẫu của bạn, ví dụ discountPrice + logisticsPrice (trên giao diện WB, tổng số tiền có thể phụ thuộc vào điểm nhận hàng, công cụ cào dữ liệu trả về các thành phần riêng biệt).

Người bán

  • Tên người bán (seller)
  • Liên kết đến người bán (sellerUrl)
  • Tên pháp nhân (sellerLegalName)
  • Mã số thuế (inn)
  • Mã số đăng ký kinh doanh (ogrn)
  • Nhãn hiệu thương mại (trademark)
  • Địa chỉ pháp lý (legalAddress)

Đánh giá

  • Số lượng đánh giá (comments)
  • Xếp hạng sản phẩm (rating)

Mảng dữ liệu

  • Ảnh (photos, trường url) — liên kết đến hình ảnh sản phẩm
  • Lịch sử giá (prices, các trường date, price) — giá trị các trường có thể thiếu hoặc khác nhau về số lượng, nghĩa là các sản phẩm khác nhau có thể có số lượng ngày và giá khác nhau trong lịch sử, và đối với một số sản phẩm, thông tin này có thể không hiển thị
  • Thẻ tìm kiếm WB (tags, trường tag) — "Người dùng cũng tìm kiếm với sản phẩm này"

Ứng dụng

  • Theo dõi biến động giá sản phẩm
  • Đánh giá sản phẩm theo xếp hạng, đánh giá và tình trạng hàng
  • Thu thập tất cả hình ảnh sản phẩm

Truy vấn

Trong các truy vấn, bạn cần chỉ định liên kết đến sản phẩm, ví dụ:

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

Thay thế truy vấn

Bạn có thể sử dụng macro tích hợp để thay thế truy vấn. Ví dụ: chúng ta muốn công cụ cào dữ liệu tự động thay thế số mã sản phẩm vào liên kết sản phẩm theo thứ tự từ 1 đến 100 000. Để làm điều này, bạn có thể áp dụng macro {num:START:END}. Trong truy vấn, hãy chỉ định liên kết đến bất kỳ sản phẩm nào và thay thế mã sản phẩm bằng macro:

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

Phương pháp này cho phép cào dữ liệu sản phẩm Wildberries một cách dễ dàng và tự động nhất ngay cả khi không biết mã sản phẩm của chúng. A-Parser sẽ tự động thay thế số theo thứ tự, truy cập trang và thu thập dữ liệu nếu có.

Các cài đặt có thể

Tham sốGiá trị mặc địnhMô tả
CurrencyRUBĐơn vị tiền tệ của giá trong kết quả: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. Biến walletPrice chỉ được điền khi chọn RUB
AddressĐịa chỉ điểm nhận hàng; cùng với tọa độ xác định khu vực và ảnh hưởng đến giá cả
LongitudeKinh độ của điểm nhận hàng
LatitudeVĩ độ của điểm nhận hàng
Max concurrent browser pages5Số lượng trang Chrome mà công cụ cào dữ liệu có thể mở đồng thời. Khi có số lượng luồng lớn, hãy tăng cẩn thận — tải trọng lên bộ nhớ và CPU sẽ tăng
Chrome HeadlessChạy trình duyệt ở chế độ ẩn (không có cửa sổ hiển thị). Nếu việc kiểm tra trên trang web không vượt qua hoặc cần gỡ lỗi — hãy bỏ chọn
ghi chú

Theo mặc định, Wildberries hiển thị kết quả cho Moscow. Trong công cụ cào dữ liệu, có khả năng thiết lập điểm nhận hàng và danh sách kết quả sẽ được gắn với một địa điểm cụ thể. Để làm điều này, bạn cần xác định lại 3 tham số: Address, LongitudeLatitude. Bạn có thể lấy các giá trị cần thiết cho các tham số này trong trình duyệt:

1. Chọn điểm nhận hàng mong muốn, sau khi đã mở Công cụ dành cho nhà phát triển (trong Chrome nhấn phím F12)

img

2. Trong tab «Mạng», tìm yêu cầu create?version=1 và sao chép dữ liệu vào cài đặt công cụ cào dữ liệu

Sau khi chọn điểm nhận hàng, hãy mở tab Mạng (trong Chrome tiếng Anh là Network). Tìm yêu cầu create?version=1, trong phản hồi (Preview), hãy sao chép address, latlon vào các trường Address, LatitudeLongitude của công cụ cào dữ liệu tương ứng.

img