Shop::Wildberries::ProductInfo - scraper voor Wildberries productpagina's

Overzicht van de scraper
Met de Wildberries product scraper kunt u gegevens over producten ophalen op basis van een lijst met links naar de pagina's van deze producten.
De functionaliteit van A-Parser stelt u in staat om instellingen voor gegevensextractie op te slaan voor toekomstig gebruik (presets), extractieschema's in te stellen en nog veel meer. U kunt automatische query-vermenigvuldiging gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het maximaal mogelijke aantal resultaten te verkrijgen.
Verzamelde gegevens

Basisgegevens
- Productnaam (
title) - Categoriepad op WB (
category) - Merk (
brand) - Link naar merk/categorie op WB (
brandSubUrl) - Artikelnummer, nm ID (
sku) - Beschrijving (
description) - Land van herkomst (
country) - Kleuren, gescheiden door
;(colors)
Prijzen en voorraad
- Oude prijs, doorgehaald op de site (
price) — zonder verzending - Prijs met korting (
discountPrice) — zonder verzending - Verzendkosten apart (
logisticsPrice); indien niet aanwezig —0 - Prijs met WB Wallet (
walletPrice) — alleen bij Currency = RUB; korting van ~2% opdiscountPrice, zonder verzending; niet bij alle producten — dan0of leeg - Voorraad in magazijn (
qty) — niet het aantal verkopen
Stel de uiteindelijke prijs "zoals op de site" zelf samen in het sjabloon, bijvoorbeeld discountPrice + logisticsPrice (op de WB-etalage kan het totaalbedrag afhankelijk zijn van het afhaalpunt, de scraper levert de componenten afzonderlijk aan).
Verkoper
- Naam van de verkoper (
seller) - Link naar de verkoper (
sellerUrl) - Juridische naam (
sellerLegalName) - BTW-nummer/INN (
inn) - OGRN (
ogrn) - Handelsmerk (
trademark) - Juridisch adres (
legalAddress)
Reviews
- Aantal reviews (
comments) - Productbeoordeling (
rating)
Arrays
- Foto's (
photos, veldurl) — links naar productafbeeldingen - Prijsgeschiedenis (
prices, veldendate,price) — waarden van velden kunnen ontbreken of verschillen in aantal, wat betekent dat verschillende producten een verschillend aantal datums en prijzen in de geschiedenis kunnen hebben, en voor sommige producten is deze informatie mogelijk helemaal niet beschikbaar - WB zoek-tags (
tags, veldtag) — "Anderen zochten ook naar"
Toepassingen
- Bijhouden van prijsdynamiek van producten
- Beoordelen van producten op basis van rating, reviews en beschikbaarheid
- Verzamelen van alle productafbeeldingen
Query's
Als query's moeten links naar producten worden opgegeven, bijvoorbeeld:
https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP
Query-substituties
U kunt ingebouwde macro's voor query-substitutie gebruiken.
Bijvoorbeeld, we willen dat de scraper automatisch achtereenvolgens van 1 tot 100 000 het artikelnummer in de productlink invult. Hiervoor kan de macro {num:START:END} worden toegepast.
Als query geven we de link naar een willekeurig product op en in plaats van het artikelnummer schrijven we de macro:
https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx
Deze methode maakt het uiterst eenvoudig om automatisch Wildberries-producten te scrapen, zelfs zonder hun artikelnummers te kennen. A-Parser vult zelf het nummer in volgorde in, bezoekt de pagina en verzamelt de gegevens als deze aanwezig zijn.
Mogelijke instellingen
| Parameter | Standaardwaarde | Beschrijving |
|---|---|---|
| Currency | RUB | Valuta van prijzen in resultaten: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. De variabele walletPrice wordt alleen ingevuld bij RUB |
| Address | Adres van het afhaalpunt; bepaalt samen met de coördinaten de regio en beïnvloedt de prijzen | |
| Longitude | Lengtegraad van het afhaalpunt | |
| Latitude | Breedtegraad van het afhaalpunt | |
| Max concurrent browser pages | 5 | Hoeveel Chrome-pagina's de scraper tegelijkertijd kan openen. Bij een groot aantal threads voorzichtig verhogen — de belasting op geheugen en CPU neemt toe |
| Chrome Headless | ☑ | Browser starten in de achtergrondmodus (zonder zichtbaar venster). Als de controle op de site niet lukt of als er debugging nodig is — vink dit uit |
Standaard toont Wildberries resultaten voor Moskou. In de scraper is het mogelijk om een afhaalpunt in te stellen, waardoor de resultatenlijst wordt gekoppeld aan een specifieke locatie. Om dit te doen, moeten 3 parameters worden overschreven: Address, Longitude en Latitude. U kunt de benodigde waarden voor deze parameters in de browser verkrijgen:
1. Kies het gewenste afhaalpunt, nadat u de Ontwikkelaarstools heeft geopend (in Chrome toets F12)

2. In het tabblad «Netwerk» zoeken we de aanvraag create?version=1 en kopiëren we de gegevens naar de scraper-instellingen
Na het selecteren van het afhaalpunt opent u het tabblad Netwerk (in Chrome in het Engels — Network). Zoek de aanvraag create?version=1, kopieer in het antwoord (Preview) address, lat en lon naar respectievelijk de velden Address, Latitude en Longitude van de scraper.
