Shop::Wildberries::ProductInfo - scraper de page produit Wildberries

Présentation du scraper

En utilisant le scraper de produits Wildberries, vous pouvez obtenir des données sur les produits à partir d'une liste de liens vers les pages de ces produits.

La fonctionnalité d'A-Parser permet de sauvegarder les paramètres de collecte de données pour une utilisation ultérieure (présélections), de définir un calendrier de collecte de données et bien plus encore. Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, l'itération de combinaisons alphanumériques et de listes pour obtenir le maximum de résultats possible.

Accéder à la DÉMO Acheter A-Parser Pro ($299)

Données collectées

Principales

Nom du produit (title)
Chemin de la catégorie sur WB (category)
Marque (brand)
Lien vers la marque/catégorie sur WB (brandSubUrl)
Référence, nm ID (sku)
Description (description)
Pays de fabrication (country)
Couleurs, séparées par ; (colors)

Prix et stock

Ancien prix, barré sur le site (price) — hors livraison
Prix remisé (discountPrice) — hors livraison
Livraison séparée (logisticsPrice) ; si aucune — 0
Prix avec WB Wallet (walletPrice) — uniquement si Currency = RUB ; remise d'environ 2% sur discountPrice, hors livraison ; pas pour tous les produits — dans ce cas 0 ou vide
Stock restant (qty) — n'est pas le nombre de ventes

Calculez le prix final « comme sur le site » vous-même dans le gabarit, par exemple discountPrice + logisticsPrice (sur la vitrine WB, le montant peut dépendre du point de retrait, le scraper renvoie les composants séparément).

Vendeur

Nom du vendeur (seller)
Lien vers le vendeur (sellerUrl)
Nom légal de l'entreprise (sellerLegalName)
INN (inn)
OGRN (ogrn)
Marque commerciale (trademark)
Adresse légale (legalAddress)

Avis

Nombre d'avis (comments)
Note du produit (rating)

Tableaux

Photos (photos, champ url) — liens vers les images du produit
Historique des prix (prices, champs date, price) — les valeurs des champs peuvent être absentes ou varier en quantité, ce qui signifie que différents produits peuvent avoir un nombre différent de dates et de prix dans l'historique, et pour certains produits, cette information peut ne pas être présente du tout
Tags de recherche WB (tags, champ tag) — « Recherché avec ce produit »

Cas d'utilisation

Suivi de la dynamique des prix des produits
Évaluation des produits par note, avis et disponibilité
Collecte de toutes les images des produits

Requêtes

Vous devez spécifier des liens vers les produits comme requêtes, par exemple :

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

Substitutions de requêtes

Vous pouvez utiliser les macros intégrées de substitution de requêtes. Par exemple, nous voulons que le scraper insère automatiquement et successivement le numéro d'article dans le lien du produit de 1 à 100 000. Pour cela, on peut appliquer la macro {num:START:END}. Comme requête, indiquons le lien vers n'importe quel produit et à la place de l'article, inscrivons la macro :

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

Cette méthode permet de collecter les données des produits Wildberries très facilement et automatiquement, même sans connaître leurs articles. A-Parser insérera lui-même le numéro dans l'ordre, se rendra sur la page et collectera les données si elles existent.

Paramètres possibles

note

Paramètres communs pour tous les scrapers

Paramètre	Valeur par défaut	Description
Currency	`RUB`	Devise des prix dans les résultats : RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. La variable `walletPrice` n'est renseignée que pour le RUB
Address		Adresse du point de retrait ; avec les coordonnées, elle définit la région et influence les prix
Longitude		Longitude du point de retrait
Latitude		Latitude du point de retrait
Max concurrent browser pages	`5`	Le nombre de pages Chrome que le scraper peut ouvrir simultanément. À augmenter avec prudence en cas de nombre élevé de threads — la charge sur la mémoire et le CPU augmente
Chrome Headless	`☑`	Lancement du navigateur en arrière-plan (sans fenêtre visible). Si la vérification sur le site échoue ou si un débogage est nécessaire — décochez la case

note

Par défaut, Wildberries affiche les résultats pour Moscou. Dans le scraper, il est possible de définir un point de retrait et la liste des résultats sera liée à un emplacement spécifique. Pour ce faire, vous devez redéfinir 3 paramètres : Address, Longitude et Latitude. Vous pouvez obtenir les valeurs nécessaires pour ces paramètres dans le navigateur :

1. Choisissez le point de retrait souhaité, après avoir ouvert les Outils de développement (dans Chrome, touche F12)

2. Dans l'onglet « Réseau », recherchez la requête create?version=1 et copiez les données dans les paramètres du scraper

Après avoir choisi le point de retrait, ouvrez l'onglet Réseau (dans Chrome en anglais — Network). Recherchez la requête create?version=1, dans la réponse (Preview), copiez address, lat et lon dans les champs Address, Latitude et Longitude du scraper respectivement.

Présentation du scraper​

Données collectées​

Principales​

Prix et stock​

Vendeur​

Avis​

Tableaux​

Cas d'utilisation​

Requêtes​

Substitutions de requêtes​

Paramètres possibles​