Shop::Wildberries::ProductInfo - scraper för Wildberries produktsidor

Översikt av scrapern
Genom att använda Wildberries produktscraper kan du hämta produktdata baserat på en lista med länkar till dessa produktsidor.
Funktionaliteten i A-Parser gör det möjligt att spara inställningar för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk frågemultiplikation, infogning av underfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga mängd resultat.
Insamlade data

Grundläggande
- Produktnamn (
title) - Kategorisökväg på WB (
category) - Varumärke (
brand) - Länk till varumärke/kategori på WB (
brandSubUrl) - Artikelnummer, nm ID (
sku) - Beskrivning (
description) - Tillverkningsland (
country) - Färger, separerade med
;(colors)
Priser och tillgänglighet
- Ordinarie pris, överstruket på webbplatsen (
price) — exklusive frakt - Pris med rabatt (
discountPrice) — exklusive frakt - Frakt separat (
logisticsPrice); om ingen —0 - Pris med WB Wallet (
walletPrice) — endast vid Currency = RUB; rabatt ~2% fråndiscountPrice, exklusive frakt; inte för alla produkter — då0eller tomt - Lagersaldo (
qty) — inte försäljningsantal
Beräkna slutpriset "som på webbplatsen" själv i mallen, till exempel discountPrice + logisticsPrice (på WB:s skyltfönster kan summan bero på uthämtningsställe, scrapern levererar komponenterna separat).
Säljare
- Säljarens namn (
seller) - Länk till säljaren (
sellerUrl) - Juridiskt namn (
sellerLegalName) - INN (
inn) - OGRN (
ogrn) - Varumärke (
trademark) - Juridisk adress (
legalAddress)
Recensioner
- Antal recensioner (
comments) - Produktbetyg (
rating)
Arrayer
- Foton (
photos, fälturl) — länkar till produktbilder - Prishistorik (
prices, fältendate,price) — fältvärden kan saknas eller variera i antal, vilket innebär att olika produkter kan ha olika antal datum och priser i historiken, och för vissa produkter kan denna information saknas helt - Söktaggar på WB (
tags, fälttag) — "Kunder som sökte på detta sökte även efter"
Användningsfall
- Spårning av prisdynamik för produkter
- Utvärdering av produkter baserat på betyg, recensioner och tillgänglighet
- Insamling av alla produktbilder
Frågor
Som frågor måste du ange länkar till produkter, till exempel:
https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP
Frågesubstitutioner
Du kan använda inbyggda makron för frågesubstitution.
Till exempel om vi vill att scrapern automatiskt ska ersätta artikelnumret i produktlänken i tur och ordning från 1 till 100 000. För detta kan makrot {num:START:END} användas.
Som fråga anger vi länken till valfri produkt och skriver in makrot istället för artikelnumret:
https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx
Denna metod gör det extremt enkelt att automatiskt skrapa Wildberries-produkter även utan att känna till deras artikelnummer. A-Parser kommer självständigt att infoga numret i ordningsföljd, besöka sidan och samla in data om de finns.
Möjliga inställningar
| Parameter | Standardvärde | Beskrivning |
|---|---|---|
| Currency | RUB | Valuta för priser i resultaten: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. Variabeln walletPrice fylls endast i vid RUB |
| Address | Adress till uthämtningsställe; tillsammans med koordinater definierar det regionen och påverkar priserna | |
| Longitude | Longitud för uthämtningsställe | |
| Latitude | Latitud för uthämtningsställe | |
| Max concurrent browser pages | 5 | Hur många Chrome-sidor scrapern kan öppna samtidigt. Vid ett stort antal trådar, öka försiktigt — belastningen på minne och CPU ökar |
| Chrome Headless | ☑ | Starta webbläsaren i bakgrundsläge (utan synligt fönster). Om verifieringen på webbplatsen misslyckas eller om felsökning behövs — avmarkera rutan |
Som standard visar Wildberries resultat för Moskva. I scrapern finns möjligheten att ange ett uthämtningsställe så att resultatlistan kopplas till en specifik plats. För att göra detta behöver du åsidosätta 3 parametrar: Address, Longitude och Latitude. Du kan hämta de nödvändiga värdena för dessa parametrar i webbläsaren:
1. Välj önskat uthämtningsställe efter att ha öppnat utvecklarverktygen (i Chrome tangenten F12)

2. I fliken ”Nätverk” letar vi efter anropet create?version=1 och kopierar data till scraperns inställningar
Efter att ha valt uthämtningsställe, öppna fliken Nätverk (i Chrome på engelska — Network). Hitta anropet create?version=1, i svaret (Preview) kopiera address, lat och lon till fälten Address, Latitude respektive Longitude i scrapern.
