Vai al contenuto principale

Shop::Wildberries::ProductInfo - scraper della pagina prodotto Wildberries

img

Panoramica dello scraper

Utilizzando lo scraper di prodotti Wildberries, è possibile ottenere dati sui prodotti tramite un elenco di link alle pagine di tali prodotti.

Le funzionalità di A-Parser consentono di salvare le impostazioni di scraping per un uso futuro (preset), impostare pianificazioni di scraping e molto altro. È possibile utilizzare la generazione automatica delle query, la sostituzione di sotto-query da file, l'iterazione di combinazioni alfanumeriche ed elenchi per ottenere il massimo numero possibile di risultati.

Dati raccolti

img

Principali

  • Nome del prodotto (title)
  • Percorso della categoria su WB (category)
  • Brand (brand)
  • Link al brand/categoria su WB (brandSubUrl)
  • Articolo, nm ID (sku)
  • Descrizione (description)
  • Paese di produzione (country)
  • Colori, separati da ; (colors)

Prezzi e disponibilità

  • Prezzo vecchio, barrato sul sito (price) — senza consegna
  • Prezzo scontato (discountPrice) — senza consegna
  • Consegna separata (logisticsPrice); se assente — 0
  • Prezzo con WB Wallet (walletPrice) — solo con Currency = RUB; sconto ~2% da discountPrice, senza consegna; non per tutti i prodotti — in tal caso 0 o vuoto
  • Giacenza in magazzino (qty) — non è il numero di vendite

Calcola il prezzo finale "come sul sito" nel modello autonomamente, ad esempio discountPrice + logisticsPrice (nella vetrina di WB il totale può dipendere dal punto di ritiro, lo scraper fornisce i componenti separatamente).

Venditore

  • Nome del venditore (seller)
  • Link al venditore (sellerUrl)
  • Ragione sociale (sellerLegalName)
  • INN (inn)
  • OGRN (ogrn)
  • Marchio commerciale (trademark)
  • Indirizzo legale (legalAddress)

Recensioni

  • Numero di recensioni (comments)
  • Valutazione del prodotto (rating)

Array

  • Foto (photos, campo url) — link alle immagini del prodotto
  • Storico dei prezzi (prices, campi date, price) — i valori dei campi possono essere assenti o variare in quantità, ovvero prodotti diversi possono avere un numero diverso di date e prezzi nello storico, e per alcuni prodotti queste informazioni potrebbero non essere affatto presenti
  • Tag di ricerca WB (tags, campo tag) — "Cercato con questo prodotto"

Casi d'uso

  • Monitoraggio della dinamica dei prezzi dei prodotti
  • Valutazione dei prodotti per rating, recensioni e disponibilità
  • Raccolta di tutte le immagini dei prodotti

Query

Come query è necessario indicare i link ai prodotti, ad esempio:

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

Sostituzioni nelle query

È possibile utilizzare le macro integrate per la sostituzione delle query. Ad esempio, vogliamo che lo scraper sostituisca automaticamente nell'URL del prodotto il numero dell'articolo in sequenza da 1 a 100 000. Per fare ciò, si può applicare la macro {num:START:END}. Come query indicheremo il link a un prodotto qualsiasi e al posto dell'articolo inseriremo la macro:

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

Questo metodo consente di scansionare i prodotti Wildberries in modo estremamente facile e automatico, anche senza conoscerne gli articoli. A-Parser inserirà autonomamente il numero in ordine, visiterà la pagina e raccoglierà i dati se presenti.

Impostazioni possibili

ParametroValore predefinitoDescrizione
CurrencyRUBValuta dei prezzi nei risultati: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. La variabile walletPrice viene popolata solo con RUB
AddressIndirizzo del punto di ritiro; insieme alle coordinate definisce la regione e influisce sui prezzi
LongitudeLongitudine del punto di ritiro
LatitudeLatitudine del punto di ritiro
Max concurrent browser pages5Quante pagine Chrome lo scraper può aprire simultaneamente. Con un numero elevato di thread, aumentare con cautela: aumenta il carico su memoria e CPU
Chrome HeadlessAvvio del browser in modalità background (senza finestra visibile). Se il controllo sul sito non passa o è necessario il debug, deselezionare la casella
nota

Per impostazione predefinita, Wildberries mostra i risultati per Mosca. Nello scraper è possibile impostare un punto di ritiro e l'elenco dei risultati sarà legato a una località specifica. Per farlo, è necessario sovrascrivere 3 parametri: Address, Longitude e Latitude. È possibile ottenere i valori necessari per questi parametri nel browser:

1. Selezioniamo il punto di ritiro desiderato, dopo aver aperto gli Strumenti per sviluppatori (in Chrome tasto F12)

img

2. Nella scheda «Rete» cerchiamo la richiesta create?version=1 e copiamo i dati nelle impostazioni dello scraper

Dopo aver scelto il punto di ritiro, apri la scheda Rete (in Chrome — Network). Trova la richiesta create?version=1, nella risposta (Preview) copia address, lat e lon rispettivamente nei campi Address, Latitude e Longitude dello scraper.

img