Pular para o conteúdo principal

Shop::Wildberries::ProductInfo - scraper de página de produto Wildberries

img

Visão geral do scraper

Utilizando o scraper de produtos Wildberries, você pode obter dados sobre produtos a partir de uma lista de links para as páginas desses produtos.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso posterior (presets), definir agendamentos de extração de dados e muito mais. Você pode usar a multiplicação automática de consultas, substituição de subconsultas a partir de arquivos, geração de combinações alfanuméricas e listas para obter a maior quantidade possível de resultados.

Dados coletados

img

Principais

  • Nome do produto (title)
  • Caminho da categoria no WB (category)
  • Marca (brand)
  • Link para a marca/categoria no WB (brandSubUrl)
  • SKU, nm ID (sku)
  • Descrição (description)
  • País de fabricação (country)
  • Cores, separadas por ; (colors)

Preços e disponibilidade

  • Preço antigo, riscado no site (price) — sem entrega
  • Preço com desconto (discountPrice) — sem entrega
  • Entrega separada (logisticsPrice); se não houver — 0
  • Preço com WB Wallet (walletPrice) — apenas com Currency = RUB; desconto de ~2% sobre o discountPrice, sem entrega; não disponível para todos os produtos — nesse caso 0 ou vazio
  • Estoque no armazém (qty) — não é a quantidade de vendas

Calcule o preço final "como no site" no seu modelo, por exemplo discountPrice + logisticsPrice (na vitrine do WB o valor pode depender do ponto de retirada, o scraper fornece os componentes separadamente).

Vendedor

  • Nome do vendedor (seller)
  • Link para o vendedor (sellerUrl)
  • Nome jurídico (sellerLegalName)
  • INN (inn)
  • OGRN (ogrn)
  • Marca comercial (trademark)
  • Endereço jurídico (legalAddress)

Avaliações

  • Número de avaliações (comments)
  • Classificação do produto (rating)

Arrays

  • Fotos (photos, campo url) — links para as imagens do produto
  • Histórico de preços (prices, campos date, price) — os valores dos campos podem estar ausentes ou variar em quantidade, ou seja, diferentes produtos podem ter um número diferente de datas e preços no histórico, e para alguns produtos esta informação pode não estar presente
  • Tags de busca WB (tags, campo tag) — "Pessoas também buscaram por"

Variantes de uso

  • Monitoramento da dinâmica de preços de produtos
  • Avaliação de produtos por classificação, comentários e disponibilidade
  • Coleta de todas as imagens dos produtos

Consultas

Como consultas, é necessário indicar links para os produtos, por exemplo:

https://www.wildberries.ru/catalog/13823047/detail.aspx
https://www.wildberries.ru/catalog/12622014/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/4068082/detail.aspx?targetUrl=MI
https://www.wildberries.ru/catalog/2776868/detail.aspx?targetUrl=GP

Substituições de consultas

Você pode utilizar macros integradas de substituição de consultas. Por exemplo, queremos que o scraper substitua automaticamente na URL do produto o número do SKU de 1 até 100 000. Para isso, pode-se aplicar a macro {num:START:END}. Como consulta, indicaremos o link de qualquer produto e, no lugar do SKU, inseriremos a macro:

https://www.wildberries.ru/catalog/{num:1:100000}/detail.aspx

Este método permite extrair dados de produtos do Wildberries de forma extremamente fácil e automática, mesmo sem conhecer seus SKUs. O A-Parser substituirá o número sequencial de forma independente, acessará a página e coletará os dados, se existirem.

Configurações possíveis

ParâmetroValor padrãoDescrição
CurrencyRUBMoeda dos preços nos resultados: RUB, BYN, KZT, KGS, AMD, UZS, TJS, ETB, GEL. A variável walletPrice é preenchida apenas com RUB
AddressEndereço do ponto de retirada; junto com as coordenadas define a região e influencia nos preços
LongitudeLongitude do ponto de retirada
LatitudeLatitude do ponto de retirada
Max concurrent browser pages5Quantas páginas o Chrome pode abrir simultaneamente. Com um grande número de threads, aumente com cautela — a carga na memória e CPU aumenta
Chrome HeadlessExecução do navegador em modo oculto (sem janela visível). Se a verificação no site não passar ou for necessária depuração — desmarque a opção
nota

Por padrão, o Wildberries exibe resultados para Moscou. No scraper, é possível definir um ponto de retirada e a lista de resultados será vinculada a uma localização específica. Para fazer isso, é necessário redefinir 3 parâmetros: Address, Longitude e Latitude. Você pode obter os valores necessários para esses parâmetros no navegador:

1. Escolhemos o ponto de retirada desejado, tendo aberto previamente as Ferramentas do Desenvolvedor (no Chrome, tecla F12)

img

2. Na aba «Rede» procuramos a requisição create?version=1 e copiamos os dados para as configurações do scraper

Após escolher o ponto de retirada, abra a aba Rede (no Chrome em inglês — Network). Procure pela requisição create?version=1, na resposta (Preview) copie address, lat e lon para os campos Address, Latitude e Longitude do scraper, respectivamente.

img