market.yandex.ru

  • Автор темы Автор темы winga
  • Дата начала Дата начала

winga

A-Parser Enterprise License
A-Parser Enterprise
Здравствуйте, на апарсере можно такое сделать? Есть яндекс.маркет - market.yandex.ru, пройти по нему всему и спарсить весь товар, чтоб на выходе было например - "Название - цена", то-есть бот ходит по каталогам /catalog/ и /catalogmodels.xml/, ищет ссылки на товар - /product/*?hid= и оттуда парсит то, что мне надо.
Или это отдельно - сперва ищем все ссылки на товар а потом по ним ходим и парсим характеристики ? Может пример готовый похожий есть?
 
А подскажите еще, HTML::LinkExtractor можно заставить ходить только по определенным url-ам? Или наоборот - признак urlов - по которым не ходить
 
Нет, такого выбора нет. Разве что вы можете в результат фильтровать ненужные ссылки.

Все же такая возможность есть.
w0gSQ.png

На этом скрине показана возможность указать, чтобы парсер переходил только по тех ссылках, где нет слова forum. Для этого используется массив $followlinks, который содержит в себе ссылки, предназначенные для перехода на следующем шаге парсера. Над этим массивом можно применять фильтры, тем самым регулируя куда можно переходить.
 
Последнее редактирование:
Изменил свой ответ выше.
Добрый день! Подскажите, а возможно сделать так: ходим по определенным ссылкам по яндекс маркету и парсим определенные поля товара - характеристики товара и ссылки на фотографии(основная+доп1+доп2+доп3)?
 
Добрый день.
Да можно. Фильтруйте массив $followlinks, как это показано выше, используя нужные признаки в ссылках. И одновременно с помощью Parse custom result извлекайте нужную информацию.
 
Назад
Верх