Здравствуйте, на апарсере можно такое сделать? Есть яндекс.маркет - market.yandex.ru, пройти по нему всему и спарсить весь товар, чтоб на выходе было например - "Название - цена", то-есть бот ходит по каталогам /catalog/ и /catalogmodels.xml/, ищет ссылки на товар - /product/*?hid= и оттуда парсит то, что мне надо. Или это отдельно - сперва ищем все ссылки на товар а потом по ним ходим и парсим характеристики ? Может пример готовый похожий есть?
А подскажите еще, HTML::LinkExtractor можно заставить ходить только по определенным url-ам? Или наоборот - признак urlов - по которым не ходить
Нет, такого выбора нет. Разве что вы можете в результат фильтровать ненужные ссылки. Все же такая возможность есть. На этом скрине показана возможность указать, чтобы парсер переходил только по тех ссылках, где нет слова forum. Для этого используется массив $followlinks, который содержит в себе ссылки, предназначенные для перехода на следующем шаге парсера. Над этим массивом можно применять фильтры, тем самым регулируя куда можно переходить.
Добрый день! Подскажите, а возможно сделать так: ходим по определенным ссылкам по яндекс маркету и парсим определенные поля товара - характеристики товара и ссылки на фотографии(основная+доп1+доп2+доп3)?
Добрый день. Да можно. Фильтруйте массив $followlinks, как это показано выше, используя нужные признаки в ссылках. И одновременно с помощью Parse custom result извлекайте нужную информацию.