Здравствуйте, у меня стоит задача - получить карточки товара и подкатегорию, используя категории урлов - в которых эти товары находятся,
Например : http://www.mlesna.ru/catalog/tseylonskiy_chernyiy_bayhovyiy_aromatizirovannyiy/
Подкатегории - "
То есть, парсер должен перейти в каждую подкатегорию и получить такие данные по каждому товару :
Название
Изображение
Тип
Артикул
Упаковка
Фасовка
Описание
Вес
Стоимость
Все эти данные находятся в <div class="goods"> на странице товара
внутри
div class=name
div class=picture
div class=info ( тут в таблице - тип, артикул, упаковка, фасовка)
Тип: Значение
Артикул : Значение
Упаковка : Значение
Фасовка : Значение
Описание - на странице в теге <p> - который следует сразу же за дивом <div class="goods">
div class=weight
div class=price
Хотелось бы получить результат в таком виде :
Набор;Чай черный ароматизированный «Spring Collection» (Весенняя Коллекция «8 Марта») в 8-ми холщовых мешочках;Тип: черный;Упаковка: деревянные коробки;Фасовка: байховый (рассыпной);Восемь видов цейлонского черного ароматизированного чая в холщовых мешочках в деревянной коробке с символикой "8 Марта".;200 гр; 1400руб
Подсказали в чате, что мне надо написать регулярные выражения под каждый div
http://a-parser.com/threads/1651/#post-4928
Допустим регулярка под див div class=name : <div class=\"name\">(.*?)</div> флаг s
Но мне не понятно :
1. Как мне заставить парсер переходить в подкатегории
2. Как записывать в файл результатов название подкатегории
3. Как Парсить данные из таблицы
div class=info ( тут в таблице - тип, артикул, упаковка, фасовка)
Тип: Значение
Артикул : Значение
Упаковка : Значение
Фасовка : Значение
4. Как сформировать файл результатов с этим всем
5. Как мне скачать изображение товара и сохранить целостность данных. То есть что бы изобаржение относилось именно к той строке данных - в файле результатов, за которым оно закреплено на основном сайте.
помогите пожалуйста?!
Например : http://www.mlesna.ru/catalog/tseylonskiy_chernyiy_bayhovyiy_aromatizirovannyiy/
Подкатегории - "
- Набор (28)
- Ассорти (26)
- Клубника (19)
- Бергамот (18)
- К празднику (12)
- Яблоко (10)
- Смородина (9)
- Вишня (9)
- Персик и абрикос (7)
- Мята (7)
- Жасмин (7)
- Саусэп (6)
- Малина (6)
- Лимон (6)
- Клюква (6)
- Голубика (6)
- Ананас (6)
- Слива (5)
- Роза (5)
- Манго (5)
- Канадский клен (5)
- Ежевика (5)
- Апельсин (5)
- Яблоневый цвет (4)
- Цитрусовые (4)
- Мёд (4)
- Карамель (4)
- Ваниль (4)
- Шиповник (3)
- Тропические фрукты (3)
- Сливки (3)
- Пэшнфрукт (3)
- Папайя (3)
- Лайм (3)
- Киви (3)
- Дыня (3)
- Груша (3)
- Грейфрукт (3)
- Виноград (3)
- Банан (3)
- Черника (2)
- Ревень (2)
- Мандарин (2)
- Шоколад (1)
- Хризантема (1)
- Специи (1)
- Крыжовник (1)
- Корица (1)
- Кардамон (1)
- Имбирь (1)
- Гранат (1)
- Боярышник (1)
- Кокос (0)
То есть, парсер должен перейти в каждую подкатегорию и получить такие данные по каждому товару :
Название
Изображение
Тип
Артикул
Упаковка
Фасовка
Описание
Вес
Стоимость
Все эти данные находятся в <div class="goods"> на странице товара
внутри
div class=name
div class=picture
div class=info ( тут в таблице - тип, артикул, упаковка, фасовка)
Тип: Значение
Артикул : Значение
Упаковка : Значение
Фасовка : Значение
Описание - на странице в теге <p> - который следует сразу же за дивом <div class="goods">
div class=weight
div class=price
Хотелось бы получить результат в таком виде :
Набор;Чай черный ароматизированный «Spring Collection» (Весенняя Коллекция «8 Марта») в 8-ми холщовых мешочках;Тип: черный;Упаковка: деревянные коробки;Фасовка: байховый (рассыпной);Восемь видов цейлонского черного ароматизированного чая в холщовых мешочках в деревянной коробке с символикой "8 Марта".;200 гр; 1400руб
Подсказали в чате, что мне надо написать регулярные выражения под каждый div
http://a-parser.com/threads/1651/#post-4928
Допустим регулярка под див div class=name : <div class=\"name\">(.*?)</div> флаг s
Но мне не понятно :
1. Как мне заставить парсер переходить в подкатегории
2. Как записывать в файл результатов название подкатегории
3. Как Парсить данные из таблицы
div class=info ( тут в таблице - тип, артикул, упаковка, фасовка)
Тип: Значение
Артикул : Значение
Упаковка : Значение
Фасовка : Значение
4. Как сформировать файл результатов с этим всем
5. Как мне скачать изображение товара и сохранить целостность данных. То есть что бы изобаржение относилось именно к той строке данных - в файле результатов, за которым оно закреплено на основном сайте.
помогите пожалуйста?!
Последнее редактирование модератором: