Всем доброго дня! Не могу понять каким именно парсером и при помощи какого регулярного выражения, лучше всего решить следующую задачу: Есть список страниц с объявлениями. На каждой странице выводится следующая запись "Найдено ..N.. объявлений ". Само количество может меняться, но слова "найдено" и "объявлений" встречается на каждой странице. Буду крайне признателен за советы и любую помощь!
Добрый день. В зависимости от задачи можно использовать Net::HTTP, HTML::TextExtractor Регулярка для этой строки будет выглядеть так: Код: (Найдено.+?объявлений) Но, возможно лучше привязываться к коду страницы, а не к самой строке? Если вы укажите ваш запрос, то я смогу на конкретном примере показать как это делается.
Мне надо спарсить строку "Найдено ...N... объявлений" со страниц: www.mesto.ru/arenda-kvartir-i-komnat/metro-tushinskaya www.mesto.ru/arenda-kvartir-i-komnat/metro-yasenevo www.mesto.ru/arenda-kvartir-i-komnat/vao В коде она выглядит следующим образом <input type="hidden" name="res_title" id="res_title" value="найдено 467 предложений" />
Отлично Работает! А как изменить формат результата, чтобы на выходе было: url запроса - количество объявлений Сейчас просто количество объявлений показывается без привязки к конкретному запросу.
Если для примера, что я приводил выше - тогда вот: Код: $query - $count Если же вы хотите выводить именно цифру, тогда нужно немного изменить саму регулярку. А вообще, на форуме и в Документации можно найти очень много примеров по подобным вопросам: http://a-parser.com/wiki/index/ http://a-parser.com/threads/1738/ http://a-parser.com/threads/1744/ http://a-parser.com/wiki/regex/ http://a-parser.com/wiki/parse-custom-result/ http://a-parser.com/wiki/result-format/