Версия 0.9.4
Новый парсер
Net::HTTP - просто скачивает указанную страницу и предоставляет следующие результаты:
HTML::LinkExtractor - собирает внутренние и внешние ссылки с указанной страницы, может ходить до определенного уровня по внутренним страницам сайта. С этим парсером можно составить карту сайта или собрать все внешние ссылки.
Еще один новый парсер -
SE::Bing::LangDetect, позволяет определить язык сайта.
Самое важное улучшение - опция Parse custom result:
)
А вот и пример:

Список изменений: 0.9.4
Новый парсер
- {code} - код ответа
- {reason} - описание ответа
- {headers} - хёдеры
- {data} - контент(страница)
Еще один новый парсер -
Самое важное улучшение - опция Parse custom result:
- Позволяет применить регулярное выражение к любому результату любого парсера и сохранять новый результат с именованными макросами
- Может парсить как простые результаты, так и массивы результатов
- Поддерживает модификаторы регулярных выражений: i - регистронезависимый поиск, s - мультистрочный поиск, g - глобальный поиск, с сохранением результатов в именованный массив
- В тестовом парсинге теперь можно применять все опции(включая новую Parse custom result)
- Из тестового парсинга можно сохранить настройки сразу в пресет задания для дальнейшего использования
- Из пресета задания можно все настройки перенести в тестовой парсинг чтобы быстро проверить верность составленного задания
- Пресеты заданий теперь можно экспортировать и импортировать, теперь можно обмениваться готовыми настройками, просить саппорт составить новый пресет для парсинга специфичных результатов(например сбор емейл адресов со страниц), готовые пресеты будут выкладываться на сайте, тем самым расширяя возможности парсера.
А вот и пример:

Список изменений: 0.9.4