1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

0.9.4

Тема в разделе "Новости", создана пользователем Forbidden, 5 июн 2012.

  1. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.793
    Версия 0.9.4

    Новый парсер [​IMG] Net::HTTP - просто скачивает указанную страницу и предоставляет следующие результаты:
    • {code} - код ответа
    • {reason} - описание ответа
    • {headers} - хёдеры
    • {data} - контент(страница)
    Новый парсер [​IMG]HTML::LinkExtractor - собирает внутренние и внешние ссылки с указанной страницы, может ходить до определенного уровня по внутренним страницам сайта. С этим парсером можно составить карту сайта или собрать все внешние ссылки.

    Еще один новый парсер - [​IMG] SE::Bing::LangDetect, позволяет определить язык сайта.

    Самое важное улучшение - опция Parse custom result:
    • Позволяет применить регулярное выражение к любому результату любого парсера и сохранять новый результат с именованными макросами
    • Может парсить как простые результаты, так и массивы результатов
    • Поддерживает модификаторы регулярных выражений: i - регистронезависимый поиск, s - мультистрочный поиск, g - глобальный поиск, с сохранением результатов в именованный массив
    И чтобы все это было удобно использовать реализованы следующие фишки:
    • В тестовом парсинге теперь можно применять все опции(включая новую Parse custom result)
    • Из тестового парсинга можно сохранить настройки сразу в пресет задания для дальнейшего использования
    • Из пресета задания можно все настройки перенести в тестовой парсинг чтобы быстро проверить верность составленного задания
    • Пресеты заданий теперь можно экспортировать и импортировать, теперь можно обмениваться готовыми настройками, просить саппорт составить новый пресет для парсинга специфичных результатов(например сбор емейл адресов со страниц), готовые пресеты будут выкладываться на сайте, тем самым расширяя возможности парсера.
    Другими словами теперь можно в тестовом парсинге составить пресет, проверить его, оценить результат, если все хорошо - сохранить его как пресет задания, сделать экспорт и подарить другу! :))

    А вот и пример:

    google-regex-parsing.png

    Список изменений: 0.9.4
     

Поделиться этой страницей