1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

HTML::TextExtractor - фильтрация результата

Тема в разделе "Техническая поддержка", создана пользователем aquatell, 4 мар 2016.

  1. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Здравствуйте, подскажите пожалуйста как сделать чтобы 50к ссылок прогнать через инструмент
    HTML::TextExtractor на выходе фильтровать предложения которые не меньше 10 слов и складывать в файл с максимальным размером 50мб, если размер превышает 50мб, то создать новый файл и складывать в него.

    Заранее благодарен.
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Для извлечения предложений можно использовать регулярку(в Parse custom result или в Result builder), например
    Код:
    ([\wа-я]+[, ]+){10,}
    с флагами ig

    A-Parser не умеет делить файлы по размеру
     
    DeXtR и aquatell нравится это.

Поделиться этой страницей