HTML::TextExtractor - фильтрация результата

  • Автор темы Автор темы aquatell
  • Дата начала Дата начала

aquatell

A-Parser Pro License
A-Parser Pro
Здравствуйте, подскажите пожалуйста как сделать чтобы 50к ссылок прогнать через инструмент
HTML::TextExtractor на выходе фильтровать предложения которые не меньше 10 слов и складывать в файл с максимальным размером 50мб, если размер превышает 50мб, то создать новый файл и складывать в него.

Заранее благодарен.
 
Для извлечения предложений можно использовать регулярку(в Parse custom result или в Result builder), например
Код:
([\wа-я]+[, ]+){10,}
с флагами ig

в файл с максимальным размером 50мб, если размер превышает 50мб, то создать новый файл и складывать в него.
A-Parser не умеет делить файлы по размеру
 
Назад
Верх