Здравствуйте, подскажите пожалуйста как сделать чтобы 50к ссылок прогнать через инструмент HTML::TextExtractor на выходе фильтровать предложения которые не меньше 10 слов и складывать в файл с максимальным размером 50мб, если размер превышает 50мб, то создать новый файл и складывать в него. Заранее благодарен.
Для извлечения предложений можно использовать регулярку(в Parse custom result или в Result builder), например Код: ([\wа-я]+[, ]+){10,} с флагами ig A-Parser не умеет делить файлы по размеру