Улучшение HTML::TextExtractor не парсить текст в списках

qazwsxedc

A-Parser Pro License
A-Parser Pro
Добавить возможность указывать между какими хтмл тегами НЕ парсить текст. Или регулярки для исключения определенного блока.

Ибо попадает таки много мусора, например с чем столкнулся это выпадающий список
<option value="1" class="ывваыа" >текст</option>

Уверен что есть еще какие либо лишние теги которых пока не вычислил))
 
Дак а по размеру не отфильтровать разве? врятли в списке будут длинные предложения :)
 
Дак а по размеру не отфильтровать разве? врятли в списке будут длинные предложения :)
По размеру не получается, все равно цепляет. Он список как за одно предложение считает походу, и если он длинный то...
 
Назад
Верх