Хотелось бы как-то объединить функционал HTML::LinkExtractor и HTML::TextExtractor , а именно из HTML::LinkExtractor нужно доставать количество внешних и внутренних ссылок на странице, а из HTML::TextExtractor текст, на данный момент для этого поидее нужно использоваться два парсера, по сути это два коннекта на один урл, что иногда накладно...
так же хотелось бы увидеть функцию в HTML::TextExtractor которая будет определять количесво (в процентах как вариант) русского (нужного языка) текста относительно общего количества текста. На данный момент приходится получать контент и далее уже самому обрабатывать его, что не удобно из-за того, что приходится качать большое количество контента...
если что-то не умею делать и это можно сделать, подскажите
заранее благодарю
так же хотелось бы увидеть функцию в HTML::TextExtractor которая будет определять количесво (в процентах как вариант) русского (нужного языка) текста относительно общего количества текста. На данный момент приходится получать контент и далее уже самому обрабатывать его, что не удобно из-за того, что приходится качать большое количество контента...
если что-то не умею делать и это можно сделать, подскажите
заранее благодарю