Хотелось бы как-то объединить функционал HTML::LinkExtractor и HTML::TextExtractor , а именно из HTML::LinkExtractor нужно доставать количество внешних и внутренних ссылок на странице, а из HTML::TextExtractor текст, на данный момент для этого поидее нужно использоваться два парсера, по сути это два коннекта на один урл, что иногда накладно... так же хотелось бы увидеть функцию в HTML::TextExtractor которая будет определять количесво (в процентах как вариант) русского (нужного языка) текста относительно общего количества текста. На данный момент приходится получать контент и далее уже самому обрабатывать его, что не удобно из-за того, что приходится качать большое количество контента... если что-то не умею делать и это можно сделать, подскажите заранее благодарю
Теперь для Net::HTTP, HTML::LinkExtractor, HTML::TextExtractor используется кэширование запросов, если запросы от разных парсеров приходят одновременно и используются одинаковые параметры то выполнятся будет только один запрос и все парсеры получат одинаковый ответ: