Улучшение [1.1.537] Кэширование контента для Net::HTTP, HTML::LinkExtractor и HTML::TextExtractor

  • Автор темы Автор темы denver
  • Дата начала Дата начала

denver

A-Parser Enterprise License
A-Parser Enterprise
Хотелось бы как-то объединить функционал HTML::LinkExtractor и HTML::TextExtractor , а именно из HTML::LinkExtractor нужно доставать количество внешних и внутренних ссылок на странице, а из HTML::TextExtractor текст, на данный момент для этого поидее нужно использоваться два парсера, по сути это два коннекта на один урл, что иногда накладно...

так же хотелось бы увидеть функцию в HTML::TextExtractor которая будет определять количесво (в процентах как вариант) русского (нужного языка) текста относительно общего количества текста. На данный момент приходится получать контент и далее уже самому обрабатывать его, что не удобно из-за того, что приходится качать большое количество контента...

если что-то не умею делать и это можно сделать, подскажите :-)
заранее благодарю
 
Теперь для Net::HTTP Net::HTTP, HTML::LinkExtractor HTML::LinkExtractor, HTML::TextExtractor HTML::TextExtractor используется кэширование запросов, если запросы от разных парсеров приходят одновременно и используются одинаковые параметры то выполнятся будет только один запрос и все парсеры получат одинаковый ответ:

g52x6.png
 
Назад
Верх