Как объединить проход по сайту с HTML::LinkExtractor + парсинг текст в HTML::TextExtractor

  • Автор темы Автор темы AntonR
  • Дата начала Дата начала

AntonR

Member
А можно как-то объединить проход по сайту с HTML::LinkExtractor и параллельно за один запрос к странице вытаскивать текст с помощью HTML::TextExtractor? Чтобы меньше грузить сайт?
 
Прошу прощения за длительное ожидание ответа.
Начиная с версии 1.1.566 для парсеров Net::HTTP Net::HTTP, HTML::TextExtractor HTML::TextExtractor, HTML::LinkExtractor HTML::LinkExtractor и Rank::CMS Rank::CMS кэшируются одинаковые HTTP запросы при использовании любой комбинации из этих парсеров в одном задании, что исключает выполнение повторных запросов к одному URL. Главным условием есть то, чтобы все параметры запросов были одинаковые.

Таким образом, можно использовать в одном задании HTML::TextExtractor HTML::TextExtractor и HTML::LinkExtractor HTML::LinkExtractor, и, если настройки http запроса будут совпадать, то запрос будет сделать только один, а для второго парсера контент будет взят из кеша.
Для данной пары парсеров по-умолчанию отличаются 3 параметра, поэтому их нужно сделать одинаковыми.
a57co_180904141524.png

br7uz_180904141644.png
 
Назад
Верх