Как объединить проход по сайту с HTML::LinkExtractor + парсинг текст в HTML::TextExtractor

AntonR · 19 авг 2018

А можно как-то объединить проход по сайту с HTML::LinkExtractor и параллельно за один запрос к странице вытаскивать текст с помощью HTML::TextExtractor? Чтобы меньше грузить сайт?

Support · 4 сен 2018

Прошу прощения за длительное ожидание ответа.
Начиная с версии 1.1.566 для парсеров Net::HTTP, HTML::TextExtractor, HTML::LinkExtractor и Rank::CMS кэшируются одинаковые HTTP запросы при использовании любой комбинации из этих парсеров в одном задании, что исключает выполнение повторных запросов к одному URL. Главным условием есть то, чтобы все параметры запросов были одинаковые.

Таким образом, можно использовать в одном задании HTML::TextExtractor и HTML::LinkExtractor, и, если настройки http запроса будут совпадать, то запрос будет сделать только один, а для второго парсера контент будет взят из кеша.
Для данной пары парсеров по-умолчанию отличаются 3 параметра, поэтому их нужно сделать одинаковыми.

Как объединить проход по сайту с HTML::LinkExtractor + парсинг текст в HTML::TextExtractor

AntonR Member

Support Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Как объединить проход по сайту с HTML::LinkExtractor + парсинг текст в HTML::TextExtractor

AntonR Member

Support Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

Support Administrator
Команда форума A-Parser Enterprise