подскажите по фильтрации extlink

  • Автор темы Автор темы Al
  • Дата начала Дата начала

Al

A-Parser Enterprise License
A-Parser Enterprise
Пардон, если тема уже была, прошу подсказать, по возможности, как фильтровать исходящие (внешние) ссылки (парсер HTML::LinkExtractor), чтобы в результате не было ссылок на поддомены и тп.
Например запрос http://www.twitch.tv/ , один из результатов http://www.blog.twitch.tv/, или запрос http://devil.livejournal.com/, в результатах http://www.livejournal.com/.

Хочется убрать эти ссылки, т.к. они совсем не внешние.
 
Для этого существует настройка Subdomains are internal:
263gf.png
 
Назад
Верх