1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

подскажите по фильтрации extlink

Тема в разделе "Техническая поддержка", создана пользователем Al, 20 дек 2015.

  1. Al

    Al A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 окт 2014
    Сообщения:
    28
    Симпатии:
    10
    Пардон, если тема уже была, прошу подсказать, по возможности, как фильтровать исходящие (внешние) ссылки (парсер HTML::LinkExtractor), чтобы в результате не было ссылок на поддомены и тп.
    Например запрос http://www.twitch.tv/ , один из результатов http://www.blog.twitch.tv/, или запрос http://devil.livejournal.com/, в результатах http://www.livejournal.com/.

    Хочется убрать эти ссылки, т.к. они совсем не внешние.
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Для этого существует настройка Subdomains are internal:
    [​IMG]
     
    Support нравится это.
  3. Al

    Al A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 окт 2014
    Сообщения:
    28
    Симпатии:
    10
    большое спасибо
     

Поделиться этой страницей