1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Как отсеять домены на парковке

Тема в разделе "Делимся опытом", создана пользователем odept34, 1 июн 2015.

  1. odept34

    odept34 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    3 май 2015
    Сообщения:
    13
    Симпатии:
    6
    Когда парсишь большие списки доменов с помощью Rank:CMS, больше всего доменов попадает в unknown (что не удивительно).
    Среди них есть:
    1. Сайты, сделанные на самописных CMS/редких CMS/голом html.
    2. Сайт, создатели которых приложили максимум усилий, чтобы скрыть движок сайта.
    3. Домены на парковке.

    Подскажите, пожалуйста, как проще всего отсеять домены на парковке из списков?
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.588
    Симпатии:
    2.174
    Есть пара вариантов:
    • искать в выдаче парсера Net::HTTP совпадение по слову "парковка" и его различных формах на самых распространенных языках
    • проверять NS каждого домена через Net::Whois и сравнивать их со списком распространенных парковщиков
    • опять же через Net::Whois проверять статус домена - возможно будет какой-то неcтандартный статус
    Но все эти варианты требуют значительной подготовки: собрать список парковщиков и их нейм серверов, потестировать разные домены на статус...
     
    odept34 нравится это.
  3. odept34

    odept34 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    3 май 2015
    Сообщения:
    13
    Симпатии:
    6
    Спасибо, думал может есть какой-то простой и очевидный способ, до которого я не додумался.
    Сейчас делаю примерно так, как вы описали.
     

Поделиться этой страницей