1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение Rank::CMS - Отладка правил

Тема в разделе "Задачи", создана пользователем aquatell, 15 авг 2018.

  1. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Приветствую, давно не покидает мысль, почему бы не сделать в а-парсере отладчик правил для определения CMS движка, как никак в браузере правила отрабатывают, а в апарсере нет и в результате немало ресурсов получают статус Unknown (неопределен),а на данном этапе отладить никак, можно увидеть только сработало правило если движок определен или не сработало.
    Также не нашел подтверждения, идет ли проверка правил в куках или в заголовке ответа сервера, все это же можно сделать в виде отладчика, не сложно ведь. Выбрал к примеру XenForo и работаешь, можно своими правилами дополнять. Сейчас набор правил работает в пределах 40% непонятно почему так, нужен отладчик. Замерить скорость выполнения, где то косяк в регулярке и т.д., чтото можно ускорить некоторые места исключить из проверок (заголовок ответа сервера, html тело документа, признак присуствия подстроки в URL и т.д. )
     
  2. AntonR

    AntonR Member

    Регистрация:
    7 дек 2013
    Сообщения:
    84
    Симпатии:
    13
    1. там же можно файлик править, мы как раз тоже хотели улучшать
    2. и мне кажется что иногда идет срабатывания нескольких правил, а он выдает только один результат.
    Нужно этот момент проверить.
     
    aquatell нравится это.
  3. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Давайте дружно возьмемся за улучшение CMS::Rank он должен четко работать без ошибок и глюков.
    Я когда то на Delphi писал свой софт по определению CMS движка, там есть примеры правил и множество движков которые до сихпор нигде не определяются, даже самописные. Там определялось все без ошибок в правилах можно было даже дописать что присутствовать должно и что не должно. Т.е. при срабатывании всех условий получался 100% результат без ошибок. Если нужно могу проконсультировать что и как с примерами.
    Это я к тому что можно дополнительно свой этот файл прикрепить к апарсеру и если стандартный wappalyzer не определил, то обращаться к этому файлу. Почему я об этом говорю wappalyzer несовершенен, да он показывает движок, но очень часто с ошибками множество признаков пересекаются с другими движками.
    Как вариант этот дополнительный файл может быть таким чтобы он работал вместе с wappalyzer правилами и дополнял их, массив правил просто выгружать в апарсер и дополнять этот массив еще правилами из своего файла, таким образом можно обновлять правила wappalyzer без потери своих наработок, получится крутая штука.
     
  4. relay

    relay A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 июл 2013
    Сообщения:
    157
    Симпатии:
    103
    нужна база доменов где срабатывает двойной результат или не срабатывает что-то
    саппорт или разработчик может помочь чем-то только на конкретных примерах
     
    Support и Forbidden нравится это.
  5. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Хорошо, я просто сейчас занимаюсь другими задачами, как дойду до проверки доменов предоставлю примеры. Там на стандарных форумах определение путается, не на всех, но частенько, даже если на странице есть "Powered by phpbb" например и в коде просматривается, но CMS::Rank упорно показывает unknown, причем браузер определяет правильно.
     
    Support и Forbidden нравится это.
  6. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Есть примеры?
     

Поделиться этой страницей