Приветствую, давно не покидает мысль, почему бы не сделать в а-парсере отладчик правил для определения CMS движка, как никак в браузере правила отрабатывают, а в апарсере нет и в результате немало ресурсов получают статус Unknown (неопределен),а на данном этапе отладить никак, можно увидеть только сработало правило если движок определен или не сработало. Также не нашел подтверждения, идет ли проверка правил в куках или в заголовке ответа сервера, все это же можно сделать в виде отладчика, не сложно ведь. Выбрал к примеру XenForo и работаешь, можно своими правилами дополнять. Сейчас набор правил работает в пределах 40% непонятно почему так, нужен отладчик. Замерить скорость выполнения, где то косяк в регулярке и т.д., чтото можно ускорить некоторые места исключить из проверок (заголовок ответа сервера, html тело документа, признак присуствия подстроки в URL и т.д. )
1. там же можно файлик править, мы как раз тоже хотели улучшать 2. и мне кажется что иногда идет срабатывания нескольких правил, а он выдает только один результат. Нужно этот момент проверить.
Давайте дружно возьмемся за улучшение CMS::Rank он должен четко работать без ошибок и глюков. Я когда то на Delphi писал свой софт по определению CMS движка, там есть примеры правил и множество движков которые до сихпор нигде не определяются, даже самописные. Там определялось все без ошибок в правилах можно было даже дописать что присутствовать должно и что не должно. Т.е. при срабатывании всех условий получался 100% результат без ошибок. Если нужно могу проконсультировать что и как с примерами. Это я к тому что можно дополнительно свой этот файл прикрепить к апарсеру и если стандартный wappalyzer не определил, то обращаться к этому файлу. Почему я об этом говорю wappalyzer несовершенен, да он показывает движок, но очень часто с ошибками множество признаков пересекаются с другими движками. Как вариант этот дополнительный файл может быть таким чтобы он работал вместе с wappalyzer правилами и дополнял их, массив правил просто выгружать в апарсер и дополнять этот массив еще правилами из своего файла, таким образом можно обновлять правила wappalyzer без потери своих наработок, получится крутая штука.
нужна база доменов где срабатывает двойной результат или не срабатывает что-то саппорт или разработчик может помочь чем-то только на конкретных примерах
Хорошо, я просто сейчас занимаюсь другими задачами, как дойду до проверки доменов предоставлю примеры. Там на стандарных форумах определение путается, не на всех, но частенько, даже если на странице есть "Powered by phpbb" например и в коде просматривается, но CMS::Rank упорно показывает unknown, причем браузер определяет правильно.