1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Чекер CMS

Тема в разделе "Закрытые без версии", создана пользователем vold57, 15 май 2013.

  1. vold57

    vold57 A-Parser Pro License
    A-Parser Pro

    Регистрация:
    14 май 2013
    Сообщения:
    8
    Симпатии:
    0
    Привет.
    Хочу прочекать несколько миллионов урлов на принадлежать CMS.
    Ссылки выглядят так:
    http://detroit.blogs.time.com/
    http://www.thefriendshipblog.com/ending-a-friendship-my-friends-partner-is-toxic/
    и т.д.
    Настроил файл engines.txt таким образом:
    NAME WordPress
    inurl wp-login.php
    intext Back to

    НО видимо мои настройки не показывает, после завершения чека, пишет рядом с урлами - unknow
    Я так понял, настройка которая выше, должна работать так:
    мной загруженные ссылки, должны обрезаться по домену и к ним должно подставлять это "wp-login.php" потом по этому урлу искать еще слово "Back to" все ли я правильно понял и правильно ли настроил?

    Спасибо.
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    неверно, в начале файла полное описание алгоритма его составления
    #intext string или intext string1|string2|string3... - вхождение любой из фраз в тексте
    #intextre ^regex*$ - совпадение регулярного выражения, всегда выполняется с флагом /i - регистронезависимый поиск
    #inurl и inurlre - аналогично предыдущим, только поиск осуществляется по ссылке
    inurl - поиск вхождения подстроки в ссылке
    P.S. все вопросы тех поддержки необходимо задавать по контактам указанным в шапке сайта
     

Поделиться этой страницей