Чекер CMS

  • Автор темы Автор темы vold57
  • Дата начала Дата начала

vold57

A-Parser Pro License
A-Parser Pro
Привет.
Хочу прочекать несколько миллионов урлов на принадлежать CMS.
Ссылки выглядят так:
http://detroit.blogs.time.com/
http://www.thefriendshipblog.com/ending-a-friendship-my-friends-partner-is-toxic/
и т.д.
Настроил файл engines.txt таким образом:
NAME WordPress
inurl wp-login.php
intext Back to

НО видимо мои настройки не показывает, после завершения чека, пишет рядом с урлами - unknow
Я так понял, настройка которая выше, должна работать так:
мной загруженные ссылки, должны обрезаться по домену и к ним должно подставлять это "wp-login.php" потом по этому урлу искать еще слово "Back to" все ли я правильно понял и правильно ли настроил?

Спасибо.
 
неверно, в начале файла полное описание алгоритма его составления
#intext string или intext string1|string2|string3... - вхождение любой из фраз в тексте
#intextre ^regex*$ - совпадение регулярного выражения, всегда выполняется с флагом /i - регистронезависимый поиск
#inurl и inurlre - аналогично предыдущим, только поиск осуществляется по ссылке
inurl - поиск вхождения подстроки в ссылке
P.S. все вопросы тех поддержки необходимо задавать по контактам указанным в шапке сайта
 
Назад
Верх