Привет. Хочу прочекать несколько миллионов урлов на принадлежать CMS. Ссылки выглядят так: http://detroit.blogs.time.com/ http://www.thefriendshipblog.com/ending-a-friendship-my-friends-partner-is-toxic/ и т.д. Настроил файл engines.txt таким образом: NAME WordPress inurl wp-login.php intext Back to НО видимо мои настройки не показывает, после завершения чека, пишет рядом с урлами - unknow Я так понял, настройка которая выше, должна работать так: мной загруженные ссылки, должны обрезаться по домену и к ним должно подставлять это "wp-login.php" потом по этому урлу искать еще слово "Back to" все ли я правильно понял и правильно ли настроил? Спасибо.
неверно, в начале файла полное описание алгоритма его составления #intext string или intext string1|string2|string3... - вхождение любой из фраз в тексте #intextre ^regex*$ - совпадение регулярного выражения, всегда выполняется с флагом /i - регистронезависимый поиск #inurl и inurlre - аналогично предыдущим, только поиск осуществляется по ссылке inurl - поиск вхождения подстроки в ссылке P.S. все вопросы тех поддержки необходимо задавать по контактам указанным в шапке сайта