CMS: проверка определенных движков

high_skill

A-Parser Enterprise License
A-Parser Enterprise
привет всем , очень важный вопрос !
по сабжу

CMS: проверка определенных движков , точнее :
подскажите на скринах как отчекать с базы сайтов
1) именно WP
2) или 2 движка сразу

3) еще вопрос по сохранению результата , WordPress движки сохранять в виде

domain.com/wp-login.php

точнее дописывать сразу в домен путь двига

4) CMS парсер , требует http https ?

спасибо! :)
 
Последнее редактирование:
Начиная с версии 1.1.9(http://a-parser.com/threads/544/#post-3055) появилась возможность выбирать движки для проверки прямо через интерфейс:

nmJSI.png



2) или 2 движка сразу
для проверки можно выбрать несколько движков или групп


4) CMS парсер , требует http https ?
он как и все парсеры работает с обоими протоколами
 
что то у меня нету или я слепой , Check list нема вобще o_O
 
что то у меня нету или я слепой , Check list нема вобще

Начиная с версии 1.1.9



а если без http https он ссылки не будет обрабатывать?
не будет, используй Query format: http://$query
 
Здравствуйте. Подскажите пожалуйста - а откуда парсер берет данные для обработки (базу ссылок), где это задается? Я так понимаю что есть уже спаршеная база сайтов, которая находится в папке /result и к ней где то указывается путь? (на скрине не видно)Поясните пожалуйста.
 
база ссылок для проверки задается как обычно в качестве запросов
 
Мне необходимо отсортировать базу по заданным движкам (10-15 штук), но если добавляю больше одного "filter result on" база тогда не сортируется, если с одним "filter result on" то все нормально получается. Как мне отсортировать сразу несколько движков? Делал вот так, скрин ниже:
Capture.jpg
 
Последнее редактирование:
фильтры всегда работают вместе, т.е. между ними стоит "И"
необходимо оставить только один фильтр по регулярному выражению vBulletin|DataLife Engine|Drupal

другой подход - выбрать все необходимые движки в Check list и добавить фильтр Regex Not Match по регулярке none|unknow
 
фильтры всегда работают вместе, т.е. между ними стоит "И"
необходимо оставить только один фильтр по регулярному выражению vBulletin|DataLife Engine|Drupal

другой подход - выбрать все необходимые движки в Check list и добавить фильтр Regex Not Match по регулярке none|unknow

Что первый вариант с фильтром у меня так и не заработал, а вот второй способ с Regex Not Match, как раз то что надо, да и удобней мне так кажется...

И в продолжение темы о CMS (движках). Вопрос:
Как мне спарсить с поисковой системы сайты на заданном движке. Например я хочу получить базу сайтов на движках: vBulletin, DataLife Engine, Drupal. Все что есть в выдаче у Гугла или Яндекса. Если можно выложите скрином, как это сделать
 
Как мне спарсить с поисковой системы сайты на заданном движке. Например я хочу получить базу сайтов на движках: vBulletin, DataLife Engine, Drupal. Все что есть в выдаче у Гугла или Яндекса. Если можно выложите скрином, как это сделать

для этого необходимо составлять специальные запросы, которые свойственны для конкретных движков, например "Powered by vBulletin" и т.д.
 
прошу помочь составить задание для пойска несколько движков CMS , то есть из списка были выбрали десятки cms
а как дальше и правильно создать задание ума не дохдит .
спасибо

12e630187883ca9cba73a2d7a496d470.png
 
Без фильтра в результат попадут все домены из запроса с проставленными кмс, которые выбрал.

Форбиден писал в http://a-parser.com/threads/1194/#post-3418
"другой подход - выбрать все необходимые движки в Check list и добавить фильтр Regex Not Match по регулярке none|unknow"
Этим уберем из результата домены с неопределенными кмс
 
прошу помочь составить задание для пойска несколько движков CMS , то есть из списка были выбрали десятки cms
а как дальше и правильно создать задание ума не дохдит .
Несколькими постами выше есть ответ на ваш вопрос:
необходимо оставить только один фильтр по регулярному выражению vBulletin|DataLife Engine|Drupal

другой подход - выбрать все необходимые движки в Check list и добавить фильтр Regex Not Match по регулярке none|unknow
 
для этого необходимо составлять специальные запросы, которые свойственны для конкретных движков, например "Powered by vBulletin" и т.д.

при выполнений таска выходит ошибка some error
eyJwcmVzZXQiOiJFY29tZXJjZSIsInZhbHVlIjp7InByZXNldCI6IkVjb21lcmNl
IiwicGFyc2VycyI6W1siUmFuazo6Q01TIiwiZGVmYXVsdCIseyJ0eXBlIjoib3Zl
cnJpZGUiLCJpZCI6ImNhdHMiLCJ2YWx1ZSI6WyItM2RDYXJ0IiwiZWNvbW1lcmNl
IiwiLTF1bmQxIiwiLUFURyBXZWIgQ29tbWVyY2UiLCItQmlnY29tbWVyY2UiLCIt
Q1MgQ2FydCIsIi1CaWd3YXJlIiwiLUNvbW1lcmNlIFNlcnZlciIsIi1Db3Ntb3No
b3AiLCItQ3ViZUNhcnQiLCItRGVtYW5kd2FyZSIsIi1EcnVwYWwgQ29tbWVyY2Ui
LCItRldQIiwiLUUtTWVyY2hhbnQiLCItR2FtYmlvIiwiLUlCTSBXZWJTcGhlcmUg
Q29tbWVyY2UiLCItSHlicmlzIiwiLUludGVyc2hvcCIsIi1KVEwgU2hvcCIsIi1N
YWdlbnRvIiwiLU1vbmRvIE1lZGlhIiwiLU9wZW5DYXJ0IiwiLVBvd2VyZ2FwIiwi
LVF1aWNrLkNhcnQiLCItUGxlbnR5bWFya2V0cyIsIi1PWElEIGVTaG9wIiwiLVBy
ZXN0YXNob3AiLCItU2Vvc2hvcCIsIi1TaG9wYXRyb24iLCItU2hvcGlmeSIsIi1T
aG9wd2FyZSIsIi1TbWFydHN0b3JlIiwiLVNwcmVlIiwiLVN0b3JlIFN5c3RlbXMi
LCItVG9tYXRvQ2FydCIsIi1VYmVyY2FydCIsIi1WUC1BU1AiLCItVmlydHVlTWFy
dCIsIi1Wb2x1c2lvbiIsIi1XZWJzYWxlIiwiLVdvb0NvbW1lcmNlIiwiLVgtQ2Fy
dCIsIi1ZYWhvbyEgRWNvbW1lcmNlIiwiLVpldXNjYXJ0IiwiLWlDb25nbyIsIi1u
b3BDb21tZXJjZSIsIi1vc0NTUyIsIi1vc0NvbW1lcmNlIiwiLXh0Q29tbWVyY2Ui
LCItWmVuIENhcnQiLCItWGFuYXJpbyJdfSx7InR5cGUiOiJvdmVycmlkZSIsImlk
IjoidXNlcHJveHkiLCJ2YWx1ZSI6ZmFsc2V9LHsidHlwZSI6ImZpbHRlciIsInJl
c3VsdCI6ImNtcyIsImZpbHRlclR5cGUiOiJyZW5vdG1hdGNoIiwidmFsdWUiOiJu
b25lfHVua25vdyIsIm9wdGlvbiI6ImlzIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRw
MS5wcmVzZXQiLCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxlTmFt
ZSI6IkVjb21lcmNlLnR4dCIsImFkZGl0aW9uYWxGb3JtYXRzIjpbXSwicmVzdWx0
c1VuaXF1ZSI6Im5vIiwicXVlcnlGb3JtYXQiOlsiaHR0cDovLyRxdWVyeSJdLCJ1
bmlxdWVRdWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNlLCJp
dGVyYXRvck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1aWxk
ZXJzQWZ0ZXJJdGVyYXRvciI6ZmFsc2UsInF1ZXJ5QnVpbGRlcnNPbkFsbExldmVs
cyI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJvdmVyd3JpdGUiOmZhbHNlfSwi
ZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIsIm1vcmVPcHRpb25zIjpmYWxz
ZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRzQXBwZW5kIjoiIiwicXVlcnlC
dWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6W10sImNvbmZpZ092ZXJyaWRl
cyI6W119fQ==
 
Назад
Верх