Первые шаги работы с WordStat'ом помогите ;)

Dobrii.RU

A-Parser Pro License
A-Parser Pro
Доброго времени всем!
Приобрел А-парсер и хочу отметить что довольное интересная реализация для декстоп программ с использованием регулярок. И сразу же возникло куча вопросов хотя и надо освоить основные 3-5 функций ради чего и приобреталось ПО. По симу прошу помоши у всех кто разбирается в софте расписать желательно пошаговое, потому как думаю не только мне будет полезна данная инфа.

Сами вопросы:
1. Как организовать парсинг Вортстата по указанным кеям (в поле, файле).
2. Как собирать частотку следующих видов: Общая частотка по кею, Частотка в ковычках (словоформы) "слово" и частотка точного вхождения "!слово"
3. Как собирать конкуренцию (кон-ку) по яндексу в ковычка "кей", то есть реально количество сайтов по конкретному кею.

Интересует по сути все, возможные пошаговые скрины, регулярки которые надо заюзать ;) Буду очень благодарен всем откликнувшимся.
 
1. Как организовать парсинг Вортстата по указанным кеям (в поле, файле).
Для работы парсера
yandex-wordstat.png
SE::Yandex::WordStat необходимы аккаунты Яндекс. Аккаунты можно зарегистрировать с помощью парсера SE::Yandex::Register.
Первым делом идем в настройки(Settings), выбираем парсер SE::Yandex::WordStat, нам необходимо указать:
Pages count - сколько парсить страниц, выбираем максимум - 40
Result format - формат результата, допустим нас интересуют только кеи из левой колонки(Что искали со словом) - указываем $keys.format('$key\n')

Жмем кнопку Сохранить как новый(Save As New), вводим имя пресета, к примеру Keys list, All pages(стараемся давать осознанные имена), у нас получилось:

mciLq.png


Далее заходим в Add task(добавление задачи), настраиваем:
Config preset - конфигурация потоков, выберем 100 Threads(эти пресеты так же настраиваются во вкладке Settings)
Выбираем парсер SE::Yandex::WordStat и созданный нами пресет Keys list, All pages
Указываем запросы в поле Queries или выбираем файл с запросами(который необходимо предварительно скопировать в папку queries/)
У нас получилось:

RX7pd.png


Теперь можно добавлять задание - кнопка Add Task, после чего перейдём в очередь(Tasks Queue) и увидим наше задание в работе:

M6hMC.png


Когда задание завершится оно попадет в список завершенных заданий - переключаемся на него нажав в тулбаре кнопку Completed:

cSym4.png


Тут можно увидеть статистику задания, имя созданного файла с результатами. файл можно скачать нажав кнопку Download или забрать из папки results/


Дополнительно: SE::Yandex::WordStat имеет опцию Parse to level, которая означает что парсер может сам подставлять найденные новые ключевые слова в запросы, тем самым он их так же отпарсит, подстановки будут происходить до указанного уровня вложенности
Данную опцию можно включить нажав кнопку с иконкой инструментов справа от парсера:

VAZMa.png


И выбираем до какого уровня парсить, к примеру до 5ого:
Qj3x5.png
 
Последнее редактирование модератором:
Спасибо за ответ на первый вопрос, работает и собирает, но при просмотре файла с результатами показывает кеи в строку, отсюда сразу и вопрос как сделать чтоб каждый новый кей был с новой строки, и буду ждать помощи и ответа по оставшимся вопросам ;)
 
Спасибо за ответ на первый вопрос, работает и собирает, но при просмотре файла с результатами показывает кеи в строку, отсюда сразу и вопрос как сделать чтоб каждый новый кей был с новой строки, и буду ждать помощи и ответа по оставшимся вопросам
блокнот Windows неверно перенос отображает - используй любой другой текстовые редактор(например Notepad++)
 
2. Как собирать частотку следующих видов: Общая частотка по кею, Частотка в кавычках (словоформы) "слово" и частотка точного вхождения "!слово"
Для частотности нам необходимо создать новый пресет - нам необходимо парсить только первую страницу и в результат сохранять исходный запрос и его частотность, укажем это:
8yPT7.png


Далее добавляем задание:
1oyzV.png


Чтобы парсить частотку в кавычках нам необходимо указать что запрос должен быть в кавычках:
rsUXv.png


Чтобы парсить точное вхождение нам необходимо подставить перед каждым словом ! знак, для этого существует специальный Query Builder(конкструктор запросов), добавим его:
wQF3f.png


A-Parser может одновременно парсить исходный запрос разными парсерами(с разными настройками) и выдавать общий результат, т.е. мы может для каждого запроса собрать все 3 вида частотности в одном задании, составим такое задание:

lWFs1.png


В результате в файле мы получим:
oFO6R.png


Мы можем сохранять результат в любом удобном для нас формате, к примеру можно сохранять в CSV формате для удобства дальнейшего открытия в Excel:
kDGab.png


В результате получим:
DytGp.png


И вид в таблицах:
JgCGg.png
 
Последнее редактирование модератором:
3. Как собирать конкуренцию (кон-ку) по яндексу в кавычка "кей", то есть реально количество сайтов по конкретному кею.

Нам необходим парсер SE::Yandex - парсит выдачу яндекса, и уже настроенный пресет Pages Count use Proxy - он выводит исходный запрос и количество найденных страниц в результат, составим задание:
umCOu.png


В результате получим:
WA2Uv.png



Теперь объеденим получение частотности(всех 3 видов из предыдущего примера) и конкуренции в одном задании:

dQncs.png


В результате получим:

6udHE.png
 
Спасибо большое за быстрые ответы, надеюсь инфа поможет не только мне как навичку, но и другим ребятам )
 
Для того что бы не было none юзайте хорошие прокси, и антигейт)
 
Подскажите, пожалуйста, как парсить поисковые подсказки в Я.
 
Что то не парсит ключи. Настроики теже а в результате

программы - none, updated: none
keywords:

additional keywords:
прошивки - none, updated: none
keywords:

additional keywords:
связь - none, updated: none
keywords:
 
В свете последних обновлений, и в частности смены синтаксиса шаблонизатора, очень хотелось бы обновить данные по настройкам в этой теме.
Заранее спасибо.
 
Последнее редактирование:
Помогите хотя бы с 3-им примером.. нужен правильный Result format.
Я делаю так:

aparser2pn_2448096_12729485.png


Получаю:
слоны: "слоны": none
:слоны: 525166
:"слоны": 39060
:"": 0
окна: "окна": none
:окна: 3470184
:"окна": 19818
:"": 0
скачать драйвера: "скачать драйвера": none
:скачать драйвера: 1354348
:"скачать драйвера": 9416
:"": 0

Т.е. не снимает конкурентность и "!частотность"
 
Т.е. не снимает конкурентность и "!частотность"
сравниваем внимательно скрины, и видим что вместо totalcount ты выводишь preset, из документации:
$p1.preset и $p2.preset подразумевает что необходимо взять значение формата результата из настроек соответствующих парсеров
 
3. Как собирать конкуренцию (кон-ку) по яндексу в кавычка "кей", то есть реально количество сайтов по конкретному кею.

Нам необходим парсер SE::Yandex - парсит выдачу яндекса, и уже настроенный пресет Pages Count use Proxy - он выводит исходный запрос и количество найденных страниц в результат, составим задание:
umCOu.png


В результате получим:
WA2Uv.png



Теперь объеденим получение частотности(всех 3 видов из предыдущего примера) и конкуренции в одном задании:

dQncs.png


В результате получим:

6udHE.png
Не могу понять как всё это сделать с Parse to level. Если не трудно то выложите пресет, а нет то закажем :)

P.S. интересует в одном задании как "В результате получим:"
 
Назад
Верх