Доброго времени всем! Приобрел А-парсер и хочу отметить что довольное интересная реализация для декстоп программ с использованием регулярок. И сразу же возникло куча вопросов хотя и надо освоить основные 3-5 функций ради чего и приобреталось ПО. По симу прошу помоши у всех кто разбирается в софте расписать желательно пошаговое, потому как думаю не только мне будет полезна данная инфа. Сами вопросы: 1. Как организовать парсинг Вортстата по указанным кеям (в поле, файле). 2. Как собирать частотку следующих видов: Общая частотка по кею, Частотка в ковычках (словоформы) "слово" и частотка точного вхождения "!слово" 3. Как собирать конкуренцию (кон-ку) по яндексу в ковычка "кей", то есть реально количество сайтов по конкретному кею. Интересует по сути все, возможные пошаговые скрины, регулярки которые надо заюзать Буду очень благодарен всем откликнувшимся.
1. Как организовать парсинг Вортстата по указанным кеям (в поле, файле). Для работы парсера SE::Yandex::WordStat необходимы аккаунты Яндекс. Аккаунты можно зарегистрировать с помощью парсера SE::Yandex::Register. Первым делом идем в настройки(Settings), выбираем парсер SE::Yandex::WordStat, нам необходимо указать: Pages count - сколько парсить страниц, выбираем максимум - 40 Result format - формат результата, допустим нас интересуют только кеи из левой колонки(Что искали со словом) - указываем $keys.format('$key\n') Жмем кнопку Сохранить как новый(Save As New), вводим имя пресета, к примеру Keys list, All pages(стараемся давать осознанные имена), у нас получилось: Далее заходим в Add task(добавление задачи), настраиваем: Config preset - конфигурация потоков, выберем 100 Threads(эти пресеты так же настраиваются во вкладке Settings) Выбираем парсер SE::Yandex::WordStat и созданный нами пресет Keys list, All pages Указываем запросы в поле Queries или выбираем файл с запросами(который необходимо предварительно скопировать в папку queries/) У нас получилось: Теперь можно добавлять задание - кнопка Add Task, после чего перейдём в очередь(Tasks Queue) и увидим наше задание в работе: Когда задание завершится оно попадет в список завершенных заданий - переключаемся на него нажав в тулбаре кнопку Completed: Тут можно увидеть статистику задания, имя созданного файла с результатами. файл можно скачать нажав кнопку Download или забрать из папки results/ Дополнительно: SE::Yandex::WordStat имеет опцию Parse to level, которая означает что парсер может сам подставлять найденные новые ключевые слова в запросы, тем самым он их так же отпарсит, подстановки будут происходить до указанного уровня вложенности Данную опцию можно включить нажав кнопку с иконкой инструментов справа от парсера: И выбираем до какого уровня парсить, к примеру до 5ого:
Спасибо за ответ на первый вопрос, работает и собирает, но при просмотре файла с результатами показывает кеи в строку, отсюда сразу и вопрос как сделать чтоб каждый новый кей был с новой строки, и буду ждать помощи и ответа по оставшимся вопросам
блокнот Windows неверно перенос отображает - используй любой другой текстовые редактор(например Notepad++)
2. Как собирать частотку следующих видов: Общая частотка по кею, Частотка в кавычках (словоформы) "слово" и частотка точного вхождения "!слово" Для частотности нам необходимо создать новый пресет - нам необходимо парсить только первую страницу и в результат сохранять исходный запрос и его частотность, укажем это: Далее добавляем задание: Чтобы парсить частотку в кавычках нам необходимо указать что запрос должен быть в кавычках: Чтобы парсить точное вхождение нам необходимо подставить перед каждым словом ! знак, для этого существует специальный Query Builder(конкструктор запросов), добавим его: A-Parser может одновременно парсить исходный запрос разными парсерами(с разными настройками) и выдавать общий результат, т.е. мы может для каждого запроса собрать все 3 вида частотности в одном задании, составим такое задание: В результате в файле мы получим: Мы можем сохранять результат в любом удобном для нас формате, к примеру можно сохранять в CSV формате для удобства дальнейшего открытия в Excel: В результате получим: И вид в таблицах:
3. Как собирать конкуренцию (кон-ку) по яндексу в кавычка "кей", то есть реально количество сайтов по конкретному кею. Нам необходим парсер SE::Yandex - парсит выдачу яндекса, и уже настроенный пресет Pages Count use Proxy - он выводит исходный запрос и количество найденных страниц в результат, составим задание: В результате получим: Теперь объеденим получение частотности(всех 3 видов из предыдущего примера) и конкуренции в одном задании: В результате получим:
Спасибо большое за быстрые ответы, надеюсь инфа поможет не только мне как навичку, но и другим ребятам )
для WordStat подключи антигейт - настрой парсер Util::AntiGate, укажи в нем ключ доступа, а в парсере SE::Yandex::WordStat укажи галочку Use AntiGate и выбери созданный пресет
Что то не парсит ключи. Настроики теже а в результате программы - none, updated: none keywords: additional keywords: прошивки - none, updated: none keywords: additional keywords: связь - none, updated: none keywords:
В свете последних обновлений, и в частности смены синтаксиса шаблонизатора, очень хотелось бы обновить данные по настройкам в этой теме. Заранее спасибо.
Помогите хотя бы с 3-им примером.. нужен правильный Result format. Я делаю так: Получаю: Т.е. не снимает конкурентность и "!частотность"
Не могу понять как всё это сделать с Parse to level. Если не трудно то выложите пресет, а нет то закажем P.S. интересует в одном задании как "В результате получим:"