Пользователь Support Денис разместил новый ресурс: Проверка упоминаний домена в индексе Гугла - Проверка упоминаний домена в индексе Гугла Узнать больше об этом ресурсе...
Доброго дня, каким должен быть код дополнительный в данном пресете, что бы искать упоминания домена только верхнего уровня? Вот как собирает в данном пресете http://joxi.ru/5md4Dw5H37Qegm Вот как нужно http://joxi.ru/8AndKZOTzd97Pm Т.е. необходим именно сам домен, не корень слова из этого домена, не тайтл из слова это домена, не дескрипшн из этого домена. Такой пример тоже подходит http://joxi.ru/DmBy96qcJnk4Qr Самое главное что бы было на странице в выдаче, домен верхнего уровня, а остальное не важно, что бы парсер не собирал другие параметры. Если есть домен верхнего уровня, сохраняем и без разницы где он еще присутствует, если его в верхнем уровне нет, то тогда не сохраняем, даже если он встречается в других местах, которые выше описал
Как-то совсем не понятно что именно вам нужно... Например, в чем разница на этих двух скриншотах? Почему второй подходит, а первый нет? Если вам нужно определить, есть ли главная искомого домена в выдаче, то нужно генерировать регулярку и фильтровать по ней:
Не обязательно главная страница нужна, пусть даже это будет адрес страницы, вся суть что должен быть именно этот домен. На первом скрине, он нашел ведь название домена в домене http://joxi.ru/Y2LMwnBu74jVBA а на втором нашел этот домен пусть, даже это страница, но эта страница того домена, который нужен. Если не понятно, могу видос запилить
Все точно также, только регулярку нужно формировать немного другую, вот так: Код: [% '^https?://[^/]*' _ query.domain.replace('\.', '\\.') _ '(?:/|$)' %]
Здравствуйте, каким должен быть код в данном случае. Нужно фильтрануть запросы. Т.е. в гугл вбивается запрос, если в снипетте встречается слово (моё ключевое слово из списка типа, стоп слова), то парсер этот запрос сохраняет, если нет этого слова то не сохраняет. А то напарсил слова, а не которые к моей темы не относятся.
Если я правильно понял задачу, то можно сделать так: В данном примере первым фильтром фильтруются сниппеты на предмет вхождения одного из слов online, html, test, а вторым фильтром проверяется кол-во элементов в $serp после первого фильтра. И если их >0, то в результат выводится начальный запрос, иначе результат отбрасывается. Подробнее о фильтрах здесь: https://a-parser.com/wiki/filter/
Здравствуйте! Помогите пожалуйста настроить этот пресет, постоянно пишет bad, хотя в выдаче присутствует домен. Когда в выдаче есть ссылка как здесь http://joxi.ru/brRJw7Gi7P3VRr, должен записать ok
Этот пресет не может сломаться в принципе. Могут быть проблемы с парсером гугла, но они решаются либо обновлением до актуальной версии, либо корректной настройкой обхода рекаптч - в зависимости от того, что пишется в логе задания и какие причины неудачных.