Проверка упоминаний домена в индексе Гугла

Парсер Проверка упоминаний домена в индексе Гугла 1.0

Доступно владельцам лицензии

Support Денис

A-Parser Enterprise License
A-Parser Enterprise
Пользователь Support Денис разместил новый ресурс:

Проверка упоминаний домена в индексе Гугла - Проверка упоминаний домена в индексе Гугла

Данный пресет проверяет есть ли искомый домен в индексе Google
gwr92_181018190314.png

Узнать больше об этом ресурсе...
 
поставил пресет, добавил в задание, через пару секунд вылетел с очереди
 
Здравствуйте. Запрос удачный или нет? Что пишет в логе задания ?
 
Доброго дня, каким должен быть код дополнительный в данном пресете, что бы искать упоминания домена только верхнего уровня? Вот как собирает в данном пресете http://joxi.ru/5md4Dw5H37Qegm Вот как нужно http://joxi.ru/8AndKZOTzd97Pm Т.е. необходим именно сам домен, не корень слова из этого домена, не тайтл из слова это домена, не дескрипшн из этого домена. Такой пример тоже подходит http://joxi.ru/DmBy96qcJnk4Qr Самое главное что бы было на странице в выдаче, домен верхнего уровня, а остальное не важно, что бы парсер не собирал другие параметры. Если есть домен верхнего уровня, сохраняем и без разницы где он еще присутствует, если его в верхнем уровне нет, то тогда не сохраняем, даже если он встречается в других местах, которые выше описал
 
Последнее редактирование:
Как-то совсем не понятно что именно вам нужно...

Вот как собирает в данном пресете http://joxi.ru/5md4Dw5H37Qegm
Такой пример тоже подходит http://joxi.ru/DmBy96qcJnk4Qr
Например, в чем разница на этих двух скриншотах? Почему второй подходит, а первый нет?

Если вам нужно определить, есть ли главная искомого домена в выдаче, то нужно генерировать регулярку и фильтровать по ней:
zzibm_190805162003.png
 
Как-то совсем не понятно что именно вам нужно...



Например, в чем разница на этих двух скриншотах? Почему второй подходит, а первый нет?

Если вам нужно определить, есть ли главная искомого домена в выдаче, то нужно генерировать регулярку и фильтровать по ней:
zzibm_190805162003.png
Не обязательно главная страница нужна, пусть даже это будет адрес страницы, вся суть что должен быть именно этот домен. На первом скрине, он нашел ведь название домена в домене http://joxi.ru/Y2LMwnBu74jVBA а на втором нашел этот домен пусть, даже это страница, но эта страница того домена, который нужен. Если не понятно, могу видос запилить
 
Все точно также, только регулярку нужно формировать немного другую, вот так:
Код:
[% '^https?://[^/]*' _ query.domain.replace('\.', '\\.') _ '(?:/|$)' %]
 

Вложения

Здравствуйте, каким должен быть код в данном случае. Нужно фильтрануть запросы. Т.е. в гугл вбивается запрос, если в снипетте встречается слово (моё ключевое слово из списка типа, стоп слова), то парсер этот запрос сохраняет, если нет этого слова то не сохраняет. А то напарсил слова, а не которые к моей темы не относятся.
 
Если я правильно понял задачу, то можно сделать так:
73xzc_190819103529.png

В данном примере первым фильтром фильтруются сниппеты на предмет вхождения одного из слов online, html, test, а вторым фильтром проверяется кол-во элементов в $serp после первого фильтра. И если их >0, то в результат выводится начальный запрос, иначе результат отбрасывается.
Подробнее о фильтрах здесь: https://a-parser.com/wiki/filter/
 
Здравствуйте! Помогите пожалуйста настроить этот пресет, постоянно пишет bad, хотя в выдаче присутствует домен. Когда в выдаче есть ссылка как здесь http://joxi.ru/brRJw7Gi7P3VRr, должен записать ok
 
Последнее редактирование:
Здравствуйте! Помогите пожалуйста настроить этот пресет, постоянно пишет bad, хотя в выдаче присутствует домен. Когда в выдаче есть ссылка как здесь http://joxi.ru/brRJw7Gi7P3VRr, должен записать ok
Добрый день

Пресет работает нормально, вот пример результата -
w3i49_200113114733.png
 
Этот пресет не может сломаться в принципе. Могут быть проблемы с парсером гугла, но они решаются либо обновлением до актуальной версии, либо корректной настройкой обхода рекаптч - в зависимости от того, что пишется в логе задания и какие причины неудачных.
 
Назад
Верх