Перейти к основному содержимому

SE::Google::Compromised - Проверка наличия надписи This site may be hacked в гугле

Обзор парсера

Парсер Google Compromised позволяет проверить ниличие надписи This site may be hacked в выдаче Google. С помощью парсера Google Compromised вы можете проверять собственные базы доменов на наличие надписи. Детальней об этой надписи можно узнать в Справке Гугл поиска.

Функционал A-Parser позволяет сохранять настройки парсинга для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.

Собираемые данные

  • Проверка наличия надписи This site may be hacked в Google

какие данные собирает парсер SE::Google::Compromised

Возможности

  • Поддерживает все возможности парсера SE::GoogleSE::Google.

Варианты использования

  • Проверка списка доменов на наличие надписи This site may be hacked в Google
  • Мониторинг своих доменов

Запросы

В качестве запросов необходимо указывать URL искомого сайта, например:

http://a-parser.com/  
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/

Подстановки запросов

Вы можете использовать встроенные макросы для автоматической подстановки подзапросов из файлов, например мы хотим проверить сайты/сайт по базе ключей, укажем несколько основных запросов:

ria.ru
lenta.ru
rbc.ru
yandex.ru

В формате запросов укажем макрос подстановки дополнительных слов из файла Keywords.txt, данный метод позволяет проверять базу сайтов по базе ключей и получить в результате позиции:

$query {subs:Keywords}

Данный макрос создаст столько же дополнительных запросов сколько их находится в файле на каждый исходный поисковый запрос, что в сумме даст [количество исходных запросов(домены)] х [количество запросов в файле Keywords] = [общее количество запросов] в результате работы макроса.

Еще можно указать в формате запросов протокол, чтобы можно было использовать в качестве запросов только домены:

http://$query 

Данный формат подставит к каждому запросу http://.

Варианты вывода результатов

A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON

Экспорт списка проверки наличия надписи

Формат результата:

$query: $compromised\n

Пример результата, в котором отображен URL и наличие у него надписи This site may be hacked в Google:

http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0

Аналогично как в SE::Google.

Аналогично как в SE::Google.

Аналогично как в SE::Google.

Конкуренция ключевых слов

Аналогично как в SE::Google.

Проверка индексации ссылок

Аналогично как в SE::Google.

Сохранение в формате SQL

Аналогично как в SE::Google.

Дамп результатов в JSON

Аналогично как в SE::Google.

Обработка результатов

A-Parser позволяет обрабатывать результаты непосредственно во время парсинга, в этом разделе мы привели наиболее популярные кейсы для парсера SE::Google::Compromised

Сохранение доменов со значением проверки "1"

Добавить фильтр и в выпадающем списке выбрать переменную значения проверки $compromised - Is site compromised. Выбрать тип: Строка равна. Далее нужно в Строка прописать значение которое нам нужно 1. Таким фильтром вы сможете убрать все результаты с не нужным значением.

Пример фильтрации
Скачать пример

Как импортировать пример в А-Парсер

eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
подсказка

Смотреть также: Фильтры результатов

Аналогично как в SE::Google.

Аналогично как в SE::Google.

Извлечение доменов

Аналогично как в SE::Google.

Удаление тегов из анкоров и сниппетов

Аналогично как в SE::Google.

Аналогично как в SE::Google.

Возможные настройки

Поддерживает все настройки парсера SE::GoogleSE::Google, а также дополнительно:

Название параметраЗначение по умолчаниюОписание
Pages count1Количество страниц парсинга выдачи (от 1 до 10)
Links per page10Количество ссылок в выдачи на каждую страницу (от 10 до 100)