SE::Google::Compromised - Проверка наличия надписи This site may be hacked в гугле
Обзор парсера
Парсер Google Compromised позволяет проверить ниличие надписи This site may be hacked в выдаче Google. С помощью парсера Google Compromised вы можете проверять собственные базы доменов на наличие надписи. Детальней об этой надписи можно узнать в Справке Гугл поиска.
Функционал A-Parser позволяет сохранять настройки парсинга для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Проверка наличия надписи This site may be hacked в Google
Возможности
- Поддерживает все возможности парсера SE::Google.
Варианты использования
- Проверка списка доменов на наличие надписи This site may be hacked в Google
- Мониторинг своих доменов
Запросы
В качестве запросов необходимо указывать URL искомого сайта, например:
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/
Подстановки запросов
Вы можете использовать встроенные макросы для автоматической подстановки подзапросов из файлов, например мы хотим проверить сайты/сайт по базе ключей, укажем несколько основных запросов:
ria.ru
lenta.ru
rbc.ru
yandex.ru
В формате запросов укажем макрос подстановки дополнительных слов из файла Keywords.txt, данный метод позволяет проверять базу сайтов по базе ключей и получить в результате позиции:
$query {subs:Keywords}
Данный макрос создаст столько же дополнительных запросов сколько их находится в файле на каждый исходный поисковый запрос, что в сумме даст [количество исходных запросов(домены)] х [количество запросов в файле Keywords] = [общее количество запросов]
в результате работы макроса.
Еще можно указать в формате запросов протокол, чтобы можно было использовать в качестве запросов только домены:
http://$query
Данный формат подставит к каждому запросу http://
.
Варианты вывода результатов
A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON
Экспорт списка проверки наличия надписи
Формат результата:
$query: $compromised\n
Пример результата, в котором отображен URL и наличие у него надписи This site may be hacked в Google:
http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0
Ссылки + анкоры + сниппеты с выводом позиции
Вывод ссылок, анкоров и сниппетов в таблицу CSV
Сохранение связанных ключевых слов
Конкуренция ключевых слов
Проверка индексации ссылок
Сохранение в формате SQL
Дамп результатов в JSON
Обработка результатов
A-Parser позволяет обрабатывать результаты непосредственно во время парсинга, в этом разделе мы привели наиболее популярные кейсы для парсера SE::Google::Compromised
Сохранение доменов со значением проверки "1"
Добавить фильтр и в выпадающем списке выбрать переменную значения проверки $compromised - Is site compromised
. Выбрать тип: Строка равна
. Далее нужно в Строка прописать значение которое нам нужно 1
. Таким фильтром вы сможете убрать все результаты с не нужным значением.
Скачать пример
Как импортировать пример в А-Парсер
eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
Смотреть также: Фильтры результатов
Уникализация ссылок
Уникализация ссылок по домену
Извлечение доменов
Удаление тегов из анкоров и сниппетов
Фильтрация ссылок по вхождению
Возможные настройки
Поддерживает все настройки парсера SE::Google, а также дополнительно:
Название параметра | Значение по умолчанию | Описание |
---|---|---|
Pages count | 1 | Количество страниц парсинга выдачи (от 1 до 10) |
Links per page | 10 | Количество ссылок в выдачи на каждую страницу (от 10 до 100) |