SE::Google::TrustCheck - Проверка сайта на trust
Обзор парсера
Парсер позволяет проверить траст сайта в Гугле. Доступны все возможности парсера SE::Google. Благодаря многопоточной работе A-Parser'a, скорость обработки запросов может достигать 900 запросов в минуту, что в среднем позволяет получать до 6200 результатов в минуту.
Функционал A-Parser позволяет сохранять настройки парсинга для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Проверка на Trust (доверие) гугла к сайту
- Возможные результаты -
0
,1
и2
:0
- нет дополнительных блоков ссылок1
или2
означает, что у гугла есть доверие к сайту, поскольку он выводит дополнительные блоки ссылок.1
- означает, что у сайта есть горизонтальный блок ссылок , а2
- означает, что у него есть большой вертикальный блок ссылок
Возможности
- Сбор базы трастовых сайтов
- Поддерживает выбор страны поиска, домена, языка результатов и другие настройки
Запросы
В качестве запросов необходимо указывать URL искомого сайта , например:
http://uraldekor.ru/
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://vk.com/
http://facebook.com/
http://youtube.com/
Подстановки запросов
Вы можете использовать встроенные макросы для автоматической подстановки подзапросов из файлов, например мы хотим проверить сайты/сайт по базе ключей, укажем несколько основных запросов:
ria.ru
lenta.ru
rbc.ru
yandex.ru
В формате запросов укажем макрос подстановки дополнительных слов из файла Keywords.txt, данный метод позволяет проверять базу сайтов по базе ключей и получить в результате позиции:
$query {subs:Keywords}
Данный макрос создаст столько же дополнительных запросов сколько их находится в файле на каждый исходный поисковый запрос, что в сумме даст [количество исходных запросов(домены)] х [количество запросов в файле Keywords] = [общее количество запросов]
в результате работы макроса.
Еще можно указать в формате запросов протокол, чтобы можно было использовать в качестве запросов только домены:
http://$query
Данный формат подставит к каждому запросу http://
.
Варианты вывода результатов
A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON
Экспорт списка проверки траста
Формат результата:
$query: $trustrank\n
В результате отображен список ссылок и его проверка на Trust.
Пример результата:
http://www.yandex.ru/: 2
http://a-parser.com/: 1
http://vk.com/: 2
http://uraldekor.ru/: 0
http://google.com/: 2
...
Ссылки + анкоры + сниппеты с выводом позиции
Вывод ссылок, анкоров и сниппетов в таблицу CSV
Сохранение связанных ключевых слов
Конкуренция ключевых слов
Проверка индексации ссылок
Сохранение в формате SQL
Дамп результатов в JSON
Обработка результатов
A-Parser позволяет обрабатывать результаты непосредственно во время парсинга, в этом разделе мы привели наиболее популярные кейсы для парсера SE::Google::TrustCheck
Сохранение доменов со значением траста "1"
Добавить фильтр и в выпадающем списке выбрать переменную траста $trustrank - Trust rank
. Выбрать тип: Строка равна
. Далее нужно в Строка прописать значение траста которое нам нужно 1
. Таким фильтром вы сможете убрать все результаты с не нужным трастом.
Скачать пример
Как импортировать пример в А-Парсер
eJx1VEtz2jAQ/iuMJod2hjhw6MU3woROOzSkCTkBB4HXRLWsNXrwGA//vSvZ2CYt
J3tf37f7raSSWW4y86LBgDUsXpSsCP8sZm9PcfwdcSshjufaGTv+gE3Wu+8FQ3OV
9VIhLWjWZwXXBrQHWNyoo6QEUu6kZf2S2VMBRIF70FokQEGRkJ2izrmlBkIa23Pp
fNrdzoE+xb07e2FeLhU738YpNB5PGqwWYDo4w8Fg0C1r2q8ZY9YQkLOKzqtU2Dku
u1D0j4UVqMgwoAw7r1YXIDMJc/jOi2FUC9oE3/ge5ljRQ+uekPXM8zBvwi34aFQJ
8uVrZI8egSeJ8JxcVgxe8Jb1XYldaE4h5XrNaPyJxtwPBgEgCHnpbsE+rC3ih4dK
X0ZILkD8rkpZnHJpoM8MdTzh1E/yOSJIIW5Rz4IU5C8ZqpGUU9iDbNMC/qMTMqFD
Mkqp6Edd+P+U2T8Y52bKLhWt/aCphwYlWI+zX21VglPckgDJmsaXIheWbDNGp/x+
BuTMAIpGumcvXY4aGpoauWanm1KA8mes3dyoaF1XY1xt59q5QZWK7aw+t5dMp+Z0
HWdqjHkhwc+lnJS0FgOv7SkZmXoN3mgb/Fw8DhR+9Mu9YxZRmp9vVauFFnQKv/kG
c1Kyy1pDbriU76/TboS1J4sMpznNlKGOtFsqfl89A9EG86U6HA7RiasEjiG4DS9C
Fdpn1TflG1gj1tYJnXXrkMI8t4Ut0qkkZc6r5oVpXqry1jsTl2da+x/zUhV4jXw6
+UhsEy7s8PwXfU7A2Q==
Смотреть также: Фильтры результатов
Уникализация ссылок
Уникализация ссылок по домену
Извлечение доменов
Удаление тегов из анкоров и сниппетов
Фильтрация ссылок по вхождению
Возможные настройки
Поддерживает все настройки парсера SE::Google, а также дополнительно:
Название параметра | Значение по умолчанию | Описание |
---|---|---|
Pages count | 1 | Количество страниц парсинга выдачи (от 1 до 10) |
Links per page | 10 | Количество ссылок в выдачи на каждую страницу (от 10 до 100) |