SE::Yahoo - Парсер поисковой выдачи Yahoo
Обзор парсера
Парсер поисковой выдачи Yahoo. Благодаря парсеру Yahoo вы сможете получать большие базы ссылок, готовых для дальнейшего использования. Вы можете использовать запросы в том же виде, в котором вы вводите их в поисковую строку Yahoo, включая поисковые операторы (site, ip и т.д.).
Функционал A-Parser позволяет сохранять настройки парсинга парсера Yahoo для дальнейшего использования (пресеты), задавать расписание парсинга и многое другое. Вы можете использовать автоматическое размножение запросов, подстановку подзапросов из файлов, перебор цифро-буквенных комбинаций и списков для получения максимально возможного количества результатов.
Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV.
Собираемые данные
- Ссылки, анкоры и сниппеты из выдачи
- Список связанных ключевых слов (Related keywordsW)
- Рекламная выдача
Возможности
- Поддержка всех поисковых операторов Yahoo(site:, ip: и т.д.)
- Парсит максимальное отдаваемое Yahoo число результатов - 50 страниц по 100 элементов в выдачи
- Может автоматически парсить больше 1000 результатов на запрос - подставляет дополнительные символы (опция Parse all results)
- Возможность парсить в глубину по связанным ключевым словам (Parse related to level)
- Возможность поиска связанных ключевых слов
- Поддерживает указание времени выдачи
Варианты использования
- Сбор баз ссылок - для A-Poster, XRumer, AllSubmitter и т.д.
- Оценка конкуренции для кейвордов
- Поиск беклинков (упоминаний) сайтов
- Проверка индексации сайтов
- Поиск сайтов на одном IP адресе
- Поиск уязвимых сайтов
- Любые другие варианты подразумевающие парсинг Yahoo в том или ином виде
Запросы
В качестве запросов необходимо указывать поисковые фразы, точно так же как если бы их вводили прямо в форму поиска Yahoo, например:
test
окна Москва
site:http://lenta.ru
ip:222.36.12.12
Подстановки запросов
Вы можете использовать встроенные макросы для разможения запросов, например мы хотим получить очень большую базу форумов, укажем несколько основных запросов на разных языках:
forum
форум
foro
论坛
В формате запросов укажем перебор символов от a до zzzz, данный метод позволяет максимально ротировать поисковую выдачу и получать множество новых уникальных результатов:
$query {az:a:zzzz}
Данный макрос создаст 475254
дополнительных запросов на каждый исходный поисковый запрос, что в сумме даст 4 х 475254 = 1901016
поисковых запроса, цифра впечатляющая, но это совсем не проблема для A-Parser'а. При скорости 2000
запросов в минуту такое задание обработается всего за 16
часов.
Использование операторов
Вы можете использовать поисковые операторы в формате запроса, таким образом он будет автоматически добавлен к каждому запросу из вашего списка:
site:$query
Варианты вывода результатов
A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON
Экспорт списка ссылок
Ссылки + анкоры + сниппеты с выводом позиции
Вывод ссылок, анкоров и сниппетов в таблицу CSV
Сохранение связанных ключевых слов
Конкуренция ключевых слов
Проверка индексации ссылок
Сохранение в формате SQL
Дамп результатов в JSON
Обработка результатов
A-Parser позволяет обрабатывать результаты непосредственно во время парсинга, в этом разделе мы привели наиболее популярные кейсы для парсера Yahoo
Уникализация ссылок
Уникализация ссылок по домену
Извлечение доменов
Удаление тегов из анкоров и сниппетов
Фильтрация ссылок по вхождению
Возможные настройки
Название параметра | Значение по умолчанию | Описание |
---|---|---|
Pages count | 5 | Количество страниц для парсинга (от 1 до 50) |
Serp time | All time | Время серпа (временно-зависимый поиск, параметр "tbs=": All time / Past 24 hours / Past week / Past month) |
Safe Search | Moderate | Выбор опции безопасного поиска (Off / Moderate / Strict) |
Yahoo domain | United States (English) | Выбор домена Yahoo |
Yahoo language | Any | Выбор языка Yahoo, позволяет выбрать язык поиска |
Yahoo country | Any | Выбор страны, позволяет выбрать страну по которой будет производиться поиск |
Not found is error | ☐ | Считать ли отсутствие результатов ошибкой |