SE::Yandex - Парсер поисковой выдачи Yandex

25 окт 2016

  • Собираемые данные(top)


    • Количество результатов по запросу
    • Ссылки, анкоры и сниппеты из выдачи
    • Время последнего кэширования
    • Список связанных ключевых слов(Related keywords)
    • Определяет посчитал ли Яндекс запрос опечаткой или нет
    • Определяет является ли запрос гео-зависимым
    • Парсинг ссылки на кэш страницы
    • Верхний, правый и нижний рекламные блоки со всех страниц
      • Ссылку, анкор, сниппет и домен
      • Дополнительные ссылки и анкоры
      • Станцию метро
    [​IMG]
    [​IMG]
    [​IMG]

    Возможности(top)


    • Поддержка всех поисковых операторов Yandex(site:, lang: и т.д.)
    • Парсит максимальное отдаваемое яндексом число результатов - 20 страниц по 50 элементов в выдачи
    • Возможность поиска связанных ключевых слов
    • Поддерживает выбор региона поиска, домена
    • Возможность сортировки выдачи по дате
    • Парсит время индексации страницы, с возможностью фильтрации результатов по этому параметру
    • Опция эмуляции браузера (позволяет добиться высокой скорости парсинга и малого расхода каптч)
    • Возможность обхода каптчи с помощью сервиса AntiCaptcha или любого другого поддерживающего их API
    [​IMG]

    Варианты использования(top)


    • Сбор баз ссылок - для A-Poster, XRumer, AllSubmitter и т.д.
    • Оценка конкуренции для кейвордов
    • Поиск беклинков(упоминаний) сайтов
    • Проверка индексации сайтов
    • Поиск уязвимых сайтов
    • Любые другие варианты подразумевающие парсинг Yandex в том или ином виде

    Запросы(top)


    • В качестве запросов необходимо указывать поисковые фразы, точно так же как если бы их вводили прямо в форму поиска Yandex, например:


    Результаты(top)


    • В результате отображен список ссылок по запросам:


    Возможные настройки(top)


    Общие настройки для всех парсеров

    ПараметрЗначение по умолчаниюОписание
    Links per page50Количество ссылок в выдачи на каждую страницу
    Pages count5Количество страниц для парсинга
    Sort serp by dateСортировка выдачи по дате
    Yandex domainwww.yandex.ruДомен Яндекса для парсинга, поддерживаются все домены (yandex.ru, yandex.ua, yandex.by, yandex.com.tr). Начиная с версии 1.1.345 выбирается автоматически в зависимости от выбранного региона.
    RegionРоссияВыбор страны откуда осуществляется поиск(гео-зависимый поиск)
    Use AntiGateОпределяет использовать ли antigate для обхода каптч
    AntiGate presetdefaultНеобходимо предварительно настроить парсер Util::AntiGate - указать свой ключ доступа и другие параметры, после чего выбрать созданный пресет здесь
    Parse not foundОпределяет парсить ли выдачу если по искомому запросу найдено ноль результатов и предложена выдача по другому запросу
    Emulate browserОпция эмуляции браузера
    Use accountsОпределяет использовать ли аккаунты Яндекс из files/SE-Yandex/accounts.txt
    Remove bad accountsАвтоматическое удаление аккаунтов с неверным логин/паролем или требующих подтверждения по телефону
    LanguageAnyЯзык результатов поиска
ukrpunk нравится это.