1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Парсинг кеша Яндекса

Тема в разделе "Делимся опытом", создана пользователем WelcomePartners, 28 окт 2014.

  1. WelcomePartners

    WelcomePartners A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    15 окт 2014
    Сообщения:
    20
    Симпатии:
    5
    Подскажите, пожалуйста, как настроить Апарсер, чтоб собирать урлы заранее искомых доменов в кеше Яндекса? Цель - проверка проиндексированности беклинка Яндексом.
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Массив serp содержит элементы cachelink:

    [​IMG]
     
  3. WelcomePartners

    WelcomePartners A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    15 окт 2014
    Сообщения:
    20
    Симпатии:
    5
    Не совсем понятно что с этим делать. Вот так выглядит результат работы парсера:
    [​IMG]

    Тут искать дату последнего обновления страницы или что?
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    это ссылка на кэш яндекса заданной страницы, что именно с ней делать зависит от задачи
     
  5. WelcomePartners

    WelcomePartners A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    15 окт 2014
    Сообщения:
    20
    Симпатии:
    5
    Задача следующая. Есть список страниц разных сайтов, на которых размещена ссылка на продвигаемую страницу http://domain.com/page.html
    Необходимо проверить существует ли ссылка на продвигаемую страницу в кеше Яндекса исследуемых страниц.
     
  6. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Необходимо сначала получить ссылки на кэш с помощью SE::Yandex и примера указанного выше, после этого вторым заданием можно проверить нахождение бэклинка с помощью парсера Check::BackLink Check::BackLink
     
  7. WelcomePartners

    WelcomePartners A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    15 окт 2014
    Сообщения:
    20
    Симпатии:
    5
    Создаю запрос для парсера Check::Backlink cо строкой:
    Код:
    http://hghltd.yandex.net/yandbtm?fmode=inject&url=http%3A%2F%2Fa-parser.com%2Fwiki%2Fcheck-backlink%2F&tld=ru&lang=ru&la=1412051328&text=url%3Aa-parser.com%2Fwiki%2Fcheck-backlink%2F&l10n=ru&mime=html&sign=e54312c1a207366c72af013535c4a990&keyno=0 http://xenforo.com/
    На выходе не получаю ничего:
    [​IMG]
    Что я делаю не так?
     
  8. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Что значит ничего? результат в последней строке:
    Код:
    http://hghltd.yandex.net/yandbtm?fmode=inject&url=http%3A%2F%2Fa-parser.com%2Fwiki%2Fcheck-backlink%2F&tld=ru&lang=ru&la=1412051328&text=url%3Aa-parser.com%2Fwiki%2Fcheck-backlink%2F&l10n=ru&mime=html&sign=e54312c1a207366c72af013535c4a990&keyno=0 - http://xenforo.com/: 1, blocked by robots.txt: none
     
  9. WelcomePartners

    WelcomePartners A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    15 окт 2014
    Сообщения:
    20
    Симпатии:
    5
    Действительно, не догадался в коне строки посмотреть :)

    Но теперь я не могу составить правильный набор правил. Пробую так, но где-то закралась ошибка:
    [​IMG]
     
  10. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Я же говорил что надо 2 задания делать, в одном никак не получится :)
     

Поделиться этой страницей