1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

SE::Google парсить ссылки на кеш

Тема в разделе "Техническая поддержка", создана пользователем scp, 28 апр 2015.

  1. scp

    scp A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    6 июн 2014
    Сообщения:
    20
    Симпатии:
    3
    По аналогии с SE::Yandex - $serp.$i.cachelink

    P.S. Идеально еще бы дату кеша, но это уже нужно пройти по линку что можно cделать через Net::Http
     
    #1 scp, 28 апр 2015
    Последнее редактирование: 28 апр 2015
  2. scp

    scp A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    6 июн 2014
    Сообщения:
    20
    Симпатии:
    3
    Хм. Оказывается можно достать кеш по такой ссылке
    https://webcache.googleusercontent.com/search?q=cache:a-parser.com+&cd=1&hl=uk&ct=clnk&gl=ua
    хотя в выдаче она выглядит как
    https://webcache.googleusercontent....pFeQJ:a-parser.com/+&cd=1&hl=uk&ct=clnk&gl=ua
    тоесть хеш (jxJuojDpFeQJ) не обязательный

    Только не могу разобраться, как убрать из $serp.$i.link префикс http(s):// и передать результат в Net::Http.
     
  3. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    например через Result builder -> Extract Domain
    а в одном задании передать другому заданию не выйдет - надо следующим заданием вытягивать кэш с помощью Net::HTTP
     

Поделиться этой страницей