1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

SE:: Google. Парсинг урлов с Google запрос site:site.com

Тема в разделе "Делимся опытом", создана пользователем ulan, 9 авг 2013.

  1. ulan

    ulan A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 июл 2013
    Сообщения:
    50
    Симпатии:
    6
    Входные данные, имеем файл с доменами

    Нужно взять каждый домен из списка отпарсить по site:site.com, с подстановками
    и сохранить результат в файлы site.com.txt (без www, http://), результаты должны сохраняться только на тот домен который парсим, без поддоменов.

    shot_130809_154302.png
    Код:
    Ps. Пока не убрал сохранение поддоменов
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Это не реализовать, т.к. необходимо домен в выдаче сравнивать с доменом из запроса, а это не поддерживается
     
  3. ulan

    ulan A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 июл 2013
    Сообщения:
    50
    Симпатии:
    6
    плохо, это можно при сохранении сравнить а не в выдаче
     
  4. ulan

    ulan A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 июл 2013
    Сообщения:
    50
    Симпатии:
    6
    И еще вопрос при таком конфиге как сейчас сохраняет вот так
    site_site.com.txt
    как убрать site_
     
  5. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    вместо {query} используй {origquery}
     
  6. ulan

    ulan A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 июл 2013
    Сообщения:
    50
    Симпатии:
    6
    ну разве я не смогу вот так сохранить
    preg_match_all('%^https?:{query}.+?$%im', $subject, $result, PREG_PATTERN_ORDER);
     
  7. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791

    ты можешь делать все что угодно, написать свой парсер на пхп например
    когда тебе говорят что это не реализовать средствами апарсера наверно так оно и есть
     

Поделиться этой страницей