1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Как отфильтровать результаты по нескольким признакам и разбить по ним в отчете?

Тема в разделе "Техническая поддержка", создана пользователем Julia, 21 май 2015.

  1. Julia

    Julia A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2014
    Сообщения:
    5
    Симпатии:
    2
    Добрый день!

    Требуется проверять списки сайтов на наличие определенных кодов (нескольких) и разбивать отчет в зависимости от того, какой код нашелся.

    Случай с поиском одного кода описан в документации. Работает. Но прогонять парсинг заново для каждого кода очень долго.

    Как организовать фильтрацию по нескольким кодам сразу? Вроде можно написать что-то на базе
    "Фильтрация ссылок по вхождению любой из нескольких разных строк", сработает?

    Но это не решает вопрос как обозначить, по какому коду была найдена страница.

    Может быть вопрос решается с помощью конструктора результатов? Чтобы он рассортировал по кодам. Помогите настроить.

    Или возможно писать в результат по какому коду найден URL, чтобы потом разделить руками в экселе?
     
  2. Julia

    Julia A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2014
    Сообщения:
    5
    Симпатии:
    2
    или допустим, как то промежуточно сохранять результаты парсинга контента и применять к нему фильтрацию результатов несколько раз подряд?
     
  3. Kreola

    Kreola Member

    Регистрация:
    23 июн 2013
    Сообщения:
    203
    Симпатии:
    19
    Здравствуйте!
    Создается множество регулярок на вхождение каждого кода, и потом просто передается в результат, например
    [​IMG]
    eyJwcmVzZXQiOiJ0b3BpYyBodHRwOi8vYS1wYXJzZXIuY29tL3RocmVhZHMvMTY1
    MS8iLCJ2YWx1ZSI6eyJwcmVzZXQiOiJ0b3BpYyBodHRwOi8vYS1wYXJzZXIuY29t
    L3RocmVhZHMvMTY1MS8iLCJwYXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0
    Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoidXNlcHJveHkiLCJ2YWx1ZSI6dHJ1
    ZX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6InByb3h5YmFubmVkY2xlYW51cCIs
    InZhbHVlIjoiMCJ9LHsidHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJnb29kQ29kZSIs
    InZhbHVlIjoyMDB9LHsidHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJwcm94eXJldHJp
    ZXMiLCJ2YWx1ZSI6IjUwIn0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0
    IjoiZGF0YSIsInJlZ2V4IjoiKHJlZ2V4cDEpIiwicmVnZXhUeXBlIjoiaSIsInJl
    c3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJhIl19
    LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdleCI6
    IihyZWdleHAyKSIsInJlZ2V4VHlwZSI6ImkiLCJyZXN1bHRUeXBlIjoiZmxhdCIs
    ImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsiYiJdfSx7InR5cGUiOiJjdXN0b21S
    ZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiIocmVnZXhwMykiLCJyZWdl
    eFR5cGUiOiJpIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJy
    ZXN1bHRzIjpbImMiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0Ijoi
    ZGF0YSIsInJlZ2V4IjoiKHJlZ2V4cDQpIiwicmVnZXhUeXBlIjoiaSIsInJlc3Vs
    dFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJkIl19LHsi
    dHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJmb3JtYXRyZXN1bHQiLCJ2YWx1ZSI6IiRx
    dWVyeTskYTskYjskYzskZFxcbiJ9XV0sInJlc3VsdHNGb3JtYXQiOiIkcDEucHJl
    c2V0IiwicmVzdWx0c1NhdmVUbyI6ImZpbGUiLCJyZXN1bHRzRmlsZU5hbWUiOiIk
    ZGF0ZWZpbGUuZm9ybWF0KCkudHh0IiwiYWRkaXRpb25hbEZvcm1hdHMiOltdLCJy
    ZXN1bHRzVW5pcXVlIjoibm8iLCJxdWVyeUZvcm1hdCI6WyIkcXVlcnkiXSwidW5p
    cXVlUXVlcmllcyI6ZmFsc2UsInNhdmVGYWlsZWRRdWVyaWVzIjpmYWxzZSwiaXRl
    cmF0b3JPcHRpb25zIjp7Im9uQWxsTGV2ZWxzIjpmYWxzZSwicXVlcnlCdWlsZGVy
    c0FmdGVySXRlcmF0b3IiOmZhbHNlfSwicmVzdWx0c09wdGlvbnMiOnsib3Zlcndy
    aXRlIjpmYWxzZX0sImRvTG9nIjoibm8iLCJrZWVwVW5pcXVlIjoiTm8iLCJtb3Jl
    T3B0aW9ucyI6ZmFsc2UsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVzdWx0c0FwcGVu
    ZCI6IiIsInF1ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRlcnMiOlt7InNv
    dXJjZSI6WzAsImEiXSwidHlwZSI6InJlZ2V4UmVwbGFjZSIsInJlZ2V4Ijoibm9u
    ZSIsInJlZ2V4VHlwZSI6bnVsbCwicmVwbGFjZSI6IiIsInRvIjoiYSJ9LHsic291
    cmNlIjpbMCwiYiJdLCJ0eXBlIjoicmVnZXhSZXBsYWNlIiwicmVnZXgiOiJub25l
    IiwicmVnZXhUeXBlIjpudWxsLCJyZXBsYWNlIjoiIiwidG8iOiJiIn0seyJzb3Vy
    Y2UiOlswLCJjIl0sInR5cGUiOiJyZWdleFJlcGxhY2UiLCJyZWdleCI6Im5vbmUi
    LCJyZWdleFR5cGUiOm51bGwsInJlcGxhY2UiOiIiLCJ0byI6ImMifSx7InNvdXJj
    ZSI6WzAsImQiXSwidHlwZSI6InJlZ2V4UmVwbGFjZSIsInJlZ2V4Ijoibm9uZSIs
    InJlZ2V4VHlwZSI6bnVsbCwicmVwbGFjZSI6IiIsInRvIjoiZCJ9XSwiY29uZmln
    T3ZlcnJpZGVzIjpbXX19
     
    Julia нравится это.
  4. Julia

    Julia A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2014
    Сообщения:
    5
    Симпатии:
    2
    Огромнейшее спасибо! Сейчас попробую.
     
  5. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.796
    лучше всего использовать Rank::CMS Rank::CMS отредактировав файл files/Rank-CMS/apps.json по своему усмотрению, преимущества:
    • можно указать большое количество признаком
    • можно задать имя для каждого признака
     

Поделиться этой страницей