1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Фильтр результатов по структуре url

Тема в разделе "Техническая поддержка", создана пользователем Force68, 30 мар 2014.

  1. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Такой вопрос - допустим мы парсим форумы, пусть это будет запрос типа "Powered by phpBB",
    как отфильтровать результат, чтоб не собирать весь мусор,
    а сохранять лишь ссылки имеющие признаки форумного движка?

    типа сохранять только url где присутствуют ссылки вида:
    viewtopic.php
    profile.php?mode=viewprofile&u=
    memberlist.php
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
  3. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    да я смотрел те топики, непонятно как прописать в фильтр признаки для фильтрации списком,
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
    Ну как минимум вопрос можно было задать в том топике, он специально для этого был создан

    Несколько вариантов можно прописывать через регулярку:
    [​IMG]
     
    #4 Forbidden, 31 мар 2014
    Последнее редактирование модератором: 14 ноя 2014
  5. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    спасибо большое.
     
  6. Anatoliy

    Anatoliy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2016
    Сообщения:
    48
    Симпатии:
    10
    Для теста сделал также и при тестовом парсинге даже и приблизительно не те ссылки, не сеет aparser.jpg по регулярке
     
  7. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.545
    Симпатии:
    2.163
    Покажите полностью регулярку, которую вы в фильтре используете.
     
  8. Anatoliy

    Anatoliy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2016
    Сообщения:
    48
    Симпатии:
    10
    \?contact-form-id=|\?page_id=|gaestebog|guestbook\.php|gb\.php|kontakt|noticias\.php\?subaction=|comment\.php\?view=

    Одной строкой
     
    #8 Anatoliy, 29 дек 2016
    Последнее редактирование: 29 дек 2016
  9. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.545
    Симпатии:
    2.163
    В вашей регулярке есть такой фрагмент:

    ...|gb\.php|kontakt|noticias\.php\?subaction=|...

    Поэтому все ссылки, которые у вас на скрине, подходят. Соответственно все работает как нужно, согласно заданному регулярному выражению.
     
    vipuncle, Forbidden и Anatoliy нравится это.

Поделиться этой страницей