Фильтр результатов по структуре url

  • Автор темы Автор темы Force68
  • Дата начала Дата начала

Force68

A-Parser Enterprise License
A-Parser Enterprise
Такой вопрос - допустим мы парсим форумы, пусть это будет запрос типа "Powered by phpBB",
как отфильтровать результат, чтоб не собирать весь мусор,
а сохранять лишь ссылки имеющие признаки форумного движка?

типа сохранять только url где присутствуют ссылки вида:
viewtopic.php
profile.php?mode=viewprofile&u=
memberlist.php
 
да я смотрел те топики, непонятно как прописать в фильтр признаки для фильтрации списком,
 
Ну как минимум вопрос можно было задать в том топике, он специально для этого был создан

Несколько вариантов можно прописывать через регулярку:
IAu9d.png
 
Последнее редактирование модератором:
Ну как минимум вопрос можно было задать в том топике, он специально для этого был создан

Несколько вариантов можно прописывать через регулярку:
IAu9d.png
Для теста сделал также и при тестовом парсинге даже и приблизительно не те ссылки, не сеет aparser.jpg по регулярке
 
Покажите полностью регулярку, которую вы в фильтре используете.
 
Покажите полностью регулярку, которую вы в фильтре используете.
\?contact-form-id=|\?page_id=|gaestebog|guestbook\.php|gb\.php|kontakt|noticias\.php\?subaction=|comment\.php\?view=

Одной строкой
 
Последнее редактирование:
В вашей регулярке есть такой фрагмент:

...|gb\.php|kontakt|noticias\.php\?subaction=|...

Поэтому все ссылки, которые у вас на скрине, подходят. Соответственно все работает как нужно, согласно заданному регулярному выражению.
 
Назад
Верх