Такой вопрос - допустим мы парсим форумы, пусть это будет запрос типа "Powered by phpBB", как отфильтровать результат, чтоб не собирать весь мусор, а сохранять лишь ссылки имеющие признаки форумного движка? типа сохранять только url где присутствуют ссылки вида: viewtopic.php profile.php?mode=viewprofile&u= memberlist.php
Ну как минимум вопрос можно было задать в том топике, он специально для этого был создан Несколько вариантов можно прописывать через регулярку:
Для теста сделал также и при тестовом парсинге даже и приблизительно не те ссылки, не сеет по регулярке
Спойлер: Вот всё \?contact-form-id=|\?page_id=|gaestebog|guestbook\.php|gb\.php|kontakt|noticias\.php\?subaction=|comment\.php\?view= Одной строкой
В вашей регулярке есть такой фрагмент: ...|gb\.php|kontakt|noticias\.php\?subaction=|... Поэтому все ссылки, которые у вас на скрине, подходят. Соответственно все работает как нужно, согласно заданному регулярному выражению.