Если встречается в ссылке & то парсер не может разобраться ссылку. Парсить пришлось костылем - убирать в ссылке amp; и добавлять через query.add.
HTML сущности в Next page обрабатываются отлично, регулярку нужно составлять таким образом, чтобы домен не попадал в результат:
Спасибо, вчера пол вечера мучался. Не смог найти информации о том, что домен не должен попадать в результат...Если есть возможность - добавьте эту информацию в документацию.