HTML::LinkExtractor не правильно парсит ссылки

Valentin5

A-Parser Enterprise License
A-Parser Enterprise
При работе модуля HTML::LinkExtractor не правильно парсит ссылки.
В файле результата - очень много многострунного HTML.
Пример ссылки - http://by-s.me/
 
Добрый день.
Возможно вы выводите в результат вместе со ссылками анкоры, в которых может содержатся HTML. Если выводить только ссылки - все отлично:
Xk857.png

Если нужно выводить так же и анкоры, тогда есть несколько вариантов:
  • выводить $cleananchor вместо $anchor
  • чистить $anchor от ненужных элементов Конструктором результатов
  • учитывать в файле результата, что в анкоре может быть несколько строк и HTML
 
Назад
Верх