1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

HTML::LinkExtractor не правильно парсит ссылки

Тема в разделе "Техническая поддержка", создана пользователем Valentin5, 24 июн 2017.

  1. Valentin5

    Valentin5 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 мар 2017
    Сообщения:
    5
    Симпатии:
    0
    При работе модуля HTML::LinkExtractor не правильно парсит ссылки.
    В файле результата - очень много многострунного HTML.
    Пример ссылки - http://by-s.me/
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.377
    Симпатии:
    2.107
    Добрый день.
    Возможно вы выводите в результат вместе со ссылками анкоры, в которых может содержатся HTML. Если выводить только ссылки - все отлично:
    [​IMG]
    Если нужно выводить так же и анкоры, тогда есть несколько вариантов:
    • выводить $cleananchor вместо $anchor
    • чистить $anchor от ненужных элементов Конструктором результатов
    • учитывать в файле результата, что в анкоре может быть несколько строк и HTML
     

Поделиться этой страницей