1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 1500+ и мы растем!
    Скрыть объявление

Ошибка [1.1.236] Ошибка при парсинге сайтов с <base href="/">

Тема в разделе "1.1.247", создана пользователем Pavel Z, 19 апр 2015.

  1. Pavel Z

    Pavel Z A-Parser Pro License
    A-Parser Pro

    Регистрация:
    2 янв 2015
    Сообщения:
    2
    Симпатии:
    0
    Попадаются сайты, где HTML::LinkExtractor не может найти ссылки. Подозреваю что это происходит из-за не совсем корректного base href - <base href="/">. Возможно это и не по стандарту, но в сети такие варианты встречаются и в браузерах эти сайты работают.

    Нужно иметь возможность или вручную делать override для base href, или же добавить правило - если <base href="/"> то считать за базу основной домен из query.
     
    #1 Pavel Z, 19 апр 2015
    Последнее редактирование: 19 апр 2015

Поделиться этой страницей