1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Ошибка mailto ссылки в LinkExtractor

Тема в разделе "1.0.99", создана пользователем Павел, 15 авг 2013.

  1. Павел

    Павел A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    26 июн 2013
    Сообщения:
    2
    Симпатии:
    0
    Модуль собиратора ссылок считает тип ссылок mailto: относительным и дописывает к ним домен
    http://screenshot.su/show.php?img=2b796f6195caf0b19eb14956ca7cc93f.jpg
    надо либо их игнорить потому что это вроде как и не ссылки либо не дописывать домен
    еще бывают ссылки href="javascript:..." вроде но не часто
     
  2. Павел

    Павел A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    26 июн 2013
    Сообщения:
    2
    Симпатии:
    0
    Кроме того на одной из страниц сайта был редирект на другой сайт, linkextractor черпнул ссылки с внешнего ресурса на который был редирект и подставил домен исследуемого сайта в итоге сгенерилось много 404-ых http://screenshot.su/show.php?img=99dbb291a71bf8f2a910d8c1b1c41505.jpg
     

Поделиться этой страницей