1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение HTML::TextExtractor - не парсить текст в анкорах

Тема в разделе "1.0.91", создана пользователем qazwsxedc, 9 июл 2013.

  1. qazwsxedc

    qazwsxedc A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 ноя 2012
    Сообщения:
    99
    Симпатии:
    15
    HTML::TextExtractor

    Парсит текст в анкорах ссылок, что не есть хорошо. Парсится много мусора.
    Не должн сохранятся анкорный текст.
     
  2. sergeda

    sergeda A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2013
    Сообщения:
    193
    Симпатии:
    23
    Поддерживаю, не хорошо :)
     
  3. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Добавил опцию Skip anchor text
     
    qazwsxedc нравится это.

Поделиться этой страницей