1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение парсинг произвольного текста со списка урлов

Тема в разделе "1.0.69", создана пользователем brxbrx, 26 июн 2013.

  1. brxbrx

    brxbrx A-Parser Pro License
    A-Parser Pro

    Регистрация:
    29 апр 2013
    Сообщения:
    1
    Симпатии:
    1
    Со списка урлов парсил весь текст из боди, очищал от мусора - тегов и т.д.
     
    sergeda нравится это.
  2. sergeda

    sergeda A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2013
    Сообщения:
    193
    Симпатии:
    23
    Очень нужная фича
     
  3. lexone

    lexone A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    17 ноя 2012
    Сообщения:
    7
    Симпатии:
    0
    Тоже за!
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
  5. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
    HTML::TextExtractor:
    [​IMG]
     
    lexone нравится это.
  6. lexone

    lexone A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    17 ноя 2012
    Сообщения:
    7
    Симпатии:
    0
    Forbidden, большое тебе спасибо. У меня просьба, можешь сделать аналог http://x-parser.ru/software/1-x-parser-light.html? Ибо у него очень тяжко парсить, каптча и скорость ужасны...
     
  7. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
    а в чем проблема сейчас это делать? (после выхода следующей версии с HTML::TextExtractor)
     
  8. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Forbidden, это бы было просто супер - тоже хотел вас попросить рассмотреть возможность добавить в а-парсер такой функционал.
     
  9. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
    Какой такой? :) кто нибудь по человечески объяснит?
     
  10. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49

    :D ну как бы:
     
    WarGuss нравится это.
  11. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.794
    Ну дак в чем проблема напарсить линков через тот же SE::Yandex, а потом пройтись HTML::TextExtractor? он собирает все текстовые блоки, с указанием минимального размера
     
  12. WarGuss

    WarGuss A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 фев 2015
    Сообщения:
    5
    Симпатии:
    0
    Forbidden если не сложно, выложите пожалуйста пример (если уже скажем есть ключи, как собрать статьи).
     
  13. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.545
    Симпатии:
    2.163

Поделиться этой страницей