1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Net::HTTP взять все что внутри элемента div

Тема в разделе "Техническая поддержка", создана пользователем EceninPars, 24 янв 2019.

Метки:
  1. EceninPars

    EceninPars A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 янв 2013
    Сообщения:
    65
    Симпатии:
    14
    Здравствуйте. У меня вопрос по поводу Net::HTTP парсера - на входе есть запросы с частью текста и ссылки на сайты, где эти текста встречаются. Нужно для каждого сайта найти div с текстом и взять все что между <div и </div> . Как это правильно сделать ? Для примера можно взять сайт апарсера и запрос на вход с разделителем ~!~

    На сегодняшний день A-Parser развился в невероятный SEO комбаин~!~https://a-parser.com

    На выходе в данном случае должно вывести содержимое от <div class="baseHtml messageText" до его закрытия </div>, т.к. именно в нем содержится искомый текст.
     
  2. Support Денис

    Support Денис A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    12 июн 2017
    Сообщения:
    586
    Симпатии:
    185
    Здравствуйте.
    Универсальное регулярное выражение которое подходит для всех сайтов не получится.Оптимальным решением будет являться сбор всех div и проверка его содержимого на наличие искомого текста.
    Пример
    [​IMG]
     
    EceninPars нравится это.

Поделиться этой страницей