Net::HTTP взять все что внутри элемента div

EceninPars

A-Parser Enterprise License
A-Parser Enterprise
Здравствуйте. У меня вопрос по поводу Net::HTTP парсера - на входе есть запросы с частью текста и ссылки на сайты, где эти текста встречаются. Нужно для каждого сайта найти div с текстом и взять все что между <div и </div> . Как это правильно сделать ? Для примера можно взять сайт апарсера и запрос на вход с разделителем ~!~

На сегодняшний день A-Parser развился в невероятный SEO комбаин~!~https://a-parser.com

На выходе в данном случае должно вывести содержимое от <div class="baseHtml messageText" до его закрытия </div>, т.к. именно в нем содержится искомый текст.
 
Здравствуйте.
Универсальное регулярное выражение которое подходит для всех сайтов не получится.Оптимальным решением будет являться сбор всех div и проверка его содержимого на наличие искомого текста.
Пример
x25ad_190124104106.png
 
Назад
Верх