Net::HTTP взять все что внутри элемента div

EceninPars · 24 Янв 2019

Здравствуйте. У меня вопрос по поводу Net::HTTP парсера - на входе есть запросы с частью текста и ссылки на сайты, где эти текста встречаются. Нужно для каждого сайта найти div с текстом и взять все что между <div и </div> . Как это правильно сделать ? Для примера можно взять сайт апарсера и запрос на вход с разделителем ~!~

На сегодняшний день A-Parser развился в невероятный SEO комбаин~!~https://a-parser.com

На выходе в данном случае должно вывести содержимое от <div class="baseHtml messageText" до его закрытия </div>, т.к. именно в нем содержится искомый текст.

Support Денис · 24 Янв 2019

Здравствуйте.
Универсальное регулярное выражение которое подходит для всех сайтов не получится.Оптимальным решением будет являться сбор всех div и проверка его содержимого на наличие искомого текста.
Пример

Net::HTTP взять все что внутри элемента div

EceninPars

A-Parser Enterprise License

Support Денис

A-Parser Enterprise License

О нас

Быстрая навигация

Соцсети

Поддержка