Здравствуйте. У меня вопрос по поводу Net::HTTP парсера - на входе есть запросы с частью текста и ссылки на сайты, где эти текста встречаются. Нужно для каждого сайта найти div с текстом и взять все что между <div и </div> . Как это правильно сделать ? Для примера можно взять сайт апарсера и запрос на вход с разделителем ~!~ На сегодняшний день A-Parser развился в невероятный SEO комбаин~!~https://a-parser.com На выходе в данном случае должно вывести содержимое от <div class="baseHtml messageText" до его закрытия </div>, т.к. именно в нем содержится искомый текст.
Здравствуйте. Универсальное регулярное выражение которое подходит для всех сайтов не получится.Оптимальным решением будет являться сбор всех div и проверка его содержимого на наличие искомого текста. Пример