Частенько попадаются сайты, где нужная информация в html коде странички находится на отдельной строке между неуникальными тегами. Например, имеем такой кусок кода: Код: <tr> <td class="lightbg">Телефон:</td> <td class="lightbg"> <b>(3822)63-31-39</b></td> </tr> <tr> <td class="lightbg">Мобильный:</td> <td class="lightbg"> <b>8-952-803-14-22</b></td> </tr> Как построить регулярку, чтобы телефоны сохранились в одной строке? Сейчас делаю таким образом: Код: Parse Custom Result : Телефон:</td>(.*?)</b> Parse Custom Result : Мобильный:</td>(.*?)</b> В результате, в текстовом файле телефоны сохраняются в двух строчках вместе с куском html кода: Код: <td class="lightbg"> <b>(3822)63-31-39 <td class="lightbg"> <b>8-952-803-14-22 Приходится потом чистить файл и другим скриптом перезаписывать записи в одну строку. Возможно ли сразу средствами A-Parser'а сохранять подобные записи в одну строку без кусков кода ?
ты видимо сам указываешь лишний перенос через Result format, если первый сохранять к примеру в {phone1} а второй в {phone2}, то формат вывода должен быть примерно такой: {phone1} {phone2}\n ну а какую информацию захватывать целиком зависит от того как ты составил регулярку: Код: Телефон:</td>.*?<b>(.*?)</b> с флагом s захватит только телефон
Еще вопрос подобного рода. Имеется код: Код: <div class="b-company-info__label">Адрес:</div> ул. Восстания, д.100, Казань, 420095, Россия </li> Как настроить регулярку таким образом, чтобы адрес сохранялся в одну строку?
Точно так же, только Result builder не доступен в тесте, т.е. это надо делать непосредственно в Add task
Здравствуйте,а подскажите что мне сделать,что бы получить весь текст с страницы в одну строчку. Вот какие у меня настройки:
Совсем неверно Текстовый блок может содержать переносы строк, поэтому надо заменить перенос строки на пустоту После этого сохраняем все блоки через разделитель пробел