Как сохранять результаты парсинга в 1 строке ?

  • Автор темы Автор темы yadzha
  • Дата начала Дата начала

yadzha

A-Parser Pro License
A-Parser Pro
Частенько попадаются сайты, где нужная информация в html коде странички находится на отдельной строке между неуникальными тегами. Например, имеем такой кусок кода:
Код:
<tr>
    <td class="lightbg">Телефон:</td>
    <td class="lightbg">&nbsp;<b>(3822)63-31-39</b></td>
</tr>
<tr>
    <td class="lightbg">Мобильный:</td>
    <td class="lightbg">&nbsp;<b>8-952-803-14-22</b></td>
</tr>

Как построить регулярку, чтобы телефоны сохранились в одной строке?
Сейчас делаю таким образом:

Код:
Parse Custom Result :  Телефон:</td>(.*?)</b>
Parse Custom Result :  Мобильный:</td>(.*?)</b>

В результате, в текстовом файле телефоны сохраняются в двух строчках вместе с куском html кода:

Код:
<td class="lightbg">&nbsp;<b>(3822)63-31-39
<td class="lightbg">&nbsp;<b>8-952-803-14-22

Приходится потом чистить файл и другим скриптом перезаписывать записи в одну строку. Возможно ли сразу средствами A-Parser'а сохранять подобные записи в одну строку без кусков кода ?
 
ты видимо сам указываешь лишний перенос через Result format, если первый сохранять к примеру в {phone1} а второй в {phone2}, то формат вывода должен быть примерно такой:
{phone1} {phone2}\n

ну а какую информацию захватывать целиком зависит от того как ты составил регулярку:
Код:
Телефон:</td>.*?<b>(.*?)</b>
с флагом s захватит только телефон
 
Еще вопрос подобного рода. Имеется код:

Код:
<div class="b-company-info__label">Адрес:</div>
                    ул. Восстания, д.100,
                    Казань,
                    420095,
                    Россия
            </li>

Как настроить регулярку таким образом, чтобы адрес сохранялся в одну строку?
 
После парсинга к результату можно применять регулярку заменяющую переводы строк на ничего:
imN31.png
 
Точно так же, только Result builder не доступен в тесте, т.е. это надо делать непосредственно в Add task
 
Здравствуйте,а подскажите что мне сделать,что бы получить весь текст с страницы в одну строчку. Вот какие у меня настройки:
 
Совсем неверно
Текстовый блок может содержать переносы строк, поэтому надо заменить перенос строки на пустоту
После этого сохраняем все блоки через разделитель пробел


4cNz3.png
 
Назад
Верх