Как сохранять результаты парсинга в 1 строке ?

yadzha · 6 Авг 2013

Частенько попадаются сайты, где нужная информация в html коде странички находится на отдельной строке между неуникальными тегами. Например, имеем такой кусок кода:

Код:

<tr>
    <td class="lightbg">Телефон:</td>
    <td class="lightbg">&nbsp;<b>(3822)63-31-39</b></td>
</tr>
<tr>
    <td class="lightbg">Мобильный:</td>
    <td class="lightbg">&nbsp;<b>8-952-803-14-22</b></td>
</tr>

Как построить регулярку, чтобы телефоны сохранились в одной строке?
Сейчас делаю таким образом:

Код:

Parse Custom Result :  Телефон:</td>(.*?)</b>
Parse Custom Result :  Мобильный:</td>(.*?)</b>

В результате, в текстовом файле телефоны сохраняются в двух строчках вместе с куском html кода:

Код:

<td class="lightbg">&nbsp;<b>(3822)63-31-39
<td class="lightbg">&nbsp;<b>8-952-803-14-22

Приходится потом чистить файл и другим скриптом перезаписывать записи в одну строку. Возможно ли сразу средствами A-Parser'а сохранять подобные записи в одну строку без кусков кода ?

Forbidden · 6 Авг 2013

ты видимо сам указываешь лишний перенос через Result format, если первый сохранять к примеру в {phone1} а второй в {phone2}, то формат вывода должен быть примерно такой:
{phone1} {phone2}\n

ну а какую информацию захватывать целиком зависит от того как ты составил регулярку:

Код:

Телефон:</td>.*?<b>(.*?)</b>

с флагом s захватит только телефон

yadzha · 5 Фев 2014

Еще вопрос подобного рода. Имеется код:

Код:

<div class="b-company-info__label">Адрес:</div>
                    ул. Восстания, д.100,
                    Казань,
                    420095,
                    Россия
            </li>

Как настроить регулярку таким образом, чтобы адрес сохранялся в одну строку?

Forbidden · 5 Фев 2014

После парсинга к результату можно применять регулярку заменяющую переводы строк на ничего:

yadzha · 5 Фев 2014

А как такое же сделать для парсера NET::HTTP?

Forbidden · 5 Фев 2014

Точно так же, только Result builder не доступен в тесте, т.е. это надо делать непосредственно в Add task

S10n4eg · 10 Мар 2014

Здравствуйте,а подскажите что мне сделать,что бы получить весь текст с страницы в одну строчку. Вот какие у меня настройки:

Forbidden · 10 Мар 2014

Совсем неверно
Текстовый блок может содержать переносы строк, поэтому надо заменить перенос строки на пустоту
После этого сохраняем все блоки через разделитель пробел

Как сохранять результаты парсинга в 1 строке ?

yadzha

A-Parser Pro License

Forbidden

Administrator

yadzha

A-Parser Pro License

Forbidden

Administrator

yadzha

A-Parser Pro License

Forbidden

Administrator

S10n4eg

A-Parser Enterprise License

Forbidden

Administrator

О нас

Быстрая навигация

Соцсети

Поддержка