Добрый день!Нужно спарсить названия фирмы,ее адресов и контактов на сайт http://toplutsk.com/biz/. Результат должен быть в форме: Название фирмы,адрес,телефон. Версия программы очень старая 1.0.236. Подскажите пожалуйста как ето реализовать?В программе новичок..
примеры со старым форматом результатов: http://a-parser.com/threads/873/ http://a-parser.com/wiki/customresult/
Делал по этому примеру http://a-parser.com/threads/873/ но говорит что не верное регулярное выражение. Я использовал такое <h2 class="hh2">(.*?)<p>Адреса (.*?)<p>Телефон (.?*) и такое <h2 class="hh2">.*?<p>Адреса .*?<p>Телефон .?*. Подскажите пожалуйста что я сделал не так?
.?* - это некорректная запись, правильно так - .*? чтобы сохранять несколько значений - надо добавить $2 и $3 - иконка с + в строке Result type Для использования многостраничного парсинга в Query format необходимо указать макрос {pagenum} в том месте где надо подставить номер страницы
Скорее всего неверно, я не могу знать Регулярку надо сначала протестировать - например в notepad++ или онлайн сервисах вроде http://www.regexr.com/
Проверил на сайте, регулярка работает- <h2 class="hh2">(.*?)<p>Адреса: (.*?)<p>Телефон: [0-9]*...а текстовый файл с результатами пустой.....
еще одна ошибка - это то что в качестве результата для парсинга выбран запрос {query}, должен быть {data} - исходный код страницы
Регулярка: <h2 class="hh2">([^<]+).*?<p>Адреса[^<]+).*?<p>Телефон?: | )([-+() 0-9]*). Спасибо поддержке!!