1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Парсинг названий фирмы,ее адресов и кантактов

Тема в разделе "Техническая поддержка", создана пользователем Siava, 7 авг 2014.

  1. Siava

    Siava A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    20 мар 2013
    Сообщения:
    29
    Симпатии:
    0
    Добрый день!Нужно спарсить названия фирмы,ее адресов и контактов на сайт http://toplutsk.com/biz/. Результат должен быть в форме: Название фирмы,адрес,телефон.
    Версия программы очень старая 1.0.236.
    Подскажите пожалуйста как ето реализовать?В программе новичок..
     
    #1 Siava, 7 авг 2014
    Последнее редактирование: 7 авг 2014
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
  3. Siava

    Siava A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    20 мар 2013
    Сообщения:
    29
    Симпатии:
    0
    Делал по этому примеру http://a-parser.com/threads/873/ но говорит что не верное регулярное выражение. Я использовал такое
    <h2 class="hh2">(.*?)<p>Адреса (.*?)<p>Телефон (.?*) и такое <h2 class="hh2">.*?<p>Адреса .*?<p>Телефон .?*. Подскажите пожалуйста что я сделал не так?
    upload_2014-8-7_14-17-46.png
     

    Вложения:

  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    .?* - это некорректная запись, правильно так - .*?
    чтобы сохранять несколько значений - надо добавить $2 и $3 - иконка с + в строке Result type

    Для использования многостраничного парсинга в Query format необходимо указать макрос {pagenum} в том месте где надо подставить номер страницы
     
  5. Siava

    Siava A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    20 мар 2013
    Сообщения:
    29
    Симпатии:
    0
    Изменил все что вы сказали,ошибки нет. Но файл с результатами пустой. Регулярку не верно составил?
    upload_2014-8-7_14-45-54.png
     
  6. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    Скорее всего неверно, я не могу знать
    Регулярку надо сначала протестировать - например в notepad++ или онлайн сервисах вроде http://www.regexr.com/
     
  7. Siava

    Siava A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    20 мар 2013
    Сообщения:
    29
    Симпатии:
    0
    Проверил на сайте, регулярка работает- <h2 class="hh2">(.*?)<p>Адреса: (.*?)<p>Телефон: [0-9]*...а текстовый файл с результатами пустой.....
     
    #7 Siava, 7 авг 2014
    Последнее редактирование: 7 авг 2014
  8. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    еще одна ошибка - это то что в качестве результата для парсинга выбран запрос {query}, должен быть {data} - исходный код страницы
     
  9. Siava

    Siava A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    20 мар 2013
    Сообщения:
    29
    Симпатии:
    0
    upload_2014-8-7_20-23-44.png
    Регулярка: <h2 class="hh2">([^<]+).*?<p>Адреса:([^<]+).*?<p>Телефон:(?:&nbsp;| )([-+() 0-9]*). Спасибо поддержке!!
     

Поделиться этой страницей