1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Помогите спарсить данные со страниц

Тема в разделе "Техническая поддержка", создана пользователем Sergey_1, 20 авг 2014.

  1. Sergey_1

    Sergey_1 A-Parser Pro License
    A-Parser Pro

    Регистрация:
    19 авг 2013
    Сообщения:
    5
    Симпатии:
    0
    Имеются линки, на страницах которых неоднократно повторяется код

    <div class="domain-bits">
    <span class="domain">stream.eu</span>
    </div>
    <div class="domain-bits">
    <span class="icon-23">&nbsp;</span>

    в итоге надо получить список доменов (по одному на строке) после которых на страницах стоит иконка
    icon-23, таких на одной странице несколько.

    Помогите пожалуйста с настройкой, желательно скрин, спасибо.
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    [​IMG]

    регулярка целиком примерно такая:
    Код:
    <span class="domain">(.*?)</span>\n</div>\n<div class="domain-bits">\n<span class="icon-23"
     
  3. Sergey_1

    Sergey_1 A-Parser Pro License
    A-Parser Pro

    Регистрация:
    19 авг 2013
    Сообщения:
    5
    Симпатии:
    0
    $p1.domains.format('$domain\n')Ничего не выводится в файл результатов
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    ну значит регулярка не подходит к исходным данным, проверяй на исходнике страницы и корректируй
     

Поделиться этой страницей