1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Помогите с регуляркой

Тема в разделе "Техническая поддержка", создана пользователем dapanom, 15 май 2014.

  1. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Здравствуйте

    Подскажите пожалуйста, как парсить содержание между тегами. <div class="">бла бла бла</div>, нужно спарсить бла бла бла

    Саппорт ответил, можно с помощью регулярных выражений.

    Помогите составить для: <div class="">текст</div>
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
  3. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Здравствуйте

    <div class="all_btn_left"><a id="scanWord" class="site2" href="javascript:void(0)">Все ответы (<b>ЗАПРОС</b>)</a></div>

    Необходимо спарсить ЗАПРОС

    Заранее большое спасибо
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Код:
    Все ответы \(<b>(.*?)</b>
    P.S. перенес сообщение - ненадо плодить кучу одинаковых тем :)
     
  5. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Спасибо!

    Еще подскажите, пожалуйста - как настроить результ формат, чтобы было:

    запрос:спаршенный текст

    Сейчас, с настройками как выше, получается вот так:

    [​IMG] [​IMG]
     
  6. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    покажи скрин задания
     
  7. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Вопрос решен)
    $divs.format('$query: $text\n')

    Еще раз спасибо
     
  8. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Здравствуйте

    Что вписать в Result type и Result format, чтобы спарсить \(<h1>(.*?)</h1>
     
  9. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Result type: flat, $1 to h1
    Result format: $p1.h1
     
  10. dapanom

    dapanom A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    30 окт 2012
    Сообщения:
    11
    Симпатии:
    0
    Спасибо!

    Еще такой вопрос:

    Можно настроить конструктор результатов, чтобы парсились урлы, только без сабдоменов? extract top domain не подходит, т.к. он обрезает ссылку

    sub.domain.ru/index.html

    Надо, чтобы парсились только такие:
    domain.ru/index.html

    Или может с помощью регулярных выражений?
     
  11. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    нужно использовать фильтр по регулярному выражению, примерно такому:

    Код:
    https?://[^.]+\.[a-z]+/
     
  12. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
  13. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Та вроде работает все...
    [​IMG]
    Выведите в результат $data - посмотрите, что у вас возвращается по запросу.
     
  14. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    А как это сделать?
     
  15. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
  16. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    хм, прям мистика какая то:
    [​IMG]
    код то парсит, а с регулярками пустой результат.
     
  17. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Даже незнаю... У меня, как видно выше, с вашими настройками все работает... Проверьте у себя (или по-новой создайте задание), может где-то лишний пробел затерялся...
     
  18. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Да вот персет сам
    eyJwcmVzZXQiOiJkb21lbjIiLCJ2YWx1ZSI6eyJwcmVzZXQiOiJkb21lbjIiLCJw
    YXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJjdXN0b21S
    ZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8bGFiZWw+KC4qPyk8L2xh
    YmVsPiIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJhcnJheSIsImFycmF5
    TmFtZSI6ImxhYmVsIiwicmVzdWx0cyI6WyJkb21haW4iXX0seyJ0eXBlIjoib3Zl
    cnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVlIjoiJGxhYmVsLmZvcm1h
    dCgnJGRvbWFpblxcbicpIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQi
    LCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRl
    ZmlsZS5mb3JtYXQoKS50eHQiLCJhZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3Vs
    dHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJdLCJ1bmlxdWVR
    dWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNlLCJpdGVyYXRv
    ck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1aWxkZXJzQWZ0
    ZXJJdGVyYXRvciI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJvdmVyd3JpdGUi
    OmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIsIm1vcmVPcHRp
    b25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRzQXBwZW5kIjoi
    IiwicXVlcnlCdWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6W10sImNvbmZp
    Z092ZXJyaWRlcyI6W119fQ==
    прям незнаю, там кода то две строчки.
     
  19. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Ну вот именно в этом пресете нужно добавить флаг g в регулярку.
    И в самой регулярке пропущен пробел после <label
    Код:
    <label >(.*?)</label>
    И все работает.
    [​IMG]
    Но странно то, что на вашем первом скрине все это есть, и он не работал.
     
    Force68 нравится это.
  20. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Спасибо, действительно все заработало как надо!
     

Поделиться этой страницей