1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Парсинг информации по нужным критериям

Тема в разделе "Техническая поддержка", создана пользователем span4bob, 2 июл 2017.

  1. span4bob

    span4bob A-Parser Pro License
    A-Parser Pro

    Регистрация:
    14 май 2016
    Сообщения:
    16
    Симпатии:
    4
    Просьба помочь. Есть огромное количество урлов, у каждой страницы есть повторяющиеся критерии в который заключен текст.

    К примеру нужная мне информация находится между тегами <div style=content>Нужная мне информаиця</div>

    Подскажите (или дайте ссылку где прочитать) какой парсер (скорей всего Net::HTTP) использовать и что там прописывать?

    Буду очень благодарен
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.625
    Симпатии:
    2.191
    Добрый день.
    Да, вам скорее всего подойдет Net::HTTP Net::HTTP - это универсальный парсер, который позволяет решать большинство нестандартных задач.
    Для парсинга необходимой информации нужно воспользоваться функцией Parse custom result и примерно таким регулярным выражением:
    Код:
    <div style=content>(.+?)</div>
    Рекомендую ознакомиться с такими статьями документации:
    https://a-parser.com/wiki/parse-custom-result/
    https://a-parser.com/wiki/regex/
    https://a-parser.com/wiki/results-representation/
    https://a-parser.com/wiki/result-format/
     

Поделиться этой страницей