1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Net::HTTP, помогите с форматом результата

Тема в разделе "Техническая поддержка", создана пользователем miranon, 14 окт 2016.

  1. miranon

    miranon A-Parser Pro License
    A-Parser Pro

    Регистрация:
    6 июн 2012
    Сообщения:
    28
    Симпатии:
    7
    Здравствуйте,
    Сделал такой парсер:
    [​IMG]

    Нужно спарсить заголовок и текст статьи отсюда: http://ezinearticles.com/?The-Best-Diet-For-Weight-Loss-Combined-With-Exercise&id=9532960 и вывести в результат: заголовок. текст \n

    У меня не получаеться вывести такой результат. Читал документацию, но не могу разобратся как правильно сделать. Получается только заголовок.
    Пробовал еще так: $p1.title. $article.format('$content\n'). Насколько я понял из документации, в моем случае, после заголовка $p1.title выводится массив данных $article состоящих из данных $content ( то что парсится через xpath //div[@id="article-content"]/p ), но такая конструкция почему то не работает.

    Может кто нибудь помочь?
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.377
    Симпатии:
    2.107
    Здравствуйте.
    Вот это почти правильно, только перед article нужно еще p1 дописать, т.к. вы задаете шаблон результата в Общем формате результата. Таким образом, правильный шаблон будет выглядеть так:
    $p1.title $p1.article.format('$content\n')
     
    miranon нравится это.
  3. miranon

    miranon A-Parser Pro License
    A-Parser Pro

    Регистрация:
    6 июн 2012
    Сообщения:
    28
    Симпатии:
    7
    Спасибо, заработало.

    А как добавить после заголовка точку? Такие конструкции не работают почему то:
    $p1.title. $p1.article.format('$content\n')
    $p1.title.format('$title.') $p1.article.format('$content')
    $p1.title('.') $p1.article.format('$content')

    И еще вопрос: если страница выдает капчку и в заголовке (h1) стоит: There is an excessive amount of traffic coming from your Region, можно поставить фильтр что бы в этом случае не парсились результаты и делалась следущая попытка через другой прокси?
    Так будет правильно?
    [​IMG]
     
  4. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.377
    Симпатии:
    2.107
    ${p1.title}. $p1.article.format('$content\n')
    Об этом рассказано здесь: http://a-parser.com/wiki/result-format/#Формат-имени-файла-результатов

    В этом случае нужно использовать опцию Check content: http://a-parser.com/wiki/net-http/#Возможности
     
    miranon нравится это.

Поделиться этой страницей