Net::HTTP, помогите с форматом результата

miranon

A-Parser Pro License
A-Parser Pro
Здравствуйте,
Сделал такой парсер:
82f60ae66a34.png


Нужно спарсить заголовок и текст статьи отсюда: http://ezinearticles.com/?The-Best-Diet-For-Weight-Loss-Combined-With-Exercise&id=9532960 и вывести в результат: заголовок. текст \n

У меня не получаеться вывести такой результат. Читал документацию, но не могу разобратся как правильно сделать. Получается только заголовок.
Пробовал еще так: $p1.title. $article.format('$content\n'). Насколько я понял из документации, в моем случае, после заголовка $p1.title выводится массив данных $article состоящих из данных $content ( то что парсится через xpath //div[@id="article-content"]/p ), но такая конструкция почему то не работает.

Может кто нибудь помочь?
 
Здравствуйте.
$p1.title. $article.format('$content\n')
Вот это почти правильно, только перед article нужно еще p1 дописать, т.к. вы задаете шаблон результата в Общем формате результата. Таким образом, правильный шаблон будет выглядеть так:
$p1.title $p1.article.format('$content\n')
 
Спасибо, заработало.

А как добавить после заголовка точку? Такие конструкции не работают почему то:
$p1.title. $p1.article.format('$content\n')
$p1.title.format('$title.') $p1.article.format('$content')
$p1.title('.') $p1.article.format('$content')

И еще вопрос: если страница выдает капчку и в заголовке (h1) стоит: There is an excessive amount of traffic coming from your Region, можно поставить фильтр что бы в этом случае не парсились результаты и делалась следущая попытка через другой прокси?
Так будет правильно?
f864696dba6e.png
 
А как добавить после заголовка точку?
${p1.title}. $p1.article.format('$content\n')
Об этом рассказано здесь: http://a-parser.com/wiki/result-format/#Формат-имени-файла-результатов

И еще вопрос: если страница выдает капчку и в заголовке (h1) стоит: There is an excessive amount of traffic coming from your Region, можно поставить фильтр что бы в этом случае не парсились результаты и делалась следущая попытка через другой прокси?
В этом случае нужно использовать опцию Check content: http://a-parser.com/wiki/net-http/#Возможности
 
Назад
Верх