Здравствуйте, Сделал такой парсер: Нужно спарсить заголовок и текст статьи отсюда: http://ezinearticles.com/?The-Best-Diet-For-Weight-Loss-Combined-With-Exercise&id=9532960 и вывести в результат: заголовок. текст \n У меня не получаеться вывести такой результат. Читал документацию, но не могу разобратся как правильно сделать. Получается только заголовок. Пробовал еще так: $p1.title. $article.format('$content\n'). Насколько я понял из документации, в моем случае, после заголовка $p1.title выводится массив данных $article состоящих из данных $content ( то что парсится через xpath //div[@id="article-content"]/p ), но такая конструкция почему то не работает. Может кто нибудь помочь?
Здравствуйте. Вот это почти правильно, только перед article нужно еще p1 дописать, т.к. вы задаете шаблон результата в Общем формате результата. Таким образом, правильный шаблон будет выглядеть так: $p1.title $p1.article.format('$content\n')
Спасибо, заработало. А как добавить после заголовка точку? Такие конструкции не работают почему то: $p1.title. $p1.article.format('$content\n') $p1.title.format('$title.') $p1.article.format('$content') $p1.title('.') $p1.article.format('$content') И еще вопрос: если страница выдает капчку и в заголовке (h1) стоит: There is an excessive amount of traffic coming from your Region, можно поставить фильтр что бы в этом случае не парсились результаты и делалась следущая попытка через другой прокси? Так будет правильно?
${p1.title}. $p1.article.format('$content\n') Об этом рассказано здесь: http://a-parser.com/wiki/result-format/#Формат-имени-файла-результатов В этом случае нужно использовать опцию Check content: http://a-parser.com/wiki/net-http/#Возможности