Как спарсить title?

BlackAlex · 23 Июл 2014

вообщем есть список урлов и с каждого нужно вытянуть содержимое между
<title></title>

смотрел и на HTML::TextExtractor и на Net::HTTP но непойму как реализовать такое?
подскажите пожалуйста!

Forbidden · 24 Июл 2014

fest1val · 18 Дек 2015

как модернизировать, что бы давать только главную страницу для старта, он обходил все страницы сайта, а результат был в виде
урл - тайтл и все остальное. только начал осваивать.

Support · 18 Дек 2015

Используйте

HTML::LinkExtractor, задавая нужную глубину.

Остальные Parse result добавляются аналогично.

fest1val · 18 Дек 2015

Вопрос, а откуда берутся данные "none"?

Support · 18 Дек 2015

Если регулярка не сработала на странице, то выводится none.

fest1val · 18 Дек 2015

Как это "не сработала" ?! Наверное из-за присутствия\отсутствия нескольких пробелов перед\после закрывающих тегов\скобок?
как же быть?
есть софт значительно примитивней для которого это не проблема.

Support · 18 Дек 2015

Если на странице точно есть нужные данные, значит регулярка составлена неправильно. Или же на странице просто отсутствуют нужные данные.

fest1val · 18 Дек 2015

а если внутри нужного тега, есть какие-то теги\стили. Как вытянуть чистые данные?
например есть itemprop="name" в h1 или в h1 есть <span> а в нем itemprop="name" , как быть в таких ситуациях?

Support · 18 Дек 2015

fest1val сказал(а):
Как вытянуть чистые данные?

Составить правильную регулярку и/или воспользоваться Remove HTML tags в Конструкторе результатов, чтобы очистить от лишних тегов.

Forbidden · 19 Дек 2015

fest1val сказал(а):
например есть itemprop="name" в h1 или в h1 есть <span> а в нем itemprop="name" , как быть в таких ситуациях?

Регулярка которая игнорирует атрибуты, флаг i:

Код:

<h1[^>]*>(.*?)</h1>

Как спарсить title?

BlackAlex

A-Parser Enterprise License

Forbidden

Administrator

fest1val

A-Parser Pro License

Support

Administrator

fest1val

A-Parser Pro License

Support

Administrator

fest1val

A-Parser Pro License

Support

Administrator

fest1val

A-Parser Pro License

Support

Administrator

Forbidden

Administrator

О нас

Быстрая навигация

Соцсети

Поддержка