Как спарсить title?

BlackAlex · 23 июл 2014

вообщем есть список урлов и с каждого нужно вытянуть содержимое между
<title></title>

смотрел и на HTML::TextExtractor и на Net::HTTP но непойму как реализовать такое?
подскажите пожалуйста!

Forbidden · 24 июл 2014

fest1val · 18 дек 2015

как модернизировать, что бы давать только главную страницу для старта, он обходил все страницы сайта, а результат был в виде
урл - тайтл и все остальное. только начал осваивать.

Support · 18 дек 2015

Используйте HTML::LinkExtractor, задавая нужную глубину.

Остальные Parse result добавляются аналогично.

fest1val · 18 дек 2015

Вопрос, а откуда берутся данные "none"?

Support · 18 дек 2015

Если регулярка не сработала на странице, то выводится none.

fest1val · 18 дек 2015

Как это "не сработала" ?! Наверное из-за присутствия\отсутствия нескольких пробелов перед\после закрывающих тегов\скобок?
как же быть?
есть софт значительно примитивней для которого это не проблема.

Support · 18 дек 2015

Если на странице точно есть нужные данные, значит регулярка составлена неправильно. Или же на странице просто отсутствуют нужные данные.

fest1val · 18 дек 2015

а если внутри нужного тега, есть какие-то теги\стили. Как вытянуть чистые данные?
например есть itemprop="name" в h1 или в h1 есть <span> а в нем itemprop="name" , как быть в таких ситуациях?

Support · 18 дек 2015

fest1val сказал(а): ↑

Как вытянуть чистые данные?
Нажмите, чтобы раскрыть...

Составить правильную регулярку и/или воспользоваться Remove HTML tags в Конструкторе результатов, чтобы очистить от лишних тегов.

Forbidden · 19 дек 2015

fest1val сказал(а): ↑

например есть itemprop="name" в h1 или в h1 есть <span> а в нем itemprop="name" , как быть в таких ситуациях?
Нажмите, чтобы раскрыть...

Регулярка которая игнорирует атрибуты, флаг i:
Код:
<h1[^>]*>(.*?)</h1>

Как спарсить title?

BlackAlex A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Как спарсить title?

BlackAlex A-Parser Enterprise License A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

fest1val A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

fest1val A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

fest1val A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

fest1val A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

BlackAlex A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

fest1val A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise