Парсинг ссылок с sitemap.xml и meta keywords со всех ссылок

Force68 · 10 ноя 2014

Подскажите пожалуйста, как с помощью LinkExtractor спарсить все ссылки с карты сайта sitemap.xml, и как можно затем с полученных страниц спарсить данные из поля <meta name="keywords" content="">

Forbidden · 10 ноя 2014

Force68 сказал(а): ↑

Подскажите пожалуйста, как с помощью LinkExtractor спарсить все ссылки с карты сайта sitemap.xml
Нажмите, чтобы раскрыть...

Force68 сказал(а): ↑

и как можно затем с полученных страниц спарсить данные из поля <meta name="keywords" content="">
Нажмите, чтобы раскрыть...

Force68 · 10 ноя 2014

Forbidden, спасибо большое, то что надо.

Max · 19 янв 2015

Добрый день, чтобы не создавать лишних тем, напишу здесь.
Похожая ситуация, нужно спарсить текст ТОЛЬКО! из блоков <p>...</p>, запрос такой: http://www.liveinternet.ru/q/?q=скачать полную версию winamp
пробовал так:

парсит все блоки подряд где есть закрывающий тег </p>, а мне нужно только эти: (ну, 10 шт. с 1-й стр.)

Подскажите пож. какие регулярки использовать, самому не осилить)))
Спасибо.

LmPopo · 19 янв 2015

Max · 19 янв 2015

LmPopo спасиб большое! получается, вот терь бьюсь как от тегов все очищать..
что то, ни RegexMatch ни RegexReplace не помогают, может кто знает как почистить сразу результаты?
Спасибо.

LmPopo · 19 янв 2015

Max сказал(а): ↑

вот терь бьюсь как от тегов все очищать..
Нажмите, чтобы раскрыть...

Results Builder - Remove HTML tags
Там же не повредит добавить Decode HTML entities

Александр Майстренко · 5 май 2020

Подскажите, пожалуйста, если карта сайта в формате sitemap.xml.gz и в нее еще вложены карты в таком же формате. Как получить все УРЛ?

Парсинг ссылок с sitemap.xml и meta keywords со всех ссылок

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License
A-Parser Enterprise

Max A-Parser Pro License
A-Parser Pro

LmPopo A-Parser Pro License
A-Parser Pro

Max A-Parser Pro License
A-Parser Pro

LmPopo A-Parser Pro License
A-Parser Pro

Александр Майстренко A-Parser Enterprise License
A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Парсинг ссылок с sitemap.xml и meta keywords со всех ссылок

Force68 A-Parser Enterprise License A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License A-Parser Enterprise

Max A-Parser Pro License A-Parser Pro

LmPopo A-Parser Pro License A-Parser Pro

Max A-Parser Pro License A-Parser Pro

LmPopo A-Parser Pro License A-Parser Pro

Александр Майстренко A-Parser Enterprise License A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License
A-Parser Enterprise

Max A-Parser Pro License
A-Parser Pro

LmPopo A-Parser Pro License
A-Parser Pro

Max A-Parser Pro License
A-Parser Pro

LmPopo A-Parser Pro License
A-Parser Pro

Александр Майстренко A-Parser Enterprise License
A-Parser Enterprise