Парсинг ссылок с sitemap.xml и meta keywords со всех ссылок

  • Автор темы Автор темы Force68
  • Дата начала Дата начала

Force68

A-Parser Enterprise License
A-Parser Enterprise
Подскажите пожалуйста, как с помощью LinkExtractor спарсить все ссылки с карты сайта sitemap.xml, и как можно затем с полученных страниц спарсить данные из поля <meta name="keywords" content="">
 
Подскажите пожалуйста, как с помощью LinkExtractor спарсить все ссылки с карты сайта sitemap.xml

nA3EQ.png


и как можно затем с полученных страниц спарсить данные из поля <meta name="keywords" content="">

z0sK6.png
 
Добрый день, чтобы не создавать лишних тем, напишу здесь.
Похожая ситуация, нужно спарсить текст ТОЛЬКО! из блоков <p>...</p>, запрос такой: http://www.liveinternet.ru/q/?q=скачать полную версию winamp
пробовал так:
3aJJ00M.jpg
парсит все блоки подряд где есть закрывающий тег </p>, а мне нужно только эти: (ну, 10 шт. с 1-й стр.)
3aJK3Dm.png

3aJKSUV.png
Подскажите пож. какие регулярки использовать, самому не осилить)))
Спасибо.
 
LmPopo спасиб большое! получается, вот терь бьюсь как от тегов все очищать..
что то, ни RegexMatch ни RegexReplace не помогают, может кто знает как почистить сразу результаты?
Спасибо.
 
Подскажите, пожалуйста, если карта сайта в формате sitemap.xml.gz и в нее еще вложены карты в таком же формате. Как получить все УРЛ?
 
Назад
Верх