Подскажите пожалуйста, как с помощью LinkExtractor спарсить все ссылки с карты сайта sitemap.xml, и как можно затем с полученных страниц спарсить данные из поля <meta name="keywords" content="">
Добрый день, чтобы не создавать лишних тем, напишу здесь. Похожая ситуация, нужно спарсить текст ТОЛЬКО! из блоков <p>...</p>, запрос такой: http://www.liveinternet.ru/q/?q=скачать полную версию winamp пробовал так: Спойлер парсит все блоки подряд где есть закрывающий тег </p>, а мне нужно только эти: (ну, 10 шт. с 1-й стр.) Спойлер Подскажите пож. какие регулярки использовать, самому не осилить))) Спасибо.
LmPopo спасиб большое! получается, вот терь бьюсь как от тегов все очищать.. что то, ни RegexMatch ни RegexReplace не помогают, может кто знает как почистить сразу результаты? Спасибо.
Подскажите, пожалуйста, если карта сайта в формате sitemap.xml.gz и в нее еще вложены карты в таком же формате. Как получить все УРЛ?