Вопрос по парсингу: title, description, keywords, h1, h2, h3, h4, h5, h6.

Веб-Пазлер

A-Parser Pro License
A-Parser Pro
Здравствуйте, не знаю как все организовать в одно задание, с выводом данных в эксель.
Может кто помочь с настройкой парсинга ( пресетом ) ?
Как это все организовать?
title, description, keywords - тут понял как настроить попробывал получилось в тесте, а как выводить все в эксель по столбцам и при этом дополнительно еще настроить парсинг заголовков h1,h2,h3,h4,h5
 
Последнее редактирование:
Получилось сделать это с помощью поддержки :) Вот присет, если нужно, пользуйтесь :)
Код:
eyJwcmVzZXQiOiJQYXJzaW5nOiBUaXRsZXMsIERlc2NyaXB0aW9uLCBLZXl3b3Jk
cywgaDEtNSIsInZhbHVlIjp7InByZXNldCI6IlBhcnNpbmc6IFRpdGxlcywgRGVz
Y3JpcHRpb24sIEtleXdvcmRzLCBoMS01IiwicGFyc2VycyI6W1siTmV0OjpIVFRQ
IiwiZGVmYXVsdCIseyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0
YSIsInJlZ2V4IjoiPHRpdGxlPihbXjw+XSopPC90aXRsZT4iLCJyZWdleFR5cGUi
OiJpcyIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0
cyI6WyJ0aXRsZSJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJk
YXRhIiwicmVnZXgiOiI8bWV0YSBuYW1lPVwiZGVzY3JpcHRpb25cIiBjb250ZW50
PVwiKC4qPylcIiAvPiIsInJlZ2V4VHlwZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZs
YXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbImRlc2MiXX0seyJ0eXBlIjoi
Y3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPG1ldGEgbmFt
ZT1cImtleXdvcmRzXCIgY29udGVudD1cIiguKj8pXCIgLz4iLCJyZWdleFR5cGUi
OiJpcyIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0
cyI6WyJrZXl3b3JkcyJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQi
OiJkYXRhIiwicmVnZXgiOiI8aDE+KFtePD5dKik8L2gxPiIsInJlZ2V4VHlwZSI6
ImlzIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRz
IjpbImgxIl19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEi
LCJyZWdleCI6IjxoMj4oW148Pl0qKTwvaDI+IiwicmVnZXhUeXBlIjoiaXMiLCJy
ZXN1bHRUeXBlIjoiZmxhdCIsImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsiaDIi
XX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4
IjoiPGgzPihbXjw+XSopPC9oMz4iLCJyZWdleFR5cGUiOiJpcyIsInJlc3VsdFR5
cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJoMyJdfSx7InR5
cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8aDQ+
KFtePD5dKik8L2g0PiIsInJlZ2V4VHlwZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZs
YXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbImg0Il19LHsidHlwZSI6ImN1
c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdleCI6IjxoNT4oW148Pl0q
KTwvaDU+IiwicmVnZXhUeXBlIjoiaXMiLCJyZXN1bHRUeXBlIjoiZmxhdCIsImFy
cmF5TmFtZSI6IiIsInJlc3VsdHMiOlsiaDUiXX1dXSwicmVzdWx0c0Zvcm1hdCI6
IlwiJHF1ZXJ5XCIsXCIkcDEudGl0bGVcIixcIiRwMS5kZXNjXCIsXCIkcDEua2V5
d29yZHNcIixcIiRwMS5oMVwiLFwiJHAxLmgyXCIsXCIkcDEuaDNcIixcIiRwMS5o
NFwiLFwiJHAxLmg1XCJcXG4iLCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3Vs
dHNGaWxlTmFtZSI6IiRkYXRlZmlsZS5mb3JtYXQoUmVzdWx0czpUaXRsZSxkZXNj
cixrZXlzLGgxLTUpLmNzdiIsImFkZGl0aW9uYWxGb3JtYXRzIjpbXSwicmVzdWx0
c1VuaXF1ZSI6Im5vIiwicXVlcnlGb3JtYXQiOlsiJHF1ZXJ5Il0sInVuaXF1ZVF1
ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVlcmllcyI6ZmFsc2UsIml0ZXJhdG9y
T3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6
eyJvdmVyd3JpdGUiOmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJO
byIsIm1vcmVPcHRpb25zIjp0cnVlLCJyZXN1bHRzUHJlcGVuZCI6IlwiXHUwNDQx
XHUwNDQxXHUwNDRiXHUwNDNiXHUwNDNhXHUwNDMwXCIsXCJcdTA0NDJcdTA0MzBc
dTA0MzlcdTA0NDJcdTA0M2JcIixcIlx1MDQzNFx1MDQzNVx1MDQ0MVx1MDQzYVx1
MDQ0MFx1MDQzOFx1MDQzZlx1MDQ0OFx1MDQzZFwiLFwiXHUwNDNhXHUwNDM1XHUw
NDM5XHUwNDMyXHUwNDNlXHUwNDQwXHUwNDM0XHUwNDQxXCIsXCJoMVwiLFwiaDJc
IixcImgzXCIsXCJoNFwiLFwiaDVcIiIsInJlc3VsdHNBcHBlbmQiOiIiLCJxdWVy
eUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwiY29uZmlnT3ZlcnJp
ZGVzIjpbXX19

Большая благодарность! :)

Некоторые страницы может и не спарсит из-за стилей на странице, но если подставить нужные стили, то все спарсит как и есть на странице.

Если результаты не сможете открыть и будут кракозявры, то вот тут можно скачать софт который открывает в csv формате http://ru.libreoffice.org/download/
 
xpath не проще т.к. будет есть гораздо больше ресурсов, но в задачах есть да
 
отлично, как раз сталкнулся с такой задачей, когда пришлось использовать сторонее приложение.
 
Привет!
взял приведенный выше пресет.
Импортировал в парсер и попробовал парсить в папке результатов файл размером ноль байт? в чем ошибка?
спасибо.
 
а задание завершилось? может у тебя задание висит и ждет прокси?
я проверил - пресет рабочий:

xzqd4.png
 
Задание уходит в завершенные. Статус completed
Неудачных запросов 1/1 100%
в результатах файл объемом ноль байт.
 
ну если запрос неудачный то очевидно и не спарсит ничего
проверяй чтобы ссылка была c http://
 
в нотпаде++ нормально открывается, а в экселе кривая кодировка. подскажите, как исправить. запросом был http://a-parser.com/

UPD. преобразовал в ANSI и в экселе нормально открылось
 
Назад
Верх