1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Вопрос по парсингу: title, description, keywords, h1, h2, h3, h4, h5, h6.

Тема в разделе "Техническая поддержка", создана пользователем Веб-Пазлер, 20 фев 2015.

  1. Веб-Пазлер

    Веб-Пазлер A-Parser Pro License
    A-Parser Pro

    Регистрация:
    19 дек 2014
    Сообщения:
    13
    Симпатии:
    3
    Здравствуйте, не знаю как все организовать в одно задание, с выводом данных в эксель.
    Может кто помочь с настройкой парсинга ( пресетом ) ?
    Как это все организовать?
    title, description, keywords - тут понял как настроить попробывал получилось в тесте, а как выводить все в эксель по столбцам и при этом дополнительно еще настроить парсинг заголовков h1,h2,h3,h4,h5
     
    #1 Веб-Пазлер, 20 фев 2015
    Последнее редактирование: 20 фев 2015
  2. Веб-Пазлер

    Веб-Пазлер A-Parser Pro License
    A-Parser Pro

    Регистрация:
    19 дек 2014
    Сообщения:
    13
    Симпатии:
    3
    Получилось сделать это с помощью поддержки :) Вот присет, если нужно, пользуйтесь :)
    Код:
    eyJwcmVzZXQiOiJQYXJzaW5nOiBUaXRsZXMsIERlc2NyaXB0aW9uLCBLZXl3b3Jk
    cywgaDEtNSIsInZhbHVlIjp7InByZXNldCI6IlBhcnNpbmc6IFRpdGxlcywgRGVz
    Y3JpcHRpb24sIEtleXdvcmRzLCBoMS01IiwicGFyc2VycyI6W1siTmV0OjpIVFRQ
    IiwiZGVmYXVsdCIseyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0
    YSIsInJlZ2V4IjoiPHRpdGxlPihbXjw+XSopPC90aXRsZT4iLCJyZWdleFR5cGUi
    OiJpcyIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0
    cyI6WyJ0aXRsZSJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJk
    YXRhIiwicmVnZXgiOiI8bWV0YSBuYW1lPVwiZGVzY3JpcHRpb25cIiBjb250ZW50
    PVwiKC4qPylcIiAvPiIsInJlZ2V4VHlwZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZs
    YXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbImRlc2MiXX0seyJ0eXBlIjoi
    Y3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPG1ldGEgbmFt
    ZT1cImtleXdvcmRzXCIgY29udGVudD1cIiguKj8pXCIgLz4iLCJyZWdleFR5cGUi
    OiJpcyIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0
    cyI6WyJrZXl3b3JkcyJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQi
    OiJkYXRhIiwicmVnZXgiOiI8aDE+KFtePD5dKik8L2gxPiIsInJlZ2V4VHlwZSI6
    ImlzIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRz
    IjpbImgxIl19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEi
    LCJyZWdleCI6IjxoMj4oW148Pl0qKTwvaDI+IiwicmVnZXhUeXBlIjoiaXMiLCJy
    ZXN1bHRUeXBlIjoiZmxhdCIsImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsiaDIi
    XX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4
    IjoiPGgzPihbXjw+XSopPC9oMz4iLCJyZWdleFR5cGUiOiJpcyIsInJlc3VsdFR5
    cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJoMyJdfSx7InR5
    cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8aDQ+
    KFtePD5dKik8L2g0PiIsInJlZ2V4VHlwZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZs
    YXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbImg0Il19LHsidHlwZSI6ImN1
    c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdleCI6IjxoNT4oW148Pl0q
    KTwvaDU+IiwicmVnZXhUeXBlIjoiaXMiLCJyZXN1bHRUeXBlIjoiZmxhdCIsImFy
    cmF5TmFtZSI6IiIsInJlc3VsdHMiOlsiaDUiXX1dXSwicmVzdWx0c0Zvcm1hdCI6
    IlwiJHF1ZXJ5XCIsXCIkcDEudGl0bGVcIixcIiRwMS5kZXNjXCIsXCIkcDEua2V5
    d29yZHNcIixcIiRwMS5oMVwiLFwiJHAxLmgyXCIsXCIkcDEuaDNcIixcIiRwMS5o
    NFwiLFwiJHAxLmg1XCJcXG4iLCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3Vs
    dHNGaWxlTmFtZSI6IiRkYXRlZmlsZS5mb3JtYXQoUmVzdWx0czpUaXRsZSxkZXNj
    cixrZXlzLGgxLTUpLmNzdiIsImFkZGl0aW9uYWxGb3JtYXRzIjpbXSwicmVzdWx0
    c1VuaXF1ZSI6Im5vIiwicXVlcnlGb3JtYXQiOlsiJHF1ZXJ5Il0sInVuaXF1ZVF1
    ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVlcmllcyI6ZmFsc2UsIml0ZXJhdG9y
    T3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6
    eyJvdmVyd3JpdGUiOmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJO
    byIsIm1vcmVPcHRpb25zIjp0cnVlLCJyZXN1bHRzUHJlcGVuZCI6IlwiXHUwNDQx
    XHUwNDQxXHUwNDRiXHUwNDNiXHUwNDNhXHUwNDMwXCIsXCJcdTA0NDJcdTA0MzBc
    dTA0MzlcdTA0NDJcdTA0M2JcIixcIlx1MDQzNFx1MDQzNVx1MDQ0MVx1MDQzYVx1
    MDQ0MFx1MDQzOFx1MDQzZlx1MDQ0OFx1MDQzZFwiLFwiXHUwNDNhXHUwNDM1XHUw
    NDM5XHUwNDMyXHUwNDNlXHUwNDQwXHUwNDM0XHUwNDQxXCIsXCJoMVwiLFwiaDJc
    IixcImgzXCIsXCJoNFwiLFwiaDVcIiIsInJlc3VsdHNBcHBlbmQiOiIiLCJxdWVy
    eUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwiY29uZmlnT3ZlcnJp
    ZGVzIjpbXX19
    Большая благодарность! :)

    Некоторые страницы может и не спарсит из-за стилей на странице, но если подставить нужные стили, то все спарсит как и есть на странице.

    Если результаты не сможете открыть и будут кракозявры, то вот тут можно скачать софт который открывает в csv формате http://ru.libreoffice.org/download/
     
    limoshkaa и Support нравится это.
  3. johnsmith

    johnsmith A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    13 мар 2013
    Сообщения:
    63
    Симпатии:
    31
    так а не проще добавить поддержку xpath? :)
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    xpath не проще т.к. будет есть гораздо больше ресурсов, но в задачах есть да
     
  5. johnsmith

    johnsmith A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    13 мар 2013
    Сообщения:
    63
    Симпатии:
    31
    отлично, как раз сталкнулся с такой задачей, когда пришлось использовать сторонее приложение.
     
  6. 18kotov

    18kotov A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 май 2015
    Сообщения:
    35
    Симпатии:
    5
    Привет!
    взял приведенный выше пресет.
    Импортировал в парсер и попробовал парсить в папке результатов файл размером ноль байт? в чем ошибка?
    спасибо.
     
  7. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    а задание завершилось? может у тебя задание висит и ждет прокси?
    я проверил - пресет рабочий:

    [​IMG]
     
  8. 18kotov

    18kotov A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 май 2015
    Сообщения:
    35
    Симпатии:
    5
    Задание уходит в завершенные. Статус completed
    Неудачных запросов 1/1 100%
    в результатах файл объемом ноль байт.
     
  9. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    ну если запрос неудачный то очевидно и не спарсит ничего
    проверяй чтобы ссылка была c http://
     
  10. vipdenya

    vipdenya A-Parser Pro License
    A-Parser Pro

    Регистрация:
    25 июл 2014
    Сообщения:
    57
    Симпатии:
    9
    в нотпаде++ нормально открывается, а в экселе кривая кодировка. подскажите, как исправить. запросом был http://a-parser.com/

    UPD. преобразовал в ANSI и в экселе нормально открылось
     

Поделиться этой страницей