1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2200+ и мы растем!
    Скрыть объявление

Скачать Html страницы

Тема в разделе "Техническая поддержка", создана пользователем Alekseyko, 18 янв 2016.

  1. Alekseyko

    Alekseyko A-Parser Pro License
    A-Parser Pro

    Регистрация:
    16 янв 2015
    Сообщения:
    8
    Симпатии:
    0
    Добрый вечер.

    Ребята подскажите как реализовать: Нужно скачать файлы с сайта (точнее выкачать сайт большой)

    У меня есть файл со ссылками, некоторые с расширением html, другие просто в папке/.. как реализовать скачивание файлов, чтобы каждый файл на выходе назывался точно так как и урл в ссылке

    Cылка http://ru.ru/bla_bla.html - файл получается bla_bla.html

    И возможно вообще ли вообще просто выкачать сайт да и все за раз?
     
  2. EceninPars

    EceninPars A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 янв 2013
    Сообщения:
    48
    Симпатии:
    6
    То же интересно - на данный момент со всеми новыми обновлениями апарсера есть ли возможность им скачивать html страницы или полностью выкачивать сайты ?
     
  3. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    3.752
    Симпатии:
    1.935
    Просто скачивать html страницы можно было всегда: для этого можно использовать парсер Net::HTTP Net::HTTP и выводить в результат $data
    А выкачивать полностью сайты, с сохранением перелинковки и со всеми JS/CSS файлами - значительно сложнее, и на данный момент такого решения нет.
     
  4. stive84

    stive84 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 сен 2013
    Сообщения:
    9
    Симпатии:
    4
    И большой вопрос - нужно ли вообще это решение, если есть специализированный и бесплатный HTTrack.
     
    Support нравится это.

Поделиться этой страницей