SE::YouTube - полноценный парсер YouTube

18 июн 2015

  • Собираемые данные(top)


    Данные собираются с сервиса http://www.youtube.com/
    • Ссылка на видео-ролик
    • Название видео-ролика (title)
    • Описание видео-ролика
    • Имя пользователя
    • Ссылка на превью-картинку
    • Количество просмотров
    • Длина видео-ролика

    Возможности(top)


    • Максимальное количество страниц для парсинга в Youtube - 50 страниц
    • Выбор страны откуда осуществляется поиск
    • Поиск по дате добавления
    • Выбор типа результата (видео, каналы, плейлисты)
    • Выбор продолжительности видео-ролика
    • Расширенная настройка параметров поиска (субтитры, 3D, HD, прямой эфир, лицензия Creative Commons)
    • Сортировка по релевантности, дате добавления, рейтингу , количеству просмотров
    • Дополнительно парсит ссылку на превью ролика

    Варианты использования(top)


    • Поиск, сбор и анализ информации в Youtube

    Запросы(top)


    • В качестве запросов необходимо указывать поисковые фразы, например:


    Результаты(top)


    • В результате отображены ссылки на видео к данным запросам:


    Возможные настройки(top)


    ПараметрЗначение по умолчаниюОписание
    Request retries10Количество попыток на каждый запрос, если запрос не удаётся выполнить за указанное число попыток то он записывается в неудачные
    Use proxyОпределяет использовать ли прокси
    Query format$queryФормат запроса
    Result format$serp.format('$link\n')Формат вывода результата, по умолчанию выводит список ссылок по одной на строку
    Max body size204800Максимальный размер страницы выдачи в байтах, менять необходимости нет
    Proxy ban time300Время бана прокси в секундах, если прокся забанена в Ютуб то парсер не будет её использовать указанное время
    Request timeout60Максимальное время ожидания запроса в секундах
    Pages count10Количество страниц для парсинга
    Search from countryGlobalВыбор страны откуда осуществляется поиск
    Uploaded timeAll timeПоиск по дате добавления
    Search timeAll typesВыбор типа результата
    DurationAllВыбор продолжительности ролика
    Advanced settingAllРасширенная настройка параметров поиска (субтитры, 3D, HD, прямой эфир, лицензия Creative Commons)
    Sort byRelevancyСортировка по релевантности, дате добавления, рейтингу , количеству просмотров
    Use gzipОпределяет использовать ли сжатие передаваемого трафика
    Extra query string-Можно указать дополнительные параметры в строку запроса
dreker, Oopssik и ElvisStar нравится это.