1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение Парсер статей zen.yandex.ru

Тема в разделе "Задачи", создана пользователем agrx, 14 фев 2022.

Метки:
?

Нужен парсер дзен?

  1. Да

    4 голосов
    100,0%
  2. Нет

    0 голосов
    0,0%
  1. agrx

    agrx A-Parser Pro License
    A-Parser Pro

    Регистрация:
    6 сен 2021
    Сообщения:
    2
    Симпатии:
    1
    Есть некоторые каналы, которые вполне можно спарсить себе на сайт и будет очень даже бодро (траф, заработок и вот это всё).

    Как я вижу реализацию:
    • На вход подается урл канал(а|ов) типа такого https://zen.yandex.ru/knigajivotih
    • Задается количество последних статей (сверху вниз) для парсинга с каждого канала (если не указано или равно 0 например, то парсить всё)
    • Создается папка с названием канала, подпапки и txt файлы с названием статей
    • Происходит парсинг текста с разметкой для статей типа <H2>, <H3>, <strong> и прочие теги из панели редактирования статей в wordpress
    • Происходит парсинг картинок и сохранение в подпапку с названием статей (с их названием можно не заморачиваться, просто рандомизировав хэшем или типа того, если вдруг будут повторы, либо "nazvanie_stati_1.jpeg" в английском транслите с порядковым номером в конце)
    • Конец (по идее)
    Очень предварительное ТЗ я вижу так.

    upd: готовая реализация есть в зеннопостере, кнопочки, поля и всё такое можно посмотреть тут https://zennolab.com/discussion/threads/parser-statej-jandeks-dzen.87487/
    или вот такая штука https://translated.turbopages.org/p...ky-ru/Yandex-Zen-Parser/blob/master/README.md
     
    #1 agrx, 14 фев 2022
    Последнее редактирование: 14 фев 2022

Поделиться этой страницей