А-Парсер и Пандора!

  • Автор темы Автор темы Topper
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
поддерживаю идею 1 кей - 1 файл, APARTICLE и миграции лично мне не нужны
хотелось бы видеть ещё макрос выводящий сниппеты в случайном порядке
 
Я какую то такую конструкцию в дорах юзаю. APARTICLE не использую.

6aa6635211.jpg

Но последнее время чет вылетать стали. ( Так что конструкцию меняю...
Хотелось бы улучшить чекалку картинок на существование, т.к. процентов в 50 все равно вставляет битую ссылку.
 
+ за идею. APARTICLE не использую.

Есть еще пожелание сохранять только уникальные предложения и титлы, а то часто бывают повторы. И еще, например, при использовании нескольких макросов APTEXT на странице, может вывести одно и то же предложение.
 
APARTICLE использую активно. Без него теряется всякий смысл. Зачем мне огромное количество текста, когда есть конкретная статья под даный запрос? Topper, пожалуйста, низачто не удаляй APARTICLE
 
Хорошо, давайте сделаем как вам кажется правильней.
Плюсы: действительно не будет много файлов, можно будет не папки на ключ юзать, а файл на ключ. И в нем все.
Минус: макрос APARTICLE перестанет работать , так как щас каждый файл - это каждый отдельный сайт - отдельная статья
Если уже делать 1 ключ - 1 файл, то в самом файле можно расставить маркеры-разделители, по которым можно будет видеть границы всей статьи. Так можно сохранить APARTICLE и работать с одним файлом. Тайтл вроде также парсится с текстовкой
 
Предлогаю, если тебе нужен этот макрос, сохрани версию программы которую сейчас используешь, и пользуйся ею.
 
Topper, ну я незнаю за остальных товарищей, но лично я макрос APARTICLE так и непользую вообще, а что касаемо миграций - имхо вообще удаляю спаршенное после каждой пакетки, диск нерезиновый, невижу смысла создавать коллекцию из текстовки, легче свежего при необходимости спарсить.
ну ты не юзаешь и тебе не нужна коллекция - а я юзаю - и каждый раз парсить и ждать по двое трое суток пока спарсит что то смысла не вижу - в особенности когда по ключам ты уже входишь ... и получается каждый раз при каждой пакетке есть шанс себя спарсить ...
у меня активно по 10 000 пакеток создаются - по твоему мне прийдется их генерить года пол .... - это если без сохранений - если с это за 5-ть суток происходит ...
 
APARTICLE = как функционал вещь нормальная тем кому надо используют - если вам мешает ... можно в качестве компромисса сделать чекбокс - и переключаться на другую логику работы ...
 
APARTICLE, сам не юзаю
как по мне до миграции работло все как часики)
хотя и сейчас работает все отлично
нареканий нет
 
Хорошо, давайте сделаем как вам кажется правильней.
Плюсы: действительно не будет много файлов, можно будет не папки на ключ юзать, а файл на ключ. И в нем все.
Минус: макрос APARTICLE перестанет работать , так как щас каждый файл - это каждый отдельный сайт - отдельная статья
Topper, а на какой процент прирост скорости ожидается в работе ? если значительно, то заманчиво конечно.
Но всеми руками за чекбокс с режимами.
Можно и без миграции ради модернизации.
 
Я хотел выяснить есть ли пользователи у макрос APARTICLE.
Вижу теперь что есть и что он нужен. Поэтому можно перейти в вариант хранения данных в 1 файле блоками:
{ARTICLE}текст{/ARTICLE}{ARTICLE}текст2{/ARTICLE}{ARTICLE}текст3
Или проще: текст#HESOYAM#текст2#HESOYAM#текст3#HESOYAM#текст4 или типо того.

п.с. Все помнят HESOYAM из RB ? )))

В общем макрос оставим, и миграция будет.
 
Последнее редактирование:
Topper, ну я незнаю за остальных товарищей, но лично я макрос APARTICLE так и непользую вообще, а что касаемо миграций - имхо вообще удаляю спаршенное после каждой пакетки, диск нерезиновый, невижу смысла создавать коллекцию из текстовки, легче свежего при необходимости спарсить.

Я наоборот за коллекционирование статей, т.к. жесткий диск у меня огромный, а распаршивать по новой порой очень долго, пусть уж лучше своя локальная база формируется, да и прокси постоянно покупать не охото. А так с локальной базы загенерить, идеально. Ну или допарсить по ходу дела чего нужно.
 
Я крайне за APARTICLE. Агитирую только за разделение логики работы этих макросов. Миграция мне не нужна, постоянно удаляю этот текст.
 
так а что с кеями которые уже отмигрировались?
 
если формат изменится то только заного парсить.
 
та не, заново парсить это борода, у меня 2кк, кеев выпаршенно
это порядка 20 дней парсинга как минимум
перепаршивать глупо
 
смотря что парсить, ну и в любом случае текстовку когда то нужно обновлять.
 
Статус
Закрыто для дальнейших ответов.
Назад
Верх