1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

А-Парсер и Пандора!

Тема в разделе "Трёп", создана пользователем Topper, 23 апр 2015.

Статус темы:
Закрыта.
  1. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    работает макрос, хз, мож с регулярками что то не так у тебя.
     
  2. dslash

    dslash A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    2 ноя 2015
    Сообщения:
    34
    Симпатии:
    3
    не, ребят. Все парсит кроме Тайтлов. Регулярки я поотключал все. Что могло слететь?
     
  3. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Переустанови темплейт из окна программы
     
  4. HoneyMoney

    HoneyMoney A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    28 мар 2016
    Сообщения:
    17
    Симпатии:
    2
    Как уникализировать вставку картинок и видео на страницу, чтобы они не повторялись на 1 странице?
     
    Антон нравится это.
  5. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    @Topper предложение по улучшению логики работы.
    Если есть возможность оптимизируй отправку заданий при пакетной генерации, к примеру спарсилась текстовка для первого дора, тут же отправляем парсится задание для второго дора и только потом начинаем скачивать запаковывать/распаковывать текстовку, потому что в некоторых случаях скачка/закачка и запаковка/распаковка длится по 20минут и больше, за это время апарсер уже спарсил бы какую то часть нового задания. Экономия времени очень заметная получится.
     
    sergeda нравится это.
  6. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Еще долго текст чистит, за это время 3 задания успеют отпарситься ;)
     
  7. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    ну так пусть парсятся, линкапарсер может запомнить 5-10 имен заданий. обработал первое, начал скачивать второе.
    Я думаю параллельно две задачи(обработка готового текста и заливка новых заданий) это не такая уж и сложная задача для такого кодера ка Топпер.
     
    sergeda и kashim нравится это.
  8. Ephraimus

    Ephraimus A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 авг 2013
    Сообщения:
    13
    Симпатии:
    3
    А у кого-нибудь возникала ошибка при генерации:

    8d205b63.2.21.Single website generation.Prepare started.Preprocessing..Static vars set.Template 'WP-education-hub' loaded.Categories loaded.Categories ready.Keys read_START.Themed-cats:No.Key loaded.Keys mixed.Keys take limited.Keys:998.Keys arrays created. Posts calculated.Making map.Maps ready.Generation started.Static vars set.Output folder emptied.Text loading..Algo#2. LO:Algo#2.
    ArgumentException:

    Text files are not found in selected subdir:false
     
  9. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Похоже ошибка говорит что текстовые файлы не найдены в выбранной дирректории
     
  10. sergeda

    sergeda A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2013
    Сообщения:
    193
    Симпатии:
    23
    @Topper Еще предложение добавить в Linkaparser опцию удалять результирующие файлы текстовки меньше определенного объема. Пусть лучше останется меньше файлов но с нормальным объемом текстовки чем куча файлов по 20-40 байт с текстом из 10 слов
     
  11. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    Тут дело в том что за счет кучи маленьких файлов очень медленно все сохраняется и чистится =(
    @Topper давай как нибудь ускорим софт, пусть по одному запросу в один файл все складывается, а не в 10 разных, или еще какие то варианты может можно сделать.
     
    Alex и Force68 нравится это.
  12. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Действительно, зачем на 1 запрос генерить кучу файлов, я не понимаю этого решения.
     
    btr нравится это.
  13. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Присоединяюсь, чистка и сохранение файлов отнимает львиную долю времени в процессе, мне тоже кажется что как то логичние было бы вообще сохранять чищенное по типу 1кей- 1 файл, да и вообще иметь возможность получить нужное количество строк - к примеру мне надо 25 строк чищенного текста на страницу - сохранили его и всё, переходим к следующему кею.
     
    btr нравится это.
  14. Topper

    Topper Active Member

    Регистрация:
    15 апр 2015
    Сообщения:
    112
    Симпатии:
    172
    Хорошо, давайте сделаем как вам кажется правильней.
    Плюсы: действительно не будет много файлов, можно будет не папки на ключ юзать, а файл на ключ. И в нем все.
    Минус: макрос APARTICLE перестанет работать , так как щас каждый файл - это каждый отдельный сайт - отдельная статья
     
  15. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    Как вариант сделать переключающиеся режимы, и допустим для APARTICLE сделать отдельную папку, если нужны статьи целиком то пожалуйста, нужны тексты кучей, включай другой режим.
     
    HoneyMoney нравится это.
  16. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Оптимальный вариант. И переключения не нужны - пандора видит макрос APARTICLE и идет за статьей в соответствующую папку
     
    HoneyMoney нравится это.
  17. Topper

    Topper Active Member

    Регистрация:
    15 апр 2015
    Сообщения:
    112
    Симпатии:
    172
    Переключающиеся режимы - лишний гемор для меня и пользователей. Опять же куча файлов никуда не денется.
    Давайте просто выпилим APARTICLE макрос, он вообще кому-то нужен?

    Кстати если все переделывать то на этот раз без миграции, только с нуля все парсить по новому раскладу.
    Я в прошлый раз миграций наелся на годы вперед.

    Да, это есть в планах
     
    #257 Topper, 20 апр 2016
    Последнее редактирование: 20 апр 2016
  18. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    да миграция и не нужна как по мне.
     
  19. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Topper, ну я незнаю за остальных товарищей, но лично я макрос APARTICLE так и непользую вообще, а что касаемо миграций - имхо вообще удаляю спаршенное после каждой пакетки, диск нерезиновый, невижу смысла создавать коллекцию из текстовки, легче свежего при необходимости спарсить.
     
  20. Topper

    Topper Active Member

    Регистрация:
    15 апр 2015
    Сообщения:
    112
    Симпатии:
    172
    Щас я рассылку по всем emailам сделаю кто у меня LAP покупал.
     
Статус темы:
Закрыта.

Поделиться этой страницей