А-Парсер и Пандора!

  • Автор темы Автор темы Topper
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
а я все генерю и генерю, обновится даже некогда =(
Судя по скрину тоже норм.
 
такая проблема при парсинге титлов
1. вместо титла парситься "ой" "404 Not Found" (желательно чтобы такие титлы не сохранялись )
2. в титле ставится макрос [host] и если дор в папке, то выглядит глупо... нужно сделать чтобы в титле был макросс [site] тогда дор в папке будет выглядеть отлично.
вот сейчас так
Англо-русский словарь на http://domen.ru/papka
а будет с макросом [site] вот так
Англо-русский словарь на domen.ru
 
я регуляркой просто вырезаю англ. символы в ру тайтлах, хотя конешно не во всех тематиках такое прокатит.
 
Пацаны, сил никаких нет уже, гугл парсится очень медленно, подскажите где прокси нормальные взять, желательно незадорого, денег лишних вообще нет.
И кому не сложно киньте ключи по ру довнлоаду в лс хотя бы лям..
Не знаю много прошу или нормально все)
 
У меня проблема какая то, база есть, контент есть. Но почему то когда я генерю с локального, то у меня 900 страниц из 6000 генерит. Когда паршу не с локального, парсит очень долго, генерит 6000 страниц, но потом с локалки снова не хочет генерить все. ХЗ баг какой то. Он как будто все удалять стал после генерации, это мне не нравится.
 
Я понял в чем проблема, у меня почему то тайтлы вообще не сохраняет, из за этого и не генерит. Что с тайтлами может быть не так?
 
Какой из пресетов отвечает за тайтлы и их сохранение? Мы с сапортом а-парсера тоже разобраться не можем.

krD89EOu0V99nr.jpg
 
Какой из пресетов отвечает за тайтлы и их сохранение? Мы с сапортом а-парсера тоже разобраться не можем
"Текст".
Может в LinkAParser.titleregex слишком сильную регулярку добавил, которая вычищает все? Или в самом пресете.
 
"Текст".
Может в LinkAParser.titleregex слишком сильную регулярку добавил, которая вычищает все? Или в самом пресете.
Нет, в titleregex все выключено, а пресет дефолтный, его я вообще не менял...
Есть еще одна странность в строке "Результаты" это название de_casino_text.txt так и дожно быть? Я просто вообще далек от этой ниши, врядтли это я писал.
 
Ну в общем у меня все работает, кроме тайтлов. Пока заменил на Ключ, но тайтл был бы лучше.
 
Тоже с титлами проблема (EN), и тоже думал что не сохраняет фаилы. Пресеты не трогал все дефолтные .
И еще с локального компа дор 1500 страниц генерит ровно 2ч этож пиз...ц :( (использую практически все макросы из LA)
 
25.05.16 15:36:31 - [SNIP] ArgumentExceptionFileStream не открывает устройства Win32, такие как логические диски и ленточные накопители. Избегайте использования "\\.\" в пути.
25.05.16 15:36:31 - Работа модуля завершена

Топпер, плиз, пофикси эту ошибку или сделай, чтобы LAP пропускал ее, т.к. она крашит всю работу, когда работает пакетка, например.
PS ключи почищены от символов
 
Ну в общем у меня все работает, кроме тайтлов.
Скорей всего выбранный пресет без тайтлов. Пресет с тайтлами выглядит в апарсере так:

upload_2016-5-26_10-36-1.png

Если отличается, то нужно переимпортировать пресет из LAP в апарсер и выбрать его в LAP чтобы именно он применялся
 
25.05.16 15:36:31 - [SNIP] ArgumentExceptionFileStream не открывает устройства Win32, такие как логические диски и ленточные накопители. Избегайте использования "\\.\" в пути.
25.05.16 15:36:31 - Работа модуля завершена
Такое бывает когда руками вносятся правки в пресет не аккуратно, то есть ломается формат сохранения.
Для решения проблемы нужен файл pandora-snippet-*.txt на анализ который остался в папке при возниковении ошибки
В почту его в сжатом виде закинь
 
Скорей всего выбранный пресет без тайтлов. Пресет с тайтлами выглядит в апарсере так:

Посмотреть вложение 309

Если отличается, то нужно переимпортировать пресет из LAP в апарсер и выбрать его в LAP чтобы именно он применялся
Да... Действительно пресет был не такой, поменял на тот, что с тайтлами. Завтра проверю изменилось ли... Спасибо.

Вопрос к пользователям, можно, что нибудь сделать, что бы комментарии не парсились? Или как нить вычистить? Сча пример грузану.

E2pVkwdSBk4MWr.jpg


А можно было бы сочинить макрос парсящий комментрарии отдельно, вот это вообще была бы бомба. )) Но самое важное, что бы в текст не замешивались. )
 
@Topper как то писал предложение, но оно затерялось среди месаг.
Есть потребность в дополнительных пасерах и макросах для них соответственно.
Может есть возможность добавить 1-3 макроса настраиваемые, на подобии [APTITLE].
Допустим сделать макрос [APMACROS-1] ставим его в шаблоне, в линкапарсере есть поле дополнительное с такими же настройками как парсинг картинок или текстов/видео и соответственно он будет парсить какую либо другую информацию настроенную в пресете апарсера, и выводить эту информацию в шаблоне там где мы поставили данный макрос.
Как то запутанно обьяснил, если не понятно попробую по другому описать. =)
 
Предлагаю добавить в окно lap обновляемую сводку о том, для скольки ключей спарсился текст, сниппеты и т.д. и для скольки ещё осталось.
 
Может есть возможность добавить 1-3 макроса настраиваемые, на подобии [APTITLE].
Темнишь, парниша. )) Выкладывай, что там парсить еще нужно?
Предлагаю добавить в окно lap обновляемую сводку о том, для скольки ключей спарсился текст, сниппеты и т.д. и для скольки ещё осталось.
Да, нужна вещь, сделаем
 
Статус
Закрыто для дальнейших ответов.
Назад
Верх