такая проблема при парсинге титлов 1. вместо титла парситься "ой" "404 Not Found" (желательно чтобы такие титлы не сохранялись ) 2. в титле ставится макрос [host] и если дор в папке, то выглядит глупо... нужно сделать чтобы в титле был макросс [site] тогда дор в папке будет выглядеть отлично. вот сейчас так Англо-русский словарь на http://domen.ru/papka а будет с макросом [site] вот так Англо-русский словарь на domen.ru
я регуляркой просто вырезаю англ. символы в ру тайтлах, хотя конешно не во всех тематиках такое прокатит.
Пацаны, сил никаких нет уже, гугл парсится очень медленно, подскажите где прокси нормальные взять, желательно незадорого, денег лишних вообще нет. И кому не сложно киньте ключи по ру довнлоаду в лс хотя бы лям.. Не знаю много прошу или нормально все)
У меня проблема какая то, база есть, контент есть. Но почему то когда я генерю с локального, то у меня 900 страниц из 6000 генерит. Когда паршу не с локального, парсит очень долго, генерит 6000 страниц, но потом с локалки снова не хочет генерить все. ХЗ баг какой то. Он как будто все удалять стал после генерации, это мне не нравится.
Я понял в чем проблема, у меня почему то тайтлы вообще не сохраняет, из за этого и не генерит. Что с тайтлами может быть не так?
Какой из пресетов отвечает за тайтлы и их сохранение? Мы с сапортом а-парсера тоже разобраться не можем.
"Текст". Может в LinkAParser.titleregex слишком сильную регулярку добавил, которая вычищает все? Или в самом пресете.
Нет, в titleregex все выключено, а пресет дефолтный, его я вообще не менял... Есть еще одна странность в строке "Результаты" это название de_casino_text.txt так и дожно быть? Я просто вообще далек от этой ниши, врядтли это я писал.
Тоже с титлами проблема (EN), и тоже думал что не сохраняет фаилы. Пресеты не трогал все дефолтные . И еще с локального компа дор 1500 страниц генерит ровно 2ч этож пиз...ц (использую практически все макросы из LA)
25.05.16 15:36:31 - [SNIP] ArgumentExceptionFileStream не открывает устройства Win32, такие как логические диски и ленточные накопители. Избегайте использования "\\.\" в пути. 25.05.16 15:36:31 - Работа модуля завершена Топпер, плиз, пофикси эту ошибку или сделай, чтобы LAP пропускал ее, т.к. она крашит всю работу, когда работает пакетка, например. PS ключи почищены от символов
Скорей всего выбранный пресет без тайтлов. Пресет с тайтлами выглядит в апарсере так: Если отличается, то нужно переимпортировать пресет из LAP в апарсер и выбрать его в LAP чтобы именно он применялся
Такое бывает когда руками вносятся правки в пресет не аккуратно, то есть ломается формат сохранения. Для решения проблемы нужен файл pandora-snippet-*.txt на анализ который остался в папке при возниковении ошибки В почту его в сжатом виде закинь
Да... Действительно пресет был не такой, поменял на тот, что с тайтлами. Завтра проверю изменилось ли... Спасибо. Вопрос к пользователям, можно, что нибудь сделать, что бы комментарии не парсились? Или как нить вычистить? Сча пример грузану. А можно было бы сочинить макрос парсящий комментрарии отдельно, вот это вообще была бы бомба. )) Но самое важное, что бы в текст не замешивались. )
@Topper как то писал предложение, но оно затерялось среди месаг. Есть потребность в дополнительных пасерах и макросах для них соответственно. Может есть возможность добавить 1-3 макроса настраиваемые, на подобии [APTITLE]. Допустим сделать макрос [APMACROS-1] ставим его в шаблоне, в линкапарсере есть поле дополнительное с такими же настройками как парсинг картинок или текстов/видео и соответственно он будет парсить какую либо другую информацию настроенную в пресете апарсера, и выводить эту информацию в шаблоне там где мы поставили данный макрос. Как то запутанно обьяснил, если не понятно попробую по другому описать. =)
Предлагаю добавить в окно lap обновляемую сводку о том, для скольки ключей спарсился текст, сниппеты и т.д. и для скольки ещё осталось.