Непонятные 'none'

  • Автор темы Автор темы LmPopo
  • Дата начала Дата начала

LmPopo

A-Parser Pro License
A-Parser Pro
Здравствуйте.
Уже всю голову сломал, откуда берутся none при записи в файл.
Тестовый пресет прилагаю
Код:
eJxtVF1v2jAU/S2zkFqkFMqqPiwvFa2GtomWrqVPCZu85AY8HNuzHQaK+O+714SE
dn3z/TzH91y7Zp67tXu04MA7Fic1M+HMYubB+Z9X1yxihlsHlsIJ+zK/n8bxHLb+
89ZbnnltMSOHglfSs6hmfmcAq/UGrBU5YFDkaFcOjNXbHdobLitMKbh0sF8sIoaI
WOwm2packHtmNPgldbZ2gyL4zs96wU5TddZnbcEz38BcY0EhJHTuCVoPvCQWvZx7
oOixUX/gt0iT8TwXXmjF5QGVLtcxeVHiD1FkSmMuHq0AN7G6DGMJDci5OzJOWC/Y
DFtUofb7oaa5ZcQcUp1wJJK/jQgPluMUZ4b4oL9mWo2lnMIGZJcW+t9WQuaoxLjA
oq9N4fsps/967NvrnUKhTH8tcmi7BOt2dt9V5Xqql8dhSFEKj7a705UisS7RuQYw
7cweKK3UFlqYpnODjstmQNFOdJKNTed6dY1Xspw4a+Z0ZTPESy6jJIjisDaIQyvV
bKGFJWxJbmv5Du3DVgVcCsTsPPkRpekgTW8+pKnF/VrUV9fR/qafvHEfa+aHxksC
06R8aMkWewTNtCrEctZs/pF7peb4xmbqTpdGAk1aVVJG9CKeuoUdu2YxyOhG9rb4
LkAggfbFIQ0t3bfnw/CMFcjqmsiWqO0patMy41K+PE1PI6xbcjRW3hsXD4d+hR8A
33G/0iVkKygGmS6HG66ElPwiq0zG13BhIRMGhowae1hqfASkThAiZh8vR58wBFvD
VQ4o8GgfJtX8KO2/U7/7r8T1Htfvt3s8ZNNkKBd9OGKHu0X9/gGkPKjc
 
'none' это пустота, т.е. в переменную которую мы хотим получить по регулярке не нашлось того что искали.
например есть страница без <title>, а мы хотим получить этот самый <title>(.*?)</title>. Тогда переменной title будет присвоено 'none'
У вас в пресете стоит выбрать строки которые больше 35 символов насколько я понял, поставьте 2 символа и будет выводить без none
А вообще их надо чистить постобработкой Result Builder
 
То есть конкретно в Results builder это нормальная логика, что если в строке по Regex Match не было найдено совпадение, то в новый массив записывается элемент 'none', а не такая строка просто отбрасывается?
 
То есть конкретно в Results builder это нормальная логика
Да, нормальная.
Используйте вместо Конструктора результатов функцию Использовать регулярку (Parse custom result) и фильтруйте получаемый результат. Тем самым вы сможете исключить все none.
wwl86_191111102116.png
 
Parse custom result не подходит, так как сначала мне нужно пройтись по Decode HTML entities и Remove HTML tags.
Ну, в result format я отсеял эти none. Просто что долго соображал, что не так с моей регуляркой
 
Назад
Верх