Возникла необходимость в парсинге подсказок. Но при задаче парсеру изначальных кеев - парсится много мусора, что занимает много времени. Пробую разные варианты, но всё равно получается немного не то. Нужен пресет, который мог бы выпарсить максимальное кол-во ключей. Так, что кому не жалко, можете поделиться пресетом. Или посоветовать, как правильнее настроить парсер.
Спасибо, но вообще фигня какая-то выходит. Этот пресет, наверное для старых версий. Вот, что в результатах выводится "parser1({preset})parser1({preset})parser1({preset}) и т.д." Ну да ладно. Может подскажите, как сделать так чтобы одновременно в одном задании: 1. К файлу с запросами подставлялся пробел к концу ключа (я заметил, что так больше подсказок находит вручную) и парсилось к примеру до 4-го уровня. 2. К файлу с запросами подставлялся {az:а:я} и парсилось к примеру до 2-го уровня. 3. Чтобы в результаты не попадали строки вида к примеру "скачать торрент нр - скачать торрент нр:", чтобы если не нашло подсказку просто оставалась строка "скачать торрент"
В одном задании этого не получится сделать. Может использовать такой формат результата: $results.format('$suggest\n')
В одном задании этого не получится сделать из-за разных parse to level? Может тогда подскажите, как можно продуктивнее парсить подсказки. В общем я использую такой пресет: И еще вопрос. Можно указывать стоп-слова, чтобы подсказка со стоп-словом не заносилась в результат?
А вообще в принципе правильный пресет составлен для МАКСИМАЛЬНОГО парса подсказок? Или можно (нужно) что-то добавить?
Скорее всего да, но наверняка убедится в том, какой пресет будет давать самый максимальный результат, можно только сравнив результаты на паре-другой запросов.
В обычном пресете файл в фильтр никак нельзя подставить. Только перечень слов в виде регулярного выражения, как показано выше. Но данную задачу можно решить с помощью JS парсеров. Пример такого решения, только для страниц, есть здесь: https://a-parser.com/resources/270/ По аналогии можно сделать и для подсказок.