И снова вопрос по уникализации

  • Автор темы Автор темы Kreola
  • Дата начала Дата начала

Kreola

Member
Приветствую!
Например у нас есть тестовый текст
url1:<test>1<test>
url2:<test>2<test>
url3:<test>1<test>
url4:<test>4<test>
Нужно сделать отсеивание по значению из <test>?</test> для последующих парсингов, при этом другие данные для отсеивания нам не нужны (они могут быть какие угодно).
Как это правильно провернуть? Использовать keep unique ? Но тогда вопрос какие данные записываются в keep unique?
 
Добрый день.
Необходимо забирать регулярным выражением значение между тегами и по нему уникализировать. А для сохранения уникализации необходимо создать базу уникализации и использовать ее в последующих запусках. Детальнее здесь: https://a-parser.com/wiki/unique/#Сохранение-уникализации-между-заданиями
 
Назад
Верх