Всем привет! Подскажите, можно ли при помощи регулярного выражения проверить строку из входящего файла на предмет наличия одного из ключей? Если конкретней, то задача такова: Есть файл с большим количеством URL адресов. Нужно вытянуть домен верхнего уровня (такой функционал есть) Потом проверить домен на вхождение ключа и только потом, если ключ присутствует, пустить дальше это query в работу. Заранее спасибо.
Добрый день. В А-Парсере нет возможности пропускать запросы. Т.е. запрос однозначно будет выполнен и обработан, но с помощью фильтров можно просто не выводить по нему результат. Таким образом решение будет примерно такое: - Конструктором запросов получаете Top domain - парсер делает запрос - фильтром проверяется условие (вхождение ключа) и в зависимости от результата выводится результат Детальнее о фильтрах: https://a-parser.com/wiki/filter/
Здравствуйте! Задача немного видоизменилась: Нужно парсить выдачу google по определенном запросам, в моем случае "inurl:keyword". Результатом являются URL адреса по типу как keywordzzz.com/blablabla/ так и domain.com/keyword/ и т.д. Так как мне интересны результаты с ключом в самом домене, столкнулся с проблемой форматирования результата. На выходе хотелось бы получить домены верхнего уровня в нужным мне ключом в теле домена, пока что ничего не получается... Пробовал извлекать топ-домен при помощи конструктора результатов а затем фильтровать по вхождению подстроки но ничего не выходит, судя по всему правило фильтрации срабатывает еще на этапе получения URL адресов, а не уже после того как конструктор результатов делает свою работу (и, по факту, является полным дубликатом оператора inurl: который я уже использую в задаче). Буду рад любым советом, спасибо заранее.
Добрый день. Да, фильтр срабатывает до Конструктора результатов: https://a-parser.com/wiki/query-results-relation/ Для решения вашей задачи нужно извлекать домены Конструктором результатов, а фильтровать шаблонизатором: Спойлер: Код шаблона Код: [% FOREACH p1.domains; IF domain.match(query.orig); domain _ "\n"; END; END %]