С помощью HTML linkExtractor https://a-parser.com/docs/parsers/html-linkextractor
нужно проходить по ссылкам (есть список сайтов, главные страницы), как внутренним, так и внешним,
парсить до уровня 3
и сохранять ссылки в txt файл (или множество файлов) в папку results
Но сохранять только ссылки на те страницы, в тексте которых содержится одно из слов списка "слова".
Можно ли такое реализовать?
Посмотрел описание фильтрации https://a-parser.com/docs/guides/task-settings/results-filters
но там идет использование https://a-parser.com/docs/parsers/net-http
В итоге немного запутался. Помогите, как это сделать.
Спасибо.
нужно проходить по ссылкам (есть список сайтов, главные страницы), как внутренним, так и внешним,
парсить до уровня 3
и сохранять ссылки в txt файл (или множество файлов) в папку results
Но сохранять только ссылки на те страницы, в тексте которых содержится одно из слов списка "слова".
Можно ли такое реализовать?
Посмотрел описание фильтрации https://a-parser.com/docs/guides/task-settings/results-filters
но там идет использование https://a-parser.com/docs/parsers/net-http
В итоге немного запутался. Помогите, как это сделать.
Спасибо.