Использую Net::HTTP, версия апарсера 1.2.1498 Enterprose Сделал пресет, получаю массив ссылок без протокола и имени домена, примерно такого вида: $p1.u.format('$u1\n') "/page1.html" ... "/pageN.html" "/pageM.html" то есть все ссылки БЕЗ указания протокола и имени домена... Имею переменную httpdomain, содержащую название протокола и имя домена: $p1.httpdomain="https://mydomain" как мне эти ссылки добавить для парсинга по ним в tools.query.addAll(p1.u, 'u1', 1) ; ? Пробовал tools.query.addAll( p1.u, p1.httpdomain _ "/" _ 'u1' ) ; - НЕ РАБОТАЕТ!
Во, практически мой вопрос только наоборот, отпишуcь здесь, чтоб не создавать одинаковые темы: в одном Net::HTTP получаю URI Result format ----> $response.URI Во втором Net::HTTP хочу получить сайтмап пытаюсь сделать так: Query format ----> [% tools.query.add($p1.response.URI'sitemap.xml'); %] Формат результата ----> $p1.preset,$p2.preset Но так у меня не получается, я что-то делаю не так. В чем я не прав?
результат одного парсера, не может быть заданием для другого. нужно писать кастомный на JS/TS , если хочется в одном парсере либо, просто разделить логику - вначале выполняем один парсер, потом используем результат, для запросов второго
То есть не получится в одном пресете 1. Взять домен и проверить его URI (протокол и адрес) и уже с учетом знания URI сделать следующее - 2. Проверить есть ли на нем сабдомен 3. Проверить есть ли у него /sitemap.xml ?