Есть база сайтов на WP. Прогоняю её на поиск нужных параметров в коде и в процессе возникает потребность в поиске новых значений в коде, соответственно новый парсинг занимает значительное время.
Возможно ли как то упростить это.
Пример сайта: _https://ru.wordpress.org
Задача:
1. Заходим на сайт и парсим все ссылки по N-уровню вложенности.
2. Парсим все ссылки из п.1
3. Ходим по этим ссылкам и собираем значения:
а) <meta name="generator" content="WordPress 5.4-alpha-47202" /> -> 5.4-alpha-47202
соответственно нужна версия WP. Если мета тега generator нет, то ставим значение Unknown и сохраняем в соответствующий файл.
б) Смотрим внутренние ссылки (полученные в п.2) на наличие названий используемых плагинов:
Например по ссылке : м видим наличие плагинов:
https://ru.wordpress.org/support/wp...mplates/default/css/bbpress.min.css?ver=2.6.4 -> bbpress
https://ru.wordpress.org/support/wp...css/helphub-contributors-public.css?ver=1.0.0 -> support-helphub
Сохраняем этот сайт в файл с названием соответсвующего плагина.
Один и тот же сайт может быть сохранён в нескольких файлах, по значению generator и названиям плагинов.
Поможете разобрать процесс или в платную поддержку?
Возможно ли как то упростить это.
Пример сайта: _https://ru.wordpress.org
Задача:
1. Заходим на сайт и парсим все ссылки по N-уровню вложенности.
2. Парсим все ссылки из п.1
3. Ходим по этим ссылкам и собираем значения:
а) <meta name="generator" content="WordPress 5.4-alpha-47202" /> -> 5.4-alpha-47202
соответственно нужна версия WP. Если мета тега generator нет, то ставим значение Unknown и сохраняем в соответствующий файл.
б) Смотрим внутренние ссылки (полученные в п.2) на наличие названий используемых плагинов:
Например по ссылке : м видим наличие плагинов:
https://ru.wordpress.org/support/wp...mplates/default/css/bbpress.min.css?ver=2.6.4 -> bbpress
https://ru.wordpress.org/support/wp...css/helphub-contributors-public.css?ver=1.0.0 -> support-helphub
Сохраняем этот сайт в файл с названием соответсвующего плагина.
Один и тот же сайт может быть сохранён в нескольких файлах, по значению generator и названиям плагинов.
Поможете разобрать процесс или в платную поддержку?