Сделать парсинг тематики, как в дмозе, с помощью http://api.semantichacker.com/hqidfre2/category?uri=domain.com&showLabels=true в идеале - рассортировка доменов по файлам определенных тематик