Перейти к основному содержимому

Cloudflare::Radar - Парсер Cloudflare Radar

Обзор парсера Cloudflare Radar

img

Парсер Cloudflare Radar позволяет быстро определить категорию сайта по доменному имени.

Сохранение результатов возможно в том виде и структуре которая вам необходима, благодаря встроенному мощному шаблонизатору Template Toolkit который позволяет применять дополнительную логику к результатам и выводить данные в различных форматах, включая JSON, SQL и CSV

Собираемые данные

  • Данные собираются с сервиса https://radar.cloudflare.com/
  • Категории сайта

Варианты использования

  • Определение к какой категориии сайтов принадлежит домен

Запросы

  • В качестве запросов необходимо указывать список доменов, например:

a-parser.com
yandex.ru
google.com
vk.com
facebook.com
youtube.com

Результаты

  • В результате отображены категории и их описание:
a-parser.com: Business, Business & Economy, 
yandex.ru: News & Media, Entertainment,
vk.com: Social Networks, Society & Lifestyle,
youtube.com: Video Streaming, Entertainment,
facebook.com: Social Networks, Society & Lifestyle,
google.com: Search Engines, Technology,

Варианты вывода результатов

A-Parser поддерживает гибкое форматирование результатов благодаря встроенному шаблонизатору Template Toolkit, что позволяет ему выводить результаты в произвольной форме, а также в структуированной, например CSV или JSON

Вывод основных данных о домене

Формат результата:

$query:\n$categories.format('$name - $desc\n')

Формат результата для CSV:

[%  FOREACH categories;    tools.CSVline(name, desc); END  %]

Пример результат:

Business,"Sites related to business."
"Business & Economy","Sites that are related to business, economy, finance, education, science and technology."
"Social Networks","Sites that facilitate interaction and networking between people."
"Society & Lifestyle","Sites related to lifestyle that are not included in other categories like fashion, food & drink etc."
"Social Networks","Sites that facilitate interaction and networking between people."
"Society & Lifestyle","Sites related to lifestyle that are not included in other categories like fashion, food & drink etc."
"Search Engines","Sites that allow users to search for content using keywords."
Technology,"Sites related to technology that are not included in the science category."
"News & Media","Sites related to news and media."
Entertainment,"Sites related to entertainment that are not includeded in other categories like Comic books, Audio streaming, Video streaming etc."

Формат результата в JSON:

Начальный текст:

[% data = {} %]

Конечный текст:

[% data.json %]

Общий формат результата:

[%  
obj = {};
obj.query = query;
obj.categories = [];
FOREACH p1.categories;
category = {};
category.name = name;
category.desc = desc;
obj.categories.push(category);
END;
data.push(obj)
%]

Пример результата:

[{"query":"yandex.ru","categories":[{"desc":"Sites related to news and media.","name":"News & Media"},{"desc":"Sites related to entertainment that are not includeded in other categories like Comic books, Audio streaming, Video streaming etc.","name":"Entertainment"}]},{"query":"google.com","categories":[{"desc":"Sites that allow users to search for content using keywords.","name":"Search Engines"},{"desc":"Sites related to technology that are not included in the science category.","name":"Technology"}]},{"query":"a-parser.com","categories":[{"desc":"Sites related to business.","name":"Business"},{"desc":"Sites that are related to business, economy, finance, education, science and technology.","name":"Business & Economy"}]}]
подсказка

Чтобы опции "Начальный текст" и "Конечный текст" были доступны в Редакторе заданий, нужно активировать "Больше опций".

Возможные настройки

Название параметраЗначение по умолчаниюОписание
Bypass CloudFlare with Chrome Max Pages10Макс. кол-во страниц при обходе CF через Chrome
Bypass CloudFlare with Chrome HeadlessЕсли опция включена, браузер не будет отображаться во время обхода CF через Chrome