Rank::Curlie - kiểm tra sự hiện diện của trang web trong danh mục Curlie (tương tự DMOZ)

Tổng quan về công cụ cào dữ liệu
Curlie là danh mục lớn nhất và toàn diện nhất trên mạng được biên tập bởi con người. Nó được xây dựng và duy trì bởi một cộng đồng đông đảo các biên tập viên tình nguyện từ khắp nơi trên thế giới. Trước đây được biết đến với tên gọi DMOZ và Dự án Danh mục Mở (ODP).
Việc lưu trữ kết quả có thể thực hiện theo bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ máy lập mẫu mạnh mẽ tích hợp Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Dữ liệu thu thập được
Dữ liệu được thu thập từ dịch vụ curlie.org
- Sự hiện diện của trang web trong danh mục Curlie (tương tự DMOZ)
Ứng dụng
- Kiểm tra sự hiện diện của trang web trong danh mục curlie.org
Truy vấn
Trong các truy vấn, bạn cần chỉ định danh sách các tên miền, ví dụ:
bing.com
learn.javascript.ru
trello.com
ellistalks.com
megastom.ru
Các ví dụ về định dạng kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ máy lập mẫu tích hợp Template Toolkit, cho phép nó xuất kết quả dưới dạng tùy ý, cũng như dưới dạng cấu trúc như CSV hoặc JSON
Đầu ra mặc định
Định dạng kết quả:
$query: $exists\n
Kết quả hiển thị tên miền và sự hiện diện (1) hoặc vắng mặt (0) của nó trong danh mục curlie.org:
bing.com: 1
trello.com: 1
megastom.ru: 0
ellistalks.com: 1
learn.javascript.ru: 1
Xuất ra bảng CSV
Định dạng kết quả:
[% tools.CSVline(query, exists) %]
Ví dụ kết quả:
"trello.com",1
"bing.com",1
"ellistalks.com",1
"learn.javascript.ru",1
"megastom.ru",0