Pular para o conteúdo principal

Rank::Curlie - verificação de presença de site no diretório Curlie (análogo ao DMOZ)

img

Visão geral do scraper

Curlie é o maior e mais completo diretório da web editado por humanos. Ele é criado e mantido por uma vasta comunidade de editores voluntários de todos os cantos do mundo. Anteriormente conhecido como DMOZ e Open Directory Project (ODP).

A preservação dos resultados é possível no formato e estrutura que você desejar, graças ao poderoso modelo Template Toolkit integrado, que permite aplicar lógica adicional aos resultados e exportar dados em vários formatos, incluindo JSON, SQL e CSV.

Dados coletados

Os dados são coletados do serviço curlie.org

  • Presença do site no diretório Curlie (análogo ao DMOZ)

Casos de uso

  • Verificar a presença de um site no diretório curlie.org

Consultas

Como consultas, é necessário indicar uma lista de domínios, por exemplo:

bing.com  
learn.javascript.ru
trello.com
ellistalks.com
megastom.ru

Exemplos de saída de resultados

O A-Parser suporta formatação flexível de resultados graças ao modelo Template Toolkit integrado, o que permite exibir resultados em forma livre ou estruturada, como CSV ou JSON

Saída padrão

Formato do resultado:

$query: $exists\n

O resultado exibe o domínio e sua presença (1) ou ausência (0) no diretório curlie.org:

bing.com: 1
trello.com: 1
megastom.ru: 0
ellistalks.com: 1
learn.javascript.ru: 1

Saída em tabela CSV

Formato do resultado:

[% tools.CSVline(query, exists) %]

Exemplo de resultado:

"trello.com",1
"bing.com",1
"ellistalks.com",1
"learn.javascript.ru",1
"megastom.ru",0

Configurações possíveis