Passer au contenu principal

Rank::Curlie - vérification de la présence d'un site dans l'annuaire Curlie (analogue DMOZ)

img

Présentation du scraper

Curlie est le répertoire édité par des humains le plus vaste et le plus complet du Web. Il est créé et maintenu par une vaste communauté de rédacteurs bénévoles du monde entier. Anciennement connu sous le nom de DMOZ et Open Directory Project (ODP).

L'enregistrement des résultats est possible sous la forme et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'exporter les données dans divers formats, notamment JSON, SQL et CSV.

Données collectées

Les données sont collectées à partir du service curlie.org

  • Présence du site dans le répertoire Curlie (analogue de DMOZ)

Cas d'utilisation

  • Vérification de la présence d'un site dans le répertoire curlie.org

Requêtes

En tant que requêtes, vous devez indiquer une liste de domaines, par exemple :

bing.com  
learn.javascript.ru
trello.com
ellistalks.com
megastom.ru

Options d'affichage des résultats

A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous n'importe quelle forme, ainsi que sous forme structurée, par exemple CSV ou JSON

Affichage par défaut

Format du résultat :

$query: $exists\n

Le résultat affiche le domaine et sa présence (1) ou son absence (0) dans le répertoire curlie.org :

bing.com: 1
trello.com: 1
megastom.ru: 0
ellistalks.com: 1
learn.javascript.ru: 1

Affichage dans un tableau CSV

Format du résultat :

[% tools.CSVline(query, exists) %]

Exemple de résultat :

"trello.com",1
"bing.com",1
"ellistalks.com",1
"learn.javascript.ru",1
"megastom.ru",0

Paramètres possibles