Rank::Curlie - controleer de aanwezigheid van een website in de Curlie-directory (DMOZ-analoog)

Overzicht van de scraper
Curlie is de grootste en meest complete door mensen bewerkte directory op het web. Het wordt gemaakt en onderhouden door een enorme gemeenschap van vrijwillige redacteuren uit alle hoeken van de wereld. Voorheen bekend als DMOZ en het Open Directory Project (ODP).
Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.
Verzamelde gegevens
Gegevens worden verzameld van de service curlie.org
- Aanwezigheid van de site in de Curlie-directory (analoog aan DMOZ)
Toepassingen
- Controleren of een site aanwezig is in de curlie.org directory
Query's
Als query's moet een lijst met domeinen worden opgegeven, bijvoorbeeld:
bing.com
learn.javascript.ru
trello.com
ellistalks.com
megastom.ru
Opties voor resultaatweergave
A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm kunnen worden weergegeven, evenals in een gestructureerde vorm zoals CSV of JSON
Standaard uitvoer
Resultaatformaat:
$query: $exists\n
Het resultaat toont het domein en de aanwezigheid (1) of afwezigheid (0) in de curlie.org directory:
bing.com: 1
trello.com: 1
megastom.ru: 0
ellistalks.com: 1
learn.javascript.ru: 1
Uitvoer naar CSV-tabel
Resultaatformaat:
[% tools.CSVline(query, exists) %]
Voorbeeld van resultaat:
"trello.com",1
"bing.com",1
"ellistalks.com",1
"learn.javascript.ru",1
"megastom.ru",0