On me demande souvent des chiffres sur ces fameux datasets qui commencent à peupler le LOD (Linking Open Data). Voici donc quelques statistiques sur des ensembles de données disponibles :
- TaskForces CommunityProjects LinkingOpenData DataSets Statistics
- Datasets in the next LOD Cloud
- A listing of datasets published at http://data.gov and converted into RDF
- Research Pipeline’s wiki
- StatLib—Datasets Archive
- StatLib—JASA Data Archive
Voici une requête SPARQL qui permet d’interroger le data.gov américain :
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> SELECT ?g ?number_of_triples WHERE {GRAPH ?g { ?s a <http://data-gov.tw.rpi.edu/2009/data-gov-twc.rdf#Dataset> . ?s <http://data-gov.tw.rpi.edu/2009/data-gov-twc.rdf#number_of_triples> ?number_of_triples. filter ( regex( str(?g) , "Dataset") ) } } order by ?g