Web des données

initiative du W3C visant à favoriser la publication de données structurées sur le Web

Le Web des données (linked data, en anglais) est une initiative du W3C visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations.

Il s'appuie sur les standards du Web tels que HTTP et URI. Plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines. Cela permet d'interroger automatiquement les données, quels que soient leurs lieux de stockage, et sans avoir à les dupliquer[1].

Tim Berners-Lee, directeur du W3C, a inventé et défini le terme linked data ou « données liées »[2] et son synonyme web of data au sein d'un ouvrage portant sur l'avenir du Web sémantique[3].

Principes

modifier

Tim Berners-Lee a défini quatre piliers pour soutenir l'initiative « Web des données » :

  1. utiliser des adresses URI uniques pour identifier les choses ;
  2. utiliser des adresses URI HTTP qui existent sur le Web, soit les URL. Une Erreur HTTP 404 indique simplement que l’adresse URI utilisée n’est pas documentée explicitement ;
  3. fournir à travers l’adresse URI des renseignements exploitables, lisibles par les humains et par les machines, en s’appuyant sur des formats ouverts comme RDF ou SparQL. Par exemple en utilisant le mécanisme de redirection HTTP (code 302) et la variable User-Agent contenue dans les en-têtes des requêtes HTTP, un serveur peut afficher une page en XML ou RDF pour une machine ou une page HTML pour le navigateur d'une personne ;
  4. mailler l’adresse URI initiale en lui associant des adresses URI externes, et ce, pour améliorer la découverte d'autres informations sur le Web.

Composants

modifier

Données ouvertes liées

modifier

Une donnée ouverte liée est une donnée liée en Open data.[précision nécessaire] Tim Berners-Lee donne la plus claire définition des données ouvertes liées pour les différencier du web des données.[Passage contradictoire (Les données ouvertes liées sont au fondement du web des données. Distinguer ces deux choses de la sorte n'est pas pertinent, voire contradictoire.)]

Une Donnée Ouverte est une Donnée Liée qui est publiée sous une licence ouverte, ce qui n'entrave pas sa réutilisation gratuitement.[réf. nécessaire] - Tim Berners-Lee, Données Liées

DBpedia et Wikidata sont des exemples de grands ensembles de données ouvertes liées.

Histoire

modifier

Le terme « donnée ouverte liée » est utilisé depuis lorsque la liste de diffusion Linking Open Data a été créée. La liste de diffusion a été initialement hébergée par le projet SIMILE au Massachusetts Institute of Technology.

Jeux de données

modifier

Web des données et bibliothèques

modifier

En France, le terme Web des données est de plus en plus utilisé par la communauté professionnelle de la bibliothéconomie[4].

Pour les bibliothèques, il est nécessaire de participer au Web des données afin de gagner en visibilité et de rendre ces données exploitables dans d'autres contextes. Le Web des données permet ainsi de décloisonner les données des catalogues, afin qu'elles soient plus accessibles aux usagers et ceux en devenir. Il permet entre autres de relier des données d'archives, de musées ou des biographies à des textes présents dans le catalogue offrant ainsi au chercheur une information plus complète[5].

En 2015, le programme Transition bibliographique, lancé par l’Agence bibliographique de l’enseignement supérieur et la Bibliothèque nationale de France, contribue à l'améliorer de l’exposition des données bibliographiques et d’autorités dans le Web de données en leur appliquant le modèle FRBR puis IFLA LRM et en adoptant de nouvelles règles de catalogage dérivées des RDA[6].

Notes et références

modifier
  1. (en) Bizer, Heath, Berners-Lee, « Linked Data - The Story So Far », (consulté le )
  2. OQLF terminologie : Données Liées
  3. (en) Tim Berners-Lee, « Linked Data - Design Issues », W3C, (consulté le )
  4. (en) Bibliothèque nationale de France, « Web sémantique, Web de données », BnF, (consulté le )
  5. Bibliothèque nationale de France, « BnF - Web sémantique, web de données : définitions », sur www.bnf.fr (consulté le )
  6. « Contexte et enjeux », sur transition-bibliographique.fr (consulté le )

Articles connexes

modifier

Sur les autres projets Wikimedia :

Liens externes

modifier

En 2019, deux MOOC sur le Web de données, par les enseignants Fabien Gandon, Olivier Corby et Catherine Faron Zucker, sont proposés par l'INRIA: