Aller au contenu

« Métadonnée » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Anne Bauval (discuter | contributions)
Dhatier (discuter | contributions)
m →‎Services Web : orthographe
 
(206 versions intermédiaires par plus de 100 utilisateurs sont masquées)
Ligne 1 : Ligne 1 :
{{confusion|Méthadone}}
{{voir homonyme|Métadonnée (audio)}}
[[Image:Schlagwortkatalog.jpg|vignette|Le catalogue de la bibliothèque universitaire de Graz en Autriche. La carte présentée renvoie à un texte de Schleimer qui a défini les règles de ce catalogue.]]
Une '''métadonnée''' ([[mot composé]] du [[affixe|préfixe]] [[Grec ancien|grec]] ''[[Méta (préfixe)|meta]]'', indiquant l'[[auto-référence]] ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une [[donnée]] servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).

Une '''métadonnée''' ([[mot composé]] du [[affixe|préfixe]] [[Grec ancien|grec]] ''[[Méta (préfixe)|meta]]'', indiquant l'[[Autoréférence|auto-référence]]; le mot signifie donc proprement « donnée de/à propos de donnée ») est une [[donnée (informatique)|donnée]] servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, [[Électronique numérique|électronique]] ou autre).

Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une [[Métadonnée (photographie)|photo les coordonnées géographiques]] du lieu où elle a été prise.


Les métadonnées sont à la base des techniques du [[Web sémantique]]. Elles sont définies dans le cadre du [[modèle (informatique)|modèle]] [[Resource Description Framework]] (RDF).
Les métadonnées sont à la base des techniques du [[Web sémantique]]. Elles sont définies dans le cadre du [[modèle (informatique)|modèle]] [[Resource Description Framework]] (RDF).


== Historique ==
== Historique ==
Les établissements dont la mission est la gestion de l'[[information]],comme les [[Bibliothèque|bibliothèques]], [[Archivistique|archives]] et [[Musée|musées]], ont souvent une longue pratique dans le signalement des contenus ou des documents qu'ils manipulent. Avant l'arrivée de l'[[informatique]], on utilisait des fiches cartonnées dont la structure a été normalisée en [[1954]] sous la référence ISBD ([[International standard bibliographic description]]).

Tous les établissements qui ont à gérer de l'information, [[Bibliothèque|bibliothèques]], [[Archivistique|archives]] ou [[Médiathèque|médiathèques]] ont déjà une longue pratique dans la codification du signalement ou des contenus des documents qu'ils manipulent. Avant l'arrivée de l'informatique on utilisait des fiches cartonnées dont la structure a été normalisée en [[1954]] sous la référence ISBD ([[International standard bibliographic description]]).


Ces descriptions ont ensuite été informatisées sous la forme de [[notices bibliographiques]] et normalisées (voir par exemple les [[Format MARC|formats MARC]] en [[1964]] utilisant la norme [[ISO 2709]] dont la conception a démarré en [[1960]]). Elles facilitent la gestion interne des [[ressources documentaires]] et, côté [[usager]]s, permettent d'optimiser la recherche et la localisation des documents.
Ces descriptions ont ensuite été informatisées sous la forme de [[notices bibliographiques]] et normalisées (voir par exemple les [[Format MARC|formats MARC]] en [[1964]] utilisant la norme [[ISO 2709]] dont la conception a démarré en [[1960]]). Elles facilitent la gestion interne des [[ressources documentaires]] et, côté [[usager]]s, permettent d'optimiser la recherche et la localisation des documents.


Les [[bibliothèques numériques]] ont eu recours aux mêmes dispositifs pour gérer et localiser des [[documents électroniques]]. Dans les applications distribuées, on a rapidement normalisé l'échange d'éléments de données extraits de ces notices et en [[1988]], la [[Bibliothèque du Congrès]], aux États-Unis, proposait un protocole pour la [[recherche d'information]] ([[Z39.50]]) qui fut revu en [[1992]].
Les [[bibliothèques numériques]] ont eu recours aux mêmes dispositifs pour gérer et localiser des [[documents électroniques]]. 'échange d'éléments de données extraits de ces notices en [[1988]], la [[Bibliothèque du Congrès]], aux États-Unis, un protocole pour la [[recherche d'information]] ([[Z39.50]]) qui fut revu en [[1992]].


Le terme ''métadonnée'' (en anglais : ''metadata'') est apparu dans le cadre de la description de ressources sur [[Internet]] dans les années 1990 et s'est ensuite généralisé.
Le terme ''métadonnée'' (en anglais : ''metadata'') est apparu dans le cadre de la description de ressources sur [[Internet]] dans les années 1990 et s'est ensuite généralisé.
== Généralisation ==


=== Généralisation ===
Les [[langages de balisage]] de type GML, puis [[Standard Generalized Markup Language|SGML]] et [[Hypertext Markup Language|HTML]], ont introduit une rupture dans la nature des métadonnées. Auparavant la distinction entre les fiches, les notices, d'une part, et les contenus, d'autre part, était quasiment absolue. Cette nouvelle structuration de l'information permit d'introduire des métadonnées dans les documents eux-mêmes. Les [[Communautés européennes]] adoptèrent le langage [[Standard Generalized Markup Language|SGML]] dès [[1984]].
[[Image:Web Metadata.jpg|vignette|gauche|Le [[Web sémantique]].]]
Les [[langages de balisage]] de type [[Geography Markup Language|GML]], puis [[Standard Generalized Markup Language|SGML]] et [[Hypertext Markup Language|HTML]], ont introduit une rupture dans la nature des métadonnées. Auparavant, la distinction entre les fiches, les notices d'une part et les contenus d'autre part, était quasiment absolue. Cette nouvelle structuration de l'information permit d'introduire des métadonnées dans les documents eux-mêmes. Les [[Communautés européennes]] adoptèrent le langage [[Standard Generalized Markup Language|SGML]] dès [[1984]].


La notion de métadonnées utilisables par les [[ordinateur]]s fut proposée assez tôt dans l'histoire du [[Web]], dès [[1994]], par son inventeur [[Tim Berners-Lee]], lors de la conférence WWW 94 où fut annoncée la création du [[World Wide Web Consortium|W3C]]. Les métadonnées sont en effet au cœur de l'[[architecture Web]]<ref>[http://www.w3.org/DesignIssues/Metadata.html Metadata architecture, par [[Tim Berners-Lee]]]</ref>.
La notion de métadonnées utilisables par les [[ordinateur]]s fut proposée assez tôt dans l'histoire du [[Web]], dès [[1994]], par son inventeur [[Tim Berners-Lee]], lors de la conférence WWW 94 où fut annoncée la création du [[World Wide Web Consortium|W3C]]. Les métadonnées sont en effet au cœur de l'[[architecture Web]]<ref>[http://www.w3.org/DesignIssues/Metadata.html Metadata architecture]</ref>.


En [[1995]], les métadonnées firent l'objet d'un atelier à Dublin ([[Ohio]]), pour les méthodes de [[recherche d'information]]. En parallèle, la [[bibliothèque du Congrès]] proposait une 3{{e}} version du protocole [[Z39.50]].
En [[1995]], les métadonnées firent l'objet d'un atelier à Dublin ([[Ohio]]), pour les méthodes de [[recherche d'information]]. En parallèle, la [[bibliothèque du Congrès]] proposait une {{}} du protocole [[Z39.50]].


En [[1999]], le [[World Wide Web Consortium|W3C]] définit le cadre permettant de créer un réseau de métadonnées acceptant le langage [[Extensible Markup Language|XML]] : [[Resource Description Framework]] (RDF).
En [[1999]], le [[World Wide Web Consortium|W3C]] définit le cadre permettant de créer un réseau de métadonnées acceptant le langage [[Extensible Markup Language|XML]] : [[Resource Description Framework]] (RDF).
Ligne 28 : Ligne 31 :
== Une notion qui concerne tous les organismes ==
== Une notion qui concerne tous les organismes ==
=== Description ===
=== Description ===
Les [[notices bibliographiques|notices]] contiennent des informations sur la source d'un document (titre, [[:wikt:auteur|auteur]], [[date]], sujet, [[Édition (document)|éditeur]], etc.), la nature du [[document]] ([[monographie]], [[Publication périodique|périodique]], etc.), son contenu informationnel (descripteurs, [[mot clé (sciences de l'information et des bibliothèques)|mots-clés]], résumé) et sa localisation physique (la cote).


Pour un [[document numérique]], ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de [[ressources informatiques]] contenant des images ou du son ([[CD-ROM]], [[DVD-ROM]]).
Les [[notices bibliographiques|notices]] contiennent des informations sur la source du document ([[titre]], [[:wikt:auteur|auteur]], [[date]], sujet, [[Édition (document)|éditeur]], etc.), la nature du [[document]] ([[monographie]], [[Publication périodique|périodique]], etc.), son contenu informationnel (descripteurs, [[mots-clés]], résumé) et sa localisation physique (la cote).


Les métadonnées sont, dans le cadre du [[Web sémantique]], des données signifiantes qui facilitent l'accès au contenu informationnel d'une [[ressource informatique]], une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents [[Hypertext Markup Language|HTML]] côté [[code source]] ou en tant que [[fichier (informatique)|fichier]] [[Extensible Markup Language|XML]] autonome par exemple).
Pour un [[document numérique]], ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de [[ressources informatiques]] contenant des images ou du son ([[CD-ROM]], [[DVD-ROM]]).

Les métadonnées sont, dans le cadre du [[Web sémantique]], des données signifiantes qui permettent de faciliter l'accès au contenu informationnel d'une [[ressource informatique]], une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents [[Hypertext Markup Language|HTML]] côté code source ou en tant que [[fichier (informatique)|fichier]] [[Extensible Markup Language|XML]] autonome par exemple).


Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les [[ressources documentaires]] :
Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les [[ressources documentaires]] :
* Contenu : titre, sujet, description, source, [[langue (métadonnée)|langue]], relation, [[couverture (métadonnée)|couverture]].
* Contenu : titre, sujet, description, source, [[langue (métadonnée)|langue]], relation, [[couverture (métadonnée)|couverture]].
* [[Propriété intellectuelle]] : créateur, éditeur, contributeur, [[droits (métadonnée)|droits]] (droits d'auteur, ...).
* [[Propriété intellectuelle]] : créateur, éditeur, contributeur, [[droits (métadonnée)|droits]] (droits d'auteur...).
* Matérialisation : [[date (métadonnée)|date]], type, format, [[identifiant (métadonnée)|identifiant]].
* Matérialisation : [[date (métadonnée)|date]], type, format, [[identifiant (métadonnée)|identifiant]].


Les métadonnées sont un élément essentiel de l'[[architecture Web]].
Les métadonnées sont un élément essentiel de l'[[architecture Web]].


Toutefois, limiter les métadonnées aux [[ressources numériques]] de types documents, sons et images, serait une erreur : dans les [[bases de données relationnelles]], les métadonnées incluent le nom de chaque [[table (base de données)|table]] et le type de chaque colonne dans la table.
Toutefois, limiter les métadonnées aux [[ressources numériques]] de types documents, sons et images : dans les [[bases de données relationnelles]], les métadonnées incluent le nom de chaque [[table (base de données)|table]] et le type de chaque colonne dans la table.

=== Une notion essentielle à l'[[interopérabilité]] ===


=== Une notion essentielle à l'interopérabilité ===
{{Article détaillé|Interopérabilité informatique}}
{{Article détaillé|Interopérabilité informatique}}


Les métadonnées correspondent à des [[Tag (métadonnée)|marqueurs]] que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage [[Extensible Markup Language|XML]].
Les métadonnées correspondent à des [[Tag (métadonnée)|marqueurs]] que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage [[Extensible Markup Language|XML]].


Les marqueurs ont pour effet d'améliorer l'efficacité des [[recherches d'information]] par rapport aux [[recherches plein texte]].
Les marqueurs ont pour effet d'améliorer l'efficacité des [[recherches d'information]] par rapport aux [[recherches plein texte]].


[[Resource Description Framework|RDF]] ([[Resource Description Framework]]) crée les conditions d'[[interopérabilité]], avec des réseaux de métadonnées, et l'utilisation du langage [[Extensible Markup Language|XML]].
[[Resource Description Framework|RDF]] ([[Resource Description Framework]]) crée les conditions d'[[interopérabilité]], avec des réseaux de métadonnées, et l'utilisation du langage [[Extensible Markup Language|XML]].


Les [[ressources numériques]] balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées ou transmises par des [[messagerie électronique|messageries électroniques]].
Les [[ressources numériques]] balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées ou transmises par des [[messagerie électronique|messageries électroniques]].

Ceci s'applique à tous les types de ressources numériques ([[fichier texte|texte]], son, image, [[multimédia]]).


Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec les {{lang|en|tags}}, surtout dans le [[Web 2.0]].
Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec les {{lang|en|tags}}, surtout dans le [[Web 2.0]].


Le potentiel des métadonnées est beaucoup plus important, car elles peuvent faire interopérer les [[ressources informatiques]], dans la mesure où elles ont été paramétrées et structurées dans des [[dictionnaires de données]] (ou [[registres de métadonnées]]). On peut alors faire communiquer les [[bases de données]] classiques, utilisées dans les [[progiciels de gestion intégrés]]) et les [[donnée]]s non structurées (documents, images, manipulés en [[gestion des connaissances]]…).
Le potentiel des métadonnées est beaucoup plus important, car elles peuvent faire interopérer les [[ressources informatiques]], dans la mesure où elles ont été paramétrées et structurées dans des [[dictionnaires de données]] (ou [[registres de métadonnées]]). On peut alors faire communiquer les [[bases de données]] classiques, utilisées dans les [[progiciels de gestion intégrés]]) et les [[donnée]] non structurées (documents, images, manipulés en [[gestion des connaissances]]…).


=== Un impact économique dans tous les secteurs ===
=== Tous les [[secteurs de l'économie]] peuvent être concernés ===
Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris [[conscience]], en [[Europe]], de la sensibilité de la gestion des métadonnées pour les [[processus de décision]] dans les [[entreprise]]s. Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère stratégique<ref>Robert S. Seiner, [http://tdan.com/selecting-the-right-meta-data-to-manage/5069 Selecting the “Ring” Meta Data to Manage].</ref>. L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les [[sources ouvertes]].

Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris [[conscience]], en [[Europe]], de la sensibilité de la gestion des métadonnées pour les [[processus de décision]] dans les [[entreprise]]s.

Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère stratégique<ref>Voir http://www.tdan.com/i008fe01.htm SELECTING THE « RIGHT » META DATA TO MANAGE Robert S. Seiner - TDAN.com & KIK Consulting Services</ref>.

L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les [[sources ouvertes]].


Les métadonnées concernent tous les [[secteurs de l'économie]] à travers la [[gestion de contenu]], puisque tous les organismes gèrent des [[ressources documentaires]] sous forme électronique :
Les métadonnées concernent tous les [[secteurs de l'économie]] à travers la [[gestion de contenu]], puisque tous les organismes gèrent des [[ressources documentaires]] sous forme électronique :
* [[Administration publique|Administrations]] centrales et territoriales,
* [[Administration publique|Administrations]] centrales et territoriales
* [[Entreprise]]s,
* [[Entreprise]]s
* [[Université]]s et [[grande école|grandes écoles]],
* [[Université]]s et [[grande école|grandes écoles]]
* [[Centre d'études et de recherche|Centres d'études et de recherches]],
* [[Centre d'études et de recherche|Centres d'études et de recherches]]
* [[Médiathèque]]s.
* [[Médiathèque]]s.


Dans l'[[économie du savoir]], il est important de protéger le [[patrimoine informationnel]] constitué par les [[ressources documentaires]], car les [[documents électroniques]] contiennent souvent des [[donnée]]s [[confidentielle]]s.
Dans l'[[économie du savoir]], il est important de protéger le [[patrimoine informationnel]] constitué par les [[ressources documentaires]], car les [[documents électroniques]] contiennent souvent des [[donnée]] [[confidentielle]]s.


La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du [[patrimoine informationnel]] complexe.
La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du [[patrimoine informationnel]] complexe.


== Différence de perception entre l'Amérique et l'Europe ==
== Différence de perception entre l'Amérique et l'Europe ==

Selon Robert Steele, expert américain en [[sources ouvertes]], qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la [[représentation]] avancée de [[contexte (communication)|contexte]] dans les [[modèle (informatique)|modèles]] de [[contrôle d'accès]] et les langages de [[ressources Web]] actives<ref>[http://www-staff.it.uts.edu.au/~rsteele/uac-middleware-abstract.html Communication de Robert Steele sur le rôle des métadonnées.]</ref>.
Selon Robert Steele, expert américain en [[sources ouvertes]], qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la [[représentation]] avancée de [[contexte (communication)|contexte]] dans les [[modèle (informatique)|modèles]] de [[contrôle d'accès]] et les langages de [[ressources Web]] actives<ref>[http://www-staff.it.uts.edu.au/~rsteele/uac-middleware-abstract.html Communication de Robert Steele sur le rôle des métadonnées.]</ref>.


=== En Amérique ===
=== En Amérique ===

Un certain nombre d'équipes impliquées dans la [[sémantique]] sur le [[Web]] ont organisé un atelier à Dublin ([[Ohio]]) en [[1995]] sur les métadonnées, en définissant le standard [[Dublin Core]].
Un certain nombre d'équipes impliquées dans la [[sémantique]] sur le [[Web]] ont organisé un atelier à Dublin ([[Ohio]]) en [[1995]] sur les métadonnées, en définissant le standard [[Dublin Core]].


Différents départements du gouvernement fédéral ([[DoD]], …) se sont dotés de [[registres de métadonnées]], qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de [[souveraineté]] : [[défense et sécurité|défense]], [[justice]], environnement…<ref>Le responsable du chantier DRM ({{langue|anglais|data reference model}}) du projet FEA du gouvernement fédéral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les métadonnées du Department of Homeland Security</ref>. La [[Bibliothèque du Congrès]], située à [[Washington, DC|Washington]], joue un rôle moteur dans la définition des métadonnées aux [[États-Unis]].
Différents départements du gouvernement fédéral ([[DoD]]…) se sont dotés de [[registres de métadonnées]], qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de [[souveraineté]] : [[défense et sécurité|défense]], [[justice]], environnement…<ref>Le responsable du chantier DRM ({{langue|anglais|data reference model}}) du projet FEA du gouvernement fédéral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les métadonnées du </ref>. La [[Bibliothèque du Congrès]], située à [[Washington |Washington]], joue un rôle moteur dans la définition des métadonnées aux [[États-Unis]].


Les standards de métadonnées sont l'un des trois éléments clés de la stratégie données en [[réseau centré]] ([http://www.defenselink.mil/cio-nii/docs/Net-Centric-Data-Strategy-2003-05-092.pdf Net-Centric Data Strategy]) du [[département de la défense des États-Unis]], avec les [[communautés d'intérêt]] et les services d'entreprise [[Global Information Grid|GIG]].
Les standards de métadonnées sont l'un des trois éléments clés de la stratégie données en [[réseau centré]] ([http://www.defenselink.mil/cio-nii/docs/Net-Centric-Data-Strategy-2003-05-092.pdf Net-Centric Data Strategy]) du [[département de la des États-Unis]], avec les [[communautés d'intérêt]] et les services d'entreprise [[Global Information Grid|GIG]].


Le gouvernement canadien doit se conformer au [[Dublin Core]] depuis octobre [[2001]]<ref>[http://www.tbs-sct.gc.ca/its-nit/standards/tbits39/crit391_f.asp Norme des métadonnées du Gouvernement canadien en direct]</ref>. Le gouvernement canadien a édicté des lignes directrices pour décrire les métadonnées utilisées dans les ressources Web<ref>[http://www.tbs-sct.gc.ca/im-gi/meta/meta-cdn-fra.asp Métadonnées pour décrire les métadonnées du gouvernement du Canada]</ref>.
Le gouvernement canadien doit se conformer au [[Dublin Core]] depuis octobre [[2001]]<ref>[http://www..gc.ca////. Norme des métadonnées du Gouvernement canadien en direct]</ref>. Le gouvernement canadien a édicté des lignes directrices pour décrire les métadonnées utilisées dans les ressources Web<ref>[http://www.tbs-sct.gc.ca/im-gi/meta/meta-cdn-fra.asp Métadonnées pour décrire les métadonnées du gouvernement du Canada]</ref>.
<!--Voir dans la Wikipedia anglophone :
<!--Voir dans la Wikipedia anglophone :
* [[:en:Metadata#General IT metadata|General IT metadata]],
* [[:en:Metadata#General IT metadata|General IT metadata]],
* [[:en:category:metadata|Catégorie metadata]], sur l'importance accordée aux métadonnées aux États-Unis.-->
* [[:en:category:metadata|Catégorie metadata]], sur l'importance accordée aux métadonnées aux États-Unis.-->


=== Dans l'[[Union européenne]] ===
=== Dans l'Union européenne ===

Au [[Royaume-Uni]], l'[http://www.ukoln.ac.uk/ UKOLN] (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et [[interopérabilité]]). Il développe des projets pour la [[recherche et développement]] financés par l'[[Union européenne]]. Il a une influence sur la réglementation, l'« [[awareness]] », la [[recherche et développement]], les techniques [[Web]]. Le gouvernement britannique a défini un standard de métadonnées pour le e-gouvernement ([http://www.govtalk.gov.uk/schemasstandards/metadata.asp e-GMS])
Au [[Royaume-Uni]], l'[http://www.ukoln.ac.uk/ UKOLN] (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et [[interopérabilité]]). Il développe des projets pour la [[recherche et développement]] financés par l'[[Union européenne]]. Il a une influence sur la réglementation, l'« [[awareness]] », la [[recherche et développement]], les techniques [[Web]]. Le gouvernement britannique a défini un standard de métadonnées pour le e-gouvernement ([http://www.govtalk.gov.uk/schemasstandards/metadata.asp e-GMS])


En France, par manque d'[[information]] ou de [[formation]] à ce propos, relativement peu de [[webmestre]]s intègrent des métadonnées aux [[gestion de contenu|contenus numériques]] qu'ils publient. La raison est probablement que les métadonnées n'ont pas de valeur juridique [[normative]] au niveau européen et dans les [[États membres]] (en particulier en France), puisqu'il n'y a pas d'[[Obligation (droit)|obligation]] légale ni de standard officiel. Les [[webmestre]]s introduisent au coup par coup des [[métaélément]]s (meta tags, balises meta) dans les [[Page Web|pages Web]].
En France, par manque d'[[information]] ou de [[formation]] à ce propos, relativement peu de [[webmestre]]s intègrent des métadonnées aux [[gestion de contenu|contenus numériques]] qu'ils publient. La raison est probablement que les métadonnées n'ont pas de valeur juridique [[normative]] au niveau européen et dans les [[États membres]] (en particulier en France), puisqu'il n'y a pas d'[[Obligation (droit)|obligation]] légale de . Les [[webmestre]]s introduisent au coup par coup des [[métaélément]]s (meta tags, balises meta) dans les [[Page Web|pages Web]].


Des organismes comme le [[Commissariat à l'énergie atomique]] et le [[CNES]] (membres de l'association [http://aristote1.aristote.asso.fr/Telechargement/Fiches/ARISTOTE_Presentation.pdf ARISTOTE]) emploient des métadonnées pour l'[[archivage]] à long terme, en utilisant les recommandations de l'[[OAIS]].
Des organismes comme le [[Commissariat à l'énergie atomique]] et le [[CNES]] (membres de l'association [http://aristote1.aristote.asso.fr/Telechargement/Fiches/ARISTOTE_Presentation.pdf ARISTOTE]) emploient des métadonnées pour l'[[archivage]] à long terme, en utilisant les recommandations de l'[[OAIS]].


La [http://www.cores-eu.net/interoperability/cores-resolution/cores-resolution.pdf CORES Resolution (''standards interoperability forum Resolution on Metadata Element Identifiers 12-12-2002'')] a adopté en [[2002 en informatique|2002]] les [[Identifiants de Ressource Uniformes]] (''Uniform Resource Identifiers'', [[URI]]) pour l'accès aux [[ressources Web]], en s'appuyant sur des standards de métadonnées.
CORES ( ) a adopté en [[2002 en informatique|2002]] les [[ ]] (''Uniform Resource Identifiers'', URI) pour l'accès aux [[ressources Web]], en s'appuyant sur des standards de métadonnées.


« Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards {{Référence souhaitée}} ».
Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards{{Référence souhaitée}}


Ce groupe de projet a travaillé pour la [[Commission européenne]].
Ce groupe de projet a travaillé pour la [[Commission européenne]].
* GILS : Government Information Locater Service (États-Unis)
Il est composé de personnes appartenant à :
* MARC21 : standards de la [[bibliothèque du Congrès]] américain (États-Unis)
* IEEE/LOM : [[Learning Object Metadata]] (États-Unis)
* DCMI : [[Dublin Core]] Metadata Initiative (États-Unis)
* DOI Foundation : [[Digital Object Identifier]]
* ONIX : ONIX for books, diffusion de livres
* CERIF : Common European Research Informade0031.htm Metadata/Taxonomy
* la [[National Aeronautics and Space Administration|NASA]] : NASA taxonomy - Metadata<ref>{{lien web |titre=NASA Taxonomy 2.0 |url=https://archive.wikiwix.com/cache/20110224020831/http://nasataxonomy.jpl.nasa.gov/metadata.htm |site=nasa.gov via [[Wikiwix]] |consulté le=06-11-2023}}.</ref>.


Les classifications étant structurées, il est plus aisé de gérer la [[traçabilité]], d'agréger les [[donnée (informatique)|données]], et de protéger le [[patrimoine informationnel]].
* GILS : Government Information Locater Service (USA)
* MARC21 : standards de la [[bibliothèque du Congrès]] américain (USA)
* IEEE/LOM : [[Learning Object Metadata]] (USA)
* DCMI : [[Dublin Core]] Metadata Initiative (USA)
* DOI Foundation : [[Digital Object Identifier]]
* ONIX : ONIX for books, diffusion de livres
* CERIF : Common European Research Informade0031.htm Metadata/Taxonomy]
* la NASA :
[http://nasataxonomy.jpl.nasa.gov/metadata.htm NASA taxonomy - Metadata].

Les classifications étant structurées, il est plus aisé de gérer la [[traçabilité]], d'agréger les [[donnée]]s, et de protéger le [[patrimoine informationnel]].


Les métadonnées sont ainsi un élément essentiel du chantier de [[gestion de contenu]] en [[ingénierie des connaissances]].
Les métadonnées sont ainsi un élément essentiel du chantier de [[gestion de contenu]] en [[ingénierie des connaissances]].


=== Métadonnées et traçabilité : [[gestion de la preuve]] ===
=== Métadonnées et traçabilité : [[gestion de la preuve]] ===
La [[gestion des documents d'archives]] doit pouvoir s'appuyer sur des données cohérentes le long du [[cycle de vie (document)|cycle de vie]] des [[donnée (informatique)|données]]. Il existe donc des [[norme]]s de [[gestion des documents d'archives]] ([[ISO 15489]]), et une norme particulière sur les métadonnées (ISO 23081).


=== Métadonnées et agrégation des données : gouvernance ===
La [[gestion des documents d'archives]] doit pouvoir s'appuyer sur des données cohérentes le long du [[cycle de vie]] des [[donnée]]s. Il existe donc des [[norme]]s de [[gestion des documents d'archives]] ([[ISO 15489]]), et une norme particulière sur les métadonnées (ISO).
Dans le domaine de la [[gouvernance]] en général ([[gouvernement]], [[Administration publique|administrations]], [[gouvernance d'entreprise|entreprises]]), les métadonnées [[stockée]]s dans des [[métadictionnaire]]s (ou ''repository'' ; [[référentiel (systèmes d'information)|référentiel]]s) sont utilisées comme « données sur les données », ou données de référence.

=== Métadonnées et agrégation des données : [[gouvernance]] ===

Dans le domaine de la '''[[gouvernance]]''' en général ('''[[gouvernement]], [[Administration publique|administrations]], [[gouvernance d'entreprise|entreprises]]'''), les métadonnées [[stockée]]s dans des [[métadictionnaire]]s (ou ''repository'' ; [[référentiel]]s) sont utilisées comme « données sur les données », ou données de référence.


Les métadonnées permettent de décrire les [[donnée]]s utilisées dans les analyses et prises de [[décision]]s :
Les métadonnées permettent de décrire les [[donnée]] utilisées dans les analyses et prises de [[décision]]s :
* la définition exacte des [[donnée]]s ([[sémantique]])
* la définition exacte des [[donnée]] ([[sémantique]])
* la source des données ([[date]], origine)
* la source des données ([[date]], origine)
* la façon dont elles sont calculées, agrégées, ... (règles de calcul)
* la façon dont elles sont calculées, agrégées... (règles de calcul)
* les [[règles métier]] qui s'y rapportent
* les [[règles métier]] qui s'y rapportent
* le processus d'extraction, transformation et chargement qui a été mis en œuvre (voir [[Extract Transform Load|ETL]] et [[Intégration d'applications d'entreprise]]).
* le processus d'extraction, transformation et chargement qui a été mis en œuvre (voir [[Extract Transform Load|ETL]] et [[Intégration d'applications d'entreprise]]).
Ligne 147 : Ligne 133 :


== Cadre de référence ==
== Cadre de référence ==
Des travaux internationaux convergent pour utiliser « intelligemment » avec le Web les métadonnées avec des [[Moteur de recherche|moteurs de recherche]] en décrivant les [[ressources numériques]] ou physiques et en établissant des relations avec d'autres ressources.


=== Mise en œuvre d'un registre de métadonnées ===
Des travaux internationaux convergent pour utiliser « intelligemment » avec le Web les métadonnées avec des [[moteurs de recherche]] en décrivant les [[ressources numériques]] ou physiques et en établissant des relations avec d'autres ressources.

=== Mise en œuvre d'un [[registre de métadonnées]] ===

{{Article détaillé|Registre de métadonnées}}
{{Article détaillé|Registre de métadonnées}}


Le pilotage d'organisations complexes (administrations centrales et locales, [[pôles de compétitivité]], …) nécessite d'employer des informations d'[[autorité (sciences de l'information)|autorité]], qui sont contenues dans des référentiels de métadonnées appelés [[registres de métadonnées]].
Le pilotage d'organisations complexes (administrations centrales et locales, [[pôles de compétitivité]]) nécessite d'employer des informations d'[[autorité (sciences de l'information)|autorité]], qui sont contenues dans des référentiels de métadonnées appelés [[registres de métadonnées]].


Un registre de métadonnées est un « Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la [[sémantique]] et la structure de chaque [[élément (métadonnée)|élément]]. Pour chaque élément, le registre en donne la définition, les qualificatifs qui lui sont associés, ainsi que les correspondances avec des équivalents dans d'autres langues ou d'autres schémas. »
Un registre de métadonnées est un Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la [[sémantique]] et la structure de chaque [[élément (métadonnée)|élément]]. Pour chaque élément, le registre en donne la définition, les qualificatifs qui lui sont associés, ainsi que les correspondances avec des équivalents dans d'autres langues ou d'autres schémas.


La norme [[ISO/CEI 11179]], dont l'application est fortement conseillée par le gouvernement américain, inclut les recommandations pour la mise en œuvre d'un [[registre de métadonnées]]. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adéquat, l'organisation qui convient ([[architectes de données]], réseau de correspondants, ...).
La norme [[ISO/CEI 11179]], dont l'application est fortement conseillée par le gouvernement américain, inclut les recommandations pour la mise en œuvre d'un [[registre de métadonnées]]. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adéquat, l'organisation qui convient ([[architectes de données]], réseau de ).

=== Référentiels de métadonnées généraux : [[Dublin Core]] ===

{{Article détaillé|Dublin Core}}

Ce référentiel trouve son origine aux [[États-Unis]] ([[1995]]) et a été adopté par plus de huit gouvernements.

Le « [[Dublin Core]] » est la principale initiative visant à la convergence des [[éléments de métadonnées]] à utiliser.

C'est un schéma de métadonnées générique qui peut servir de base à des [[registres de métadonnées]].

Le [[Dublin Core]] pousse à une [[normalisation (industrie et service)|normalisation]] dans l'[[Union européenne]], via les [[donnée]]s employées dans les [[systèmes d'information]].
La [[Commission européenne]] emploie donc des métadonnées dans ses [[Commission européenne#Livres verts et livres blancs|livres blancs]], sur des sujets pouvant toucher à la [[souveraineté]].

Le programme IDABC de la [[Commission européenne]] (3{{e}} phase du programme IDA), concernant les services d'[[e-Gouvernement]], s'appuie largement sur les métadonnées du [[Dublin Core]]. Il a donné naissance au projet [[MIReG]], qui vise à développer un [[framework]] de métadonnées, concernant les extensions du [[Dublin Core]] aux informations [[gouvernementale]]s, qui soit basé sur les recommandations nationales sur les métadonnées des informations du [[secteur public]].

La [[directive INSPIRE]] (2007) incite les [[États membres]] et la [[Communauté européenne]] à mettre en place des organisations publiques (services de jeux de [[donnée]]s), chargées de créer et de mettre à jour les métadonnées ([[registres de métadonnées]]), au moins pour ce qui concerne les [[informations géographiques]]. Elle devrait faire évoluer le cadre législatif<ref>La directive 2003/98/CE fournit un cadre pour la réutilisation des informations du [[secteur public]]. Les conditions d'application de la directive sont fonction des [[États membres]] et des organismes de secteur public.</ref>.

Il existe un projet de traduction française de la norme internationale [[Dublin Core]] (voir [http://artist.inist.fr/article.php3?id_article=359 site Web de Artist, 16 octobre 2006]), mais aucun organisme ne semble prendre la responsabilité ou le [[leadership]].


== Métadonnées et structuration des données ==
== Métadonnées et structuration des données ==
=== Métadonnées et contenu des [[pages web]] ===
=== Métadonnées et contenu des pages web ===
Le contenu des [[pages web]] est structuré à l'aide de [[balises meta]], en langage [[Hypertext Markup Language|HTML]]. Les différentes balises employées permettent de structurer les informations selon différents thèmes (mots-clés, description, auteur, titre, sujet...).


Dans les projets de [[données ouvertes]] (''[[Données ouvertes|open data]]''), l'organisation à but non lucratif ''The Open Data Foundation'' se consacre à l'adoption de [[Norme de métadonnées|normes de métadonnées]] globales et au développement de solutions open source qui utilisent des données statistiques<ref>[http://www.opendatafoundation.org/ Site de l'organisation The Open Data Foundation]</ref>.
Le contenu des [[pages web]] est structuré à l'aide de [[balises meta]], en langage [[Hypertext Markup Language|HTML]]. Les différentes balises employées permettent de structurer les informations selon différents thèmes (mots-clés, description, auteur, titre, sujet…).

Dans les projets de [[données ouvertes]] (''open data''), l'organisation à but non lucratif ''The Open Data Foundation'' se consacre à l'adoption de normes de métadonnées globales et au développement de solutions open source qui utilisent des données statistiques<ref>[http://www.opendatafoundation.org/ Site de l'organisation The Open Data Foundation]</ref>.


=== Métadonnées et validation des documents : [[DSDL]] ===
=== Métadonnées et validation des documents : [[DSDL]] ===
Le [[langage XML]] a été conçu pour faire circuler de l'information porteuse de [[sémantique]] sur la [[World Wide Web|Toile]]. Cette circulation permet de valider progressivement les informations pour en faire de la [[connaissance]] partagée entre des [[communautés de pratique]]. Partant du [[DTD]] de [[Standard Generalized Markup Language|SGML]], l'échelle de validation des [[Document Schema Definition Languages]] (DSDL) a été mise au point afin de valider les [[documents électroniques]]. Dans le cas d'XML, l'emploi de [[xML Schema|schémas XML]] permet de faire passer les [[document XML|documents XML]] du stade [[well-formed XML document|« bien-formé »]] au stade [[Valid XML document|« valide »]].


Les outils qui participent à cette validation progressive sont les [[Moteur de recherche|moteurs de recherche]], dont l'[[optimisation pour les moteurs de recherche|optimisation]] s'appuie largement sur les [[éléments méta]] du [[langage HTML]] employé pour les [[Page Web|pages Web]], les [[Moteur de règles|moteurs de règle]], et les [[moteurs d'orchestration]].
Le [[langage XML]] a été conçu pour faire circuler de l'information porteuse de [[sémantique]] sur la [[Toile]]. Cette circulation permet de valider progressivement les informations pour en faire de la [[connaissance]] partagée entre des [[communautés de pratique]]. Partant du [[DTD]] de [[Standard Generalized Markup Language|SGML]], l'échelle de validation des [[Document Schema Definition Languages]] (DSDL) a été mise au point afin de valider les [[documents électroniques]]. Dans le cas d'XML, l'emploi de [[xML Schema|schémas XML]] permet de faire passer les [[document XML|documents XML]] du stade [[well-formed XML document|« well-formed »]] au stade [[Valid XML document|« valid »]].


Dans ce processus global, les liens (type d'[[élément link]] dans [[élément HTML|HTML]]) mettent à jour en permanence les liens entre [[pages web]] pour « optimiser » la [[connaissance]].
Les outils qui participent à cette validation progressive sont les [[moteurs de recherche]], dont l'[[optimisation des moteurs de recherche|optimisation]] s'appuie largement sur les [[éléments méta]] du [[langage HTML]] employé pour les [[Page Web|pages Web]], les [[Moteur de règles|moteurs de règle]], et les [[moteurs d'orchestration]].

Dans ce processus global, les liens (type d'[[élément link]] dans [[élément HTML|HTML]]) mettent à jour en permanence les liens entre [[pages web]] pour « optimiser » la [[connaissance]].


Par exemple, dans le [[commerce électronique]], à partir d'une organisation en [[registre de métadonnées]], l'utilisation conjointe du [[registre ebXML]] et du [[registre d'annuaires UDDI]] permet d'organiser une [[orchestration (informatique)|orchestration]] (en interne aux entreprises) et une [[Chorégraphie des Services Web WS-*|chorégraphie]] (en externe aux entreprises).
Par exemple, dans le [[commerce électronique]], à partir d'une organisation en [[registre de métadonnées]], l'utilisation conjointe du [[registre ebXML]] et du [[registre d'annuaires UDDI]] permet d'organiser une [[orchestration (informatique)|orchestration]] (en interne aux entreprises) et une [[Chorégraphie des Services Web WS-*|chorégraphie]] (en externe aux entreprises).


=== Métadonnées et classification : [[schémas de classification]] ===
=== Métadonnées et classification : [[schémas de classification]] ===
{{Article détaillé|Dublin Core}}
Les métadonnées constituent des schémas de classification qui permettent de structurer des documents. L'Income Revenue Service<ref>[http://xml.gov/presentations/irs4/taxonomy_files/slide0031.htm Metadata/Taxonomy]</ref> et le [[Dublin Core]] constituent deux exemples de [[taxonomie]]s employant des métadonnées. Le [[Dublin Core]] trouve son origine aux [[États-Unis]], en 1995 ; il a été adopté par plus de huit gouvernements à ce jour{{référence souhaitée}}. C'est la principale initiative visant la convergence des [[éléments de métadonnées]] à utiliser. C'est un schéma de métadonnées générique qui peut servir de base à des [[registres de métadonnées]].


Le [[Dublin Core]] comprend quinze propriétés de base facultatives et répétables, relatives au contenu (titre, sujet, description, source, langue, relation, couverture), à la propriété intellectuelle (créateur, contributeur, éditeur, gestion des droits) et à l'instanciation (date, type, format, identifiant de la ressource). Le Dublin Core qualifié (qualified Dublin Core) comporte trois éléments supplémentaires (audience, provenance et rightsholder) et différents qualificatifs de raffinement (permettant de préciser les éléments titre, description, date, relation et couverture) et des schémas d'encodage (permettant d'associer la valeur d'un élément à un vocabulaire et une syntaxe contrôlés).
Les métadonnées permettent de structurer des [[classification]]s. On trouve des exemples de [[taxonomie]]s employant des métadonnées :
* l'Income Revenue Service : [http://xml.gov/presentations/irs4/taxonomy_files/slide0031.htm Metadata/Taxonomy]
Le « Dublin Core » comprend 15 [[élément (métadonnée)|éléments]] de description :
* formels ([[titre]], [[:wikt:auteur|auteur]], [[Édition (document)|éditeur]]),
* intellectuels (sujet, description, [[langue]]…)
* et relatifs à la [[propriété intellectuelle]].
Chaque [[élément (métadonnée)|élément]] de description a plusieurs raffinements possibles (version qualifiée).

L'utilisation de ce référentiel doit impérativement être accompagnée d'une organisation en [[registre de métadonnées]]. Avant toute mise en œuvre de ce référentiel, il faut être conscient de son caractère sensible sur le plan de la protection du [[patrimoine informationnel]] et des contraintes organisationnelles qui y sont liées. C'est la raison pour laquelle le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme [[ISO/CEI 11179]] (partie 6 sur l'enregistrement).


Le [[Dublin Core]] pousse à une [[normalisation (industrie et service)|normalisation]] dans l'[[Union européenne]], via les [[donnée (informatique)|données]] employées dans les [[systèmes d'information]]. La [[Commission européenne]] emploie donc des métadonnées dans ses [[Commission européenne#Livres verts et livres blancs|livres blancs]], sur des sujets pouvant toucher à la [[souveraineté]]. Le programme IDABC de la Commission européenne ({{3e|phase}} du programme IDA), concernant les services d'[[e-Gouvernement]], s'appuie largement sur les métadonnées du [[Dublin Core]]. Il a donné naissance au projet [[MIReG]], qui vise à développer un [[framework]] de métadonnées, concernant les extensions du [[Dublin Core]] aux informations [[gouvernementale]]s, qui soit basé sur les recommandations nationales sur les métadonnées des informations du [[secteur public]]. La [[directive INSPIRE]] (2007) incite les [[États membres de l'Union européenne|États membres]] et la [[Communauté européenne]] à mettre en place des organisations publiques (services de [[jeu de données|jeux de données]]), chargées de créer et de mettre à jour les métadonnées ([[registres de métadonnées]]), au moins pour ce qui concerne les [[informations géographiques]]. Elle devrait faire évoluer le cadre législatif<ref>La directive 2003/98/CE fournit un cadre pour la réutilisation des informations du [[secteur public]]. Les conditions d'application de la directive sont fonction des États membres et des organismes de secteur public.{{référence nécessaire}}</ref>.
Le [[moteur de recherche]] [[Google]] s'appuie sur le [[Dublin Core]]. La programmation [[NCW|network-centric]] utilise les métadonnées du [[Dublin Core]].


L'utilisation du [[Dublin Core]] doit impérativement s'accompagner d'une organisation en [[registre de métadonnées]]. Avant toute mise en œuvre du référentiel, il faut prendre en compte son caractère sensible sur le plan de la protection du [[patrimoine informationnel]] et ses contraintes organisationnelles qui y sont liées. C'est la raison pour laquelle le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme [[ISO/CEI 11179]] (partie 6 sur l'enregistrement).
Le système de publication d'[[OpenWeb]] ([http://openweb.eu.org/articles/dublin_core/ Présentation des métadonnées « Dublin Core »]) est basé sur ce tronc commun.


Le [[moteur de recherche]] [[Google]] s'appuie sur le [[Dublin Core]]. La programmation [[network Centric Warfare|network-centric]] utilise les métadonnées du Dublin Core. Le système de publication d'[[OpenWeb]]<ref>[http://openweb.eu.org/articles/dublin_core/ Présentation des métadonnées « Dublin Core »])</ref> est basé sur ce tronc commun.
La norme [[ISO 15836]]:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde. En France, on l'emploie dans la [[Gestion électronique des documents]] (GED) ou dans les [[Systèmes d'archivage électronique]] (SAE).


La norme [[ISO 15836]]:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde{{référence souhaitée}}. En France, on l'emploie dans la [[gestion électronique des documents]] (GED) ou dans les [[systèmes d'archivage électronique]] (SAE).
Il n'existe pas de traduction officielle, complète, et unique du référentiel [[Dublin Core]] en [[français]]. Il existe plusieurs guides d'utilisation en français.


Il n'existe pas de traduction française officielle, complète et unique du référentiel [[Dublin Core]], bien qu'il existe plusieurs guides d'utilisation en français<ref>[http://artist.inist.fr/article.php3?id_article=359 Projet de traduction française de la norme internationale de métadonnées Dublin Core] {{Lien archive|url=http://artist.inist.fr/article.php3?id_article=359 |titre=Copie archivée |horodatage archive=20180723143254 }}.</ref>. Il existe un projet de traduction française de la norme internationale [[Dublin Core]] (voir [https://web.archive.org/web/20061204004700/http://artist.inist.fr/article.php3?id_article=359 site Web de Artist, 16 octobre 2006]), mais aucun organisme ne semble en prendre la responsabilité ou le [[leadership]].
Voir : [http://artist.inist.fr/article.php3?id_article=359 Projet de traduction française de la norme internationale de métadonnées Dublin Core].


Il existe d'autres référentiels de métadonnées :
Il existe d'autres référentiels de métadonnées :
* Le standard 5015.2 du département de la défense pour le ''[[records management]]'',
* Le standard 5015.2 du département de la défense pour le ''[[records management]]''
* [[Open Document]] Management API (ODMA), très orienté sur les documents électroniques,
* [[Open Document]] Management API (ODMA), très orienté sur les documents électroniques
* X500 Green Pages.
* X500 Green Pages.


=== Autres référentiels de métadonnées ===
=== Autres référentiels de métadonnées ===
==== Bibliothèques ====
L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux [[années 1960]], avec le standard MARC développé par la [[bibliothèque du Congrès]].


Le schéma [[Metadata Object Description Schema |MODS]], développé par la [[Bibliothèque du Congrès]], est un compromis entre la complexité de [[Machine-Readable Cataloging|MARC]] et la simplicité du [[Dublin Core]].
'''Bibliothèques'''

L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux [[années 1960]], avec le standard MARC développé par la [[bibliothèque du Congrès]].

Le schéma MODS, développé par la [[Bibliothèque du Congrès]], est un compromis entre la complexité de [[MARC]] et la simplicité du [[Dublin Core]].

'''Archivage à long terme'''


==== Archivage à long terme ====
L'[[archivage]] à long terme se fait selon le modèle [[OAIS]], avec le schéma [[Extensible Markup Language|XML]] [[METS]] (Metadata Encoding and Transmission Standard). Il est utilisé par le [[Commissariat à l'énergie atomique]] et le [[CNES]].
L'[[archivage]] à long terme se fait selon le modèle [[OAIS]], avec le schéma [[Extensible Markup Language|XML]] [[METS]] (Metadata Encoding and Transmission Standard). Il est utilisé par le [[Commissariat à l'énergie atomique]] et le [[CNES]].


'''Presse'''
Presse
L'[[International Press Telecommunications Council|IPTC]] recommande l'utilisation d'un [[Référentiel (systèmes d'information)|référentiel]] international de métadonnées spécifique à la [[Presse écrite|presse]], [[IPTC Information Interchange Model|IPTC Core]].

L'[[IPTC]] recommande l'utilisation d'un [[référentiel]] international de métadonnées spécifique à la [[Presse écrite|presse]], IPTC Core.


=== Cadre général : Web sémantique, RDF ===
=== Cadre général : Web sémantique, RDF ===

{{Article détaillé|Web sémantique}}
{{Article détaillé|Web sémantique}}


Les métadonnées trouvent leur pleine utilisation dans le Web sémantique. Celui-ci repose :
Les métadonnées trouvent leur pleine utilisation dans le Web sémantique. Celui-ci repose :
* [[Resource Description Framework]] ([[Resource Description Framework|RDF]]) : ce cadre de référence comporte des [[modèle (informatique)|modèles]] de graphe destinés à décrire de façon formelle les [[ressources Web]] et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. [[Resource Description Framework|RDF]] a été défini en [[1999]] par le [[World Wide Web Consortium|W3C]], c'est le référentiel de base du [[Web sémantique]].
* sur les standards généraux du Web :
* Les métadonnées peuvent également être utilisées dans des extensions de [[Resource Description Framework|RDF]] : [[RDF Schema]] et [[Web Ontology Language|OWL]].
** Protocole [[HTTP]],
** [[URI]],
** langage [[Extensible Markup Language|XML]]

* sur des standards propres au [[Web sémantique]] :
** [[Resource Description Framework]] ([[Resource Description Framework|RDF]]) : ce cadre de référence comporte des [[modèle (informatique)|modèles]] de graphe destinés à décrire de façon formelle les [[ressources Web]] et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. [[Resource Description Framework|RDF]] a été défini en [[1999]] par le [[World Wide Web Consortium|W3C]], c'est le référentiel de base du [[Web sémantique]].
** Les métadonnées peuvent également être utilisées dans des extensions de [[Resource Description Framework|RDF]] : [[RDF Schema]] et [[OWL]].


=== Formats ===
=== Formats ===

* [[Extensible Metadata Platform|XMP]] : format de métadonnées basé sur [[Extensible Markup Language|XML]], utilisé dans les applications [[Portable Document Format|PDF]], de [[photographie]] et de [[graphisme]], applicable au [[Web]]. Il a été lancé par [[Adobe Systems]] en avril [[2001]].
* [[Extensible Metadata Platform|XMP]] : format de métadonnées basé sur [[Extensible Markup Language|XML]], utilisé dans les applications [[Portable Document Format|PDF]], de [[photographie]] et de [[graphisme]], applicable au [[Web]]. Il a été lancé par [[Adobe Systems]] en avril [[2001]].


=== Standardisation et normalisation ===
=== [[Normalisation (industrie et service)|Normalisation]] ===
{{Article détaillé|Standards et normes de métadonnées}}


La quasi-totalité des standards de métadonnées ne sont disponibles qu'en anglais. Les seules normes qui soient disponibles en langue française sont celle sur le [[Dublin Core]] (qui en réalité est très courte), et surtout la norme [[ISO 21127]] sur le [[patrimoine culturel immatériel]] et matériel.
{{Article détaillé|Norme de métadonnées}}

La quasi-totalité des normes sur les métadonnées ne sont disponibles qu'en anglais. Les seules normes qui soient disponibles en langue française sont celle sur le Dublin Core (qui en réalité est très courte), et surtout la norme [[ISO 21127]] sur le [[patrimoine culturel immatériel]].


La [[normalisation (industrie et service)|normalisation]] est importante sur différents aspects : la [[recherche d'information]], la structuration d'[[ontologie (informatique)|ontologies]] dans le [[web sémantique]], et la définition de [[règles métier]].
La [[normalisation (industrie et service)|normalisation]] est importante sur différents aspects : la [[recherche d'information]], la structuration d'[[ontologie (informatique)|ontologies]] dans le [[web sémantique]], et la définition de [[règles métier]].
Ligne 270 : Ligne 213 :
Les normes sur les [[registres de métadonnées]] ([[ISO 11179]], complétée par deux autres normes, [[Dublin Core]]) définissent les concepts et l'organisation.
Les normes sur les [[registres de métadonnées]] ([[ISO 11179]], complétée par deux autres normes, [[Dublin Core]]) définissent les concepts et l'organisation.


En plus de ces normes générales, il existe des normes particulières à certains domaines :
En plus de ces normes générales, il existe des normes à certains domaines :
* L'[[archivage informatique]] ;
* '[[archivage informatique]] ;
* Le [[patrimoine culturel]] ([[ISO 21127]]) ;
* [[patrimoine culturel]] [[ISO 21127]] ;
* Les [[informations géographiques]] ;
* [[informations géographiques]] ;
* Le [[commerce électronique]] ;
* commerce électronique]] ;
* La [[gestion des documents d'archives]] ;
* [[gestion des documents d'archives]] ;
* Les [[documents électroniques]] ;
* [[documents ]] ;
* L'[[agriculture]].
* '[[agriculture]]
* l'écologie : [[Ecological Metadata Language]] ;
* etc.


== Risques ==
== Risques ==
=== Risques liés aux métadonnées ===
=== Risques liés aux métadonnées ===
Les métadonnées sont utiles à l'[[interopérabilité informatique|interopérabilité]], mais leur emploi sans précaution présente des [[risque]]s. On a déjà souligné que la mise en œuvre d'un [[registre de métadonnées]] nécessite de s'appuyer sur la norme idoine ([[ISO/CEI 11179]]) et certains experts préconisent d'enlever les métadonnées des [[documents électroniques]]<ref>[http://www.metadatarisk.org/content_security_risks/cont_security_overview.htm Content Security Risks sur le site metadatarisk.org]</ref>.


Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systèmes informatiques.
Les métadonnées sont utiles à l'[[interopérabilité informatique|interopérabilité]], mais leur emploi sans précaution présente des [[risque]]s.
* On a déjà souligné que la mise en œuvre d'un [[registre de métadonnées]] nécessite de s'appuyer sur la norme idoine ([[ISO/CEI 11179]]),
* Certains experts préconisent d'enlever les métadonnées des [[documents électroniques]].


[[Olivier Ertzscheid]] qualifie d’enclosure algorithmique<ref name=":0">{{Article|langue=fr|prénom1=Olivier|nom1=Ertzscheid|titre=Usages de l’information numérique : comprendre les nouvelles enclosures algorithmiques pour mieux s’en libérer|périodique=Revue française des sciences de l’information et de la communication|numéro=6|date=2015-01-01|issn=2263-0856|doi=10.4000/rfsic.1425|lire en ligne=https://rfsic.revues.org/1425#bodyftn40|consulté le=2016-12-12}}</ref> l'exploitation des métadonnées laissées par les internautes lors de leur navigation sur le web, au moyen d'algorithmes. Dans un contexte d’[[Économie de l'attention|économie de l’attention]], ces métadonnées sont traitées à l’insu des usagers, posant des questions d’ordre juridique<ref>{{Lien web|titre=La Cour de justice européenne choisit de protéger les données personnelles|url=http://www.enssib.fr/breves/2014/04/10/la-cour-de-justice-europeenne-choisit-de-proeteger-les-donnees-personnelles|site=enssib.fr|consulté le=2016-12-12}}</ref>{{,}}<ref>{{Lien web|titre=CURIA - Documents|url=http://curia.europa.eu/juris/document/document.jsf?text=&docid=150642&pageIndex=0&doclang=FR&mode=req&dir=&occ=first&part=1&cid=247646|site=curia.europa.eu|consulté le=2016-12-12}}</ref> et éthique. L’enclosure [[algorithmique]] constitue donc une forme de rétention et de détournement des données des usagers, afin de les exploiter commercialement<ref name=":0" />{{,}}<ref>{{Article|langue=fr|prénom1=Marc|nom1=Ménard|titre=Systèmes de recommandation de biens culturels|périodique=Les Cahiers du numérique|volume=10|numéro=1|date=2014-06-12|issn=1622-1494|lire en ligne=http://www.cairn.info/resume.php?ID_ARTICLE=LCN_101_0069|consulté le=2016-12-12|pages=69–94}}</ref>. Cette situation de non transparence informationnelle ne facilite pas les travaux de recherche scientifique, dans la mesure où les métadonnées en question ne sont pas accessibles aux chercheurs<ref>{{Article|langue=fr|prénom1=Dirk|nom1=Lewandowski|prénom2=Nadine|nom2=Höchstötter|titre=Mesurer la qualité des moteurs de recherche Web|périodique=Questions de communication|numéro=14|date=2008-12-01|issn=1633-5961|doi=10.4000/questionsdecommunication.672|lire en ligne=https://questionsdecommunication.revues.org/672|consulté le=2016-12-12|pages=75–93}}</ref>. L’exploitation de ces métadonnées conditionne également la recherche en ligne des usagers, qui n’ont pas toujours conscience<ref>{{Lien web|nom1=InternetActu.net|titre=Internet ne nous séduit pas seulement par ses contenus, mais par sa structure|url=http://www.internetactu.net/|site=InternetActu.net|consulté le=2016-12-12}}</ref> des logiques marchandes mises en place notamment lors de l'affichage des résultats par les [[Moteur de recherche|moteurs de recherche]]. C’est notamment ce qu’[[Eli Pariser]] nomme les « bulles cognitives »<ref>{{Article|langue=fr|prénom1=Frédéric|nom1=Joignot|titre=Sur Internet, l’invisible propagande des algorithmes|périodique=Le Monde.fr|date=2016-09-15|issn=1950-6244|lire en ligne=https://www.lemonde.fr/idees/article/2016/09/15/sur-internet-l-invisible-propagande-des-algorithmes_4998063_3232.html|consulté le=2016-12-12}}</ref> ou [[Bulle de filtres|« ''filter bubble'' »]]. L’utilisation des métadonnées s'accroît et se diversifie. Désormais se met en place une véritable création d’opinions par l’exposition de contenus jouant sur l’affect des usagers<ref name=":0" />, notamment par les [[Réseau social|réseaux sociaux]] où se créent très rapidement des phénomènes viraux<ref>{{Lien web|titre=Combien de likes pour rétablir la peine de mort ?|url=http://affordance.typepad.com/mon_weblog/2013/09/combien-like-retablir-peine-de-mort.html|site=affordance.info|consulté le=2016-12-12}}</ref>.
Voir : [http://www.metadatarisk.org/content_security_risks/cont_security_overview.htm Content Security Risks sur le site metadatarisk.org]

Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systèmes informatiques.


=== Utilisation par les [[langages informatiques]] ===
=== Utilisation par les [[langages informatiques]] ===

Les métadonnées peuvent être utilisées dans les [[langages de marquage]] : [[Standard Generalized Markup Language|SGML]], [[Hypertext Markup Language|HTML]], [[XHTML]].
Les métadonnées peuvent être utilisées dans les [[langages de marquage]] : [[Standard Generalized Markup Language|SGML]], [[Hypertext Markup Language|HTML]], [[XHTML]].


Ligne 300 : Ligne 241 :
Le langage [[SKOS]], en cours de développement au [[World Wide Web Consortium|W3C]] pour utilisation dans la [[Communauté européenne]], prévoit d'employer des métadonnées dans le cadre [[Resource Description Framework|RDF]] en environnement [[web sémantique]].
Le langage [[SKOS]], en cours de développement au [[World Wide Web Consortium|W3C]] pour utilisation dans la [[Communauté européenne]], prévoit d'employer des métadonnées dans le cadre [[Resource Description Framework|RDF]] en environnement [[web sémantique]].


Le [[langage de programmation|langage]] [[Java (technologie)|Java]] accepte également les métadonnées.
Le [[langage de programmation|langage]] [[Java (technologie)|Java]] accepte également les métadonnées.

Voir : [[Java Specification Requests#Interopérabilité informatique|Liste des JSR]] sur l'[[interopérabilité informatique]]


=== Génération des métadonnées ===
=== Génération des métadonnées ===
Les métadonnées peuvent être introduites de façon manuelle, mais aussi semi-automatique, ou automatique<ref>Voir : {{pdf}} [http://www.emse.fr/~mbeig/PUBLIS/2003-jft-p257-prime.pdf Propagation de métadonnées par l'analyse des liens] ; [http://www.dlib.org/dlib/november04/choudhury/11choudhury.html Toward a metadata generation framework]</ref>.

Les métadonnées peuvent être introduites de façon manuelle, mais aussi semi-automatique, ou automatique.

Voir :
* {{pdf}} [http://www.emse.fr/~mbeig/PUBLIS/2003-jft-p257-prime.pdf Propagation de métadonnées par l'analyse des liens]
* [http://www.dlib.org/dlib/november04/choudhury/11choudhury.html Toward a metadata generation framework]


=== Critiques ===
=== Critiques ===
Le concept de métadonnées peut avoir des inconvénients ; un des problèmes est de définir un noyau d'informations standards, l'ensemble des données possibles étant vaste. De plus, les métadonnées peuvent être subjectives et dépendantes du contexte, ce qui rend difficile leur exploitation<ref>{{Ouvrage|titre=Semantic Heterogeneity in Global Information Systems: The Role of Metadata, Context and Ontologies|auteur=Vipul Kashyap, Amit Sheth|année=1996|lire en ligne=http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.43.3117}}</ref> (par exemple, la donnée « photo prise à 1:00 » dépendra du temps local). Pour les documents multilingues, il faut assurer la traduction des métadonnées, ce qui accroît la complexité et les risques. La création des métadonnées peuvent donc dans certains cas être consommatrices de temps, ce qui pourrait donc décourager les entreprises (pour des questions d'argent), ou des particuliers (pour des questions de complexité).
Le concept de métadonnées peut avoir des inconvénients ; un des problèmes est de définir un noyau d'informations standards, l'ensemble des données possibles étant vaste. De plus, les métadonnées peuvent être subjectives et dépendantes du contexte, ce qui rend difficile leur exploitation<ref>{{Ouvrage|titre=Semantic Heterogeneity in Global Information Systems: The Role of Metadata, Context and Ontologies|=|année=1996|lire en ligne=http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.43.3117}}</ref> (par exemple, la donnée « photo prise à 1:00 » dépendra du temps local). Pour les documents multilingues, il faut assurer la traduction des métadonnées, ce qui accroît la complexité et les risques. La création des métadonnées donc dans certains cas être de temps, ce qui pourrait donc décourager entreprises (pour des questions d'argent), ou des particuliers (pour des questions de complexité).


== Utilisations par types de ressources ==
== Utilisations par types de ressources ==
{{Section vide ou incomplète|à faire=précision sur ce qui est à compléter}}

=== [[Métadonnée (audio)|Audio]] ===
=== [[Métadonnée (audio)|Audio]] ===
{{article détaillé|Métadonnée (audio)}}
Pour un fichier audio numérique, les métadonnées peuvent être utilisées pour nommer, décrire, cataloguer et indiquer la propriété ou le [[droit d'auteur]].


=== [[Métadonnée (photographie)|Photographie]] ===
Pour un fichier audio numérique, les métadonnées peuvent être utilisées pour nommer, décrire, cataloguer et indiquer la propriété ou le droit d'auteur.
{{article détaillé|Métadonnée (photographie)}}

Les métadonnées numériques décrivent des sources. Les métadonnées enregistrées dans une image photographique la caractérisent et lui apportent du sens. Elles garantissent sa traçabilité.
=== [[Moteurs de recherche]] ===


=== [[Moteur de recherche|Moteurs de recherche]] ===
Le langage [[Hypertext Markup Language|HTML]] permet de structurer la nature et le contenu des [[pages Web]]. C'est l'utilisation la plus classique. Cependant, les métadonnées ne sont plus véritablement pertinentes pour les moteurs de recherche. En effet, les [[éléments meta]] ne sont pratiquement plus pris en considération par la plupart des moteurs de recherche. Google par exemple, ne tient compte que de la [[meta description]] et de la meta robots. Cette situation est la conséquence du [[référencement abusif]] depuis [[1999 en informatique|1999]].
Le langage [[Hypertext Markup Language|HTML]] permet de structurer la nature et le contenu des [[pages Web]]. C'est l'utilisation la plus classique. Cependant, les métadonnées ne sont plus véritablement pertinentes pour les moteurs de recherche. En effet, les [[éléments meta]] ne sont pratiquement plus pris en considération par la plupart des moteurs de recherche. Google par exemple, ne tient compte que de la [[meta description]] et de la meta robots. Cette situation est la conséquence du [[référencement abusif]] depuis [[1999 en informatique|1999]].


=== [[Bases de données relationnelles]] ===
=== [[Bases de données relationnelles]] ===

Les bases de données relationnelles utilisent aussi des métadonnées dans les [[table (base de données)|tables]].
Les bases de données relationnelles utilisent aussi des métadonnées dans les [[table (base de données)|tables]].


C'est dans la phase d'[[alignement stratégique]] des [[projet]]s de [[système d'information]], en particulier d'[[urbanisation (informatique)|urbanisation]], que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information.
C'est dans la phase d'[[alignement stratégique]] des de [[système d'information]], en particulier d'[[urbanisation (informatique)|urbanisation]], que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information.


=== Systèmes de fichiers Unix ===
=== Systèmes de fichiers Unix ===

Les [[systèmes de fichiers]] disposent de quelques informations de base sur les [[fichier (informatique)|fichiers]], qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification.
Les [[systèmes de fichiers]] disposent de quelques informations de base sur les [[fichier (informatique)|fichiers]], qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification.


Dans les [[systèmes UNIX]], les [[droits d'accès]] (en lecture, écriture et exécution selon l'[[Utilisateur (informatique)|utilisateur]], le groupe, ou les autres) sont des métadonnées sensibles.
Dans les [[systèmes UNIX]], les [[droits d'accès]] (en lecture, écriture et exécution selon l'[[Utilisateur (informatique)|utilisateur]], le groupe, ou les autres) sont des métadonnées sensibles.
Ces [[droits d'accès]] sont décrits dans ce que l'on appelle les [[inode]]s (contraction d'index-node, nœud d'index).


Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'[[information]] dans les [[systèmes de fichiers]] passe par l'utilisation massive des métadonnées.
Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'[[information]] dans les [[systèmes de fichiers]] passe par l'utilisation massive des métadonnées.


Le principe n'est pas nouveau : le [[BeOS file system]] (BFS) était notamment réputé pour son support des métadonnées. Le ressource ''fork'' du système de fichiers utilisé par les anciennes version de [[Mac OS]] permettait également ce type de gestion.
Certains systèmes de fichiers en cours de développement comme la version 4 de [[ReiserFS]] ou [[WinFS]] ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les [[fichier (informatique)|fichiers]] seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent.

Le principe n'est pas nouveau : le [[BeOS file system]] (BFS) était notamment réputé pour son support des métadonnées. Le ressource fork du système de fichiers utilisé par les anciennes version de [[Mac OS]] permettait également ce type de gestion.


=== Fichiers bureautiques ===
=== Fichiers bureautiques ===
Des formats de fichiers tels que [[Portable Document Format|PDF]], [[Microsoft Word|Word]], [[Microsoft Excel|Excel]], le format [[OpenDocument]] utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu ''Fichier&nbsp;>&nbsp;propriétés du document'' dans l'interface des applications correspondantes.


Le format de document [[OpenDocument]] (ou ODF), ouvert, contient des métadonnées dans le fichier [[OpenDocument#meta.xml|meta.xml]]. Ce format a été recommandé par [[Bernard Carayon]]<ref>{{pdf}} [http://lesrapports.ladocumentationfrancaise.fr/BRP/064000728/0000.pdf Rapport ''À armes égales'' de Bernard Carayon, 2006]</ref> et a été adopté par l'[[Union européenne]].
Des formats de fichiers tels que [[Portable Document Format|PDF]], [[Microsoft Word|Word]], [[Microsoft Excel|Excel]], ou [[OpenOffice.org]] utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu ''Fichier&nbsp;>&nbsp;propriétés du document'' dans l'interface des applications correspondantes.

Le format de document [[OpenDocument]] (ou ODF), ouvert, contient des métadonnées dans le fichier [[OpenDocument#meta.xml|meta.xml]]. Ce format a été recommandé par [[Bernard Carayon]]<ref>{{pdf}} [http://lesrapports.ladocumentationfrancaise.fr/BRP/064000728/0000.pdf Rapport ''à armes égales'' de Bernard Carayon, 2006]</ref> et a été adopté par l'[[Union européenne]].


=== Contenus [[multimédia]] ===
=== Contenus [[multimédia]] ===

* [[MPEG-7]] est une norme de description de contenu qui intègre des métadonnées
* [[MPEG-7]] est une norme de description de contenu qui intègre des métadonnées
* [[MPEG-21]]
* [[MPEG-21]]
* [[Material Exchange Format|MXF]] est un conteneur vidéo. Il permet la prise en charge, dans un même fichier, d'un média vidéo et de ses métadonnées
* [[Material eXchange Format|MXF]]
{{...}}


==== [[presse écrite|Presse]] ====
==== [[presse écrite|Presse]] ====

Les technologies applicables sont PRISM, {{Lien|NewsML|lang=en}}, et NITF.
Les technologies applicables sont PRISM, {{Lien|NewsML|lang=en}}, et NITF.
{{...}}


==== [[Fichiers graphiques]] ====
==== [[Fichiers graphiques]] ====

Chaque format d'[[image numérique]] implémente une façon spécifique de stocker les métadonnées, mais il existe certaines normes communes à plusieurs types, par exemple :
Chaque format d'[[image numérique]] implémente une façon spécifique de stocker les métadonnées, mais il existe certaines normes communes à plusieurs types, par exemple :

* le standard [[Exchangeable image file format|EXIF]] est utilisable à la fois dans les fichiers [[Joint Photographic Experts Group|JPEG]] ou [[Tagged Image File Format|TIFF]],
* le standard [[Exchangeable image file format|EXIF]] est utilisable à la fois dans les fichiers [[Joint Photographic Experts Group|JPEG]] ou [[Tagged Image File Format|TIFF]],
* le standard [[Extensible Metadata Platform|XMP]] est intégrable à une douzaine de types de fichier différents ([[Joint Photographic Experts Group|JPEG]], [[JPEG 2000]], [[Tagged Image File Format|TIFF]], [[Graphics Interchange Format|GIF]], [[Portable Network Graphics|PNG]], etc.).
* le standard [[Extensible Metadata Platform|XMP]] est intégrable à une douzaine de types de fichier différents ([[Joint Photographic Experts Group|JPEG]], [[JPEG 2000]], [[Tagged Image File Format|TIFF]], [[Graphics Interchange Format|GIF]], [[Portable Network Graphics|PNG]], etc.)
* DIG35, et JPX.
* DIG35, et JPX.
{{...}}


==== [[Son numérique|Fichiers Son]] ====
==== [[Son numérique|Fichiers Son]] ====
{{Article détaillé|métadonnée (audio)}}
{{...}}
Il y a plusieurs familles de métadonnées pour l'audiovisuel, les métadonnées d'identification destinées au grand public et d'autres destinées à l'univers [[Sport professionnel|professionnel]] de l'audio ou de l'audiovisuel. Les formats de [[son numérique]] intègrent des métadonnées :

Il y a plusieurs familles de métadonnées pour l'audiovisuel, les métadonnées d'identification destinées au grand public et d'autres destinées à l'univers professionnel de l'audio ou de l'audiovisuel.

Les formats de [[son numérique]] intègrent des métadonnées :

* [[Dolby Digital EX]]
* [[Dolby Digital EX]]
* [[Dolby E]]
* [[Dolby E]]
* Fichiers [[MP3]]
* Fichiers [[MP3]]


Les métadonnées sont utilisées par le format [[MPEG-1/2 Audio Layer 3|MP3]] dans les ''tags'' [[ID3]]. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la [[date (métadonnée)|date]] de sortie.
Les métadonnées sont utilisées par le format [[MPEG-1/2 Audio Layer 3|MP3]] dans les ''tags'' [[ID3]]. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la [[date (métadonnée)|date]] de sortie.


==== Objets numériques ====
{{Article détaillé|métadonnée (audio)}}
Les métadonnées utilisées pour les objets numériques peuvent être employées dans le cadre de projet muséal ou de bibliothèques virtuelle<ref name=":1">{{Article|langue=en|auteur1=Gordon McKenna, Chris De Loof|titre=Report on existing standards applied in
European museums|périodique=Athena|date=mai 2009|issn=|lire en ligne=https://packed.be/assets/files/news/ATHENA_D.3_.1_._Report_on_existing_standards_applied_in_EU_museums_KMKG__Collections_Trust.pdf|pages=}}</ref> :
* METS (Metadata Encoding and Transmission Standard)
* MODS (Metadata Object Description Schema)

==== [[Projet pédagogique]] ====
Les familles de métadonnées suivantes sont utilisées dans le cadre de projets pédagogique<ref name=":1" /> :
* CanCore (Canadian Core Learning Object Metadata),
* GEM (the Gateway to Educational Materials),
* LOM (Learning Object Metadata) [[Scheme]].


== Utilisations par types d'applications ==
== Utilisations par types d'applications ==
=== [[Logiciels libres]] ===
=== ===
Lors du rapprochement de deux organisations différentes, il est nécessaire d'harmoniser les règles d'[[authentification unique]] entre les deux organisations. Ceci se fait généralement par l'échange des métadonnées qui permettent d'authentifier les individus concernés.


=== [[Commerce électronique]] ===
Les logiciels libres utilisent, comme tous les logiciels, des métadonnées. Par exemple, le système de gestion intégrée des documents du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage.
Le projet Interoperability of Data in E-Commerce Systems ou INDECS (compatibilité des données dans les systèmes de commerce électronique) emploie des métadonnées.


=== Gestion de contenu, gestion électronique des documents ===
Voir : <s>[http://www.logiciel-libre.gouv.qc.ca/index.php?id=372 Services gouvernementaux du Québec, fonctions de base en gestion documentaire]</s> (lien mort)
Les applications progicielles de [[gestion des connaissances]] ont, dans la [[gestion de contenu]], des fonctions permettant de gérer les métadonnées. À ce titre, elles sont essentielles pour la [[gestion de la preuve]] (voir ''supra'').

En France, dans le [[Cadre Commun d'Interopérabilité]] du [[Référentiel Général d'Interopérabilité]] du programme d'[[e-Gouvernement]] [[ADELE]], les technologies du [[logiciel libre]] sont représentées par l'intermédiaire de [[Zope]], qui a des capacités à interopérer via le langage [[DTML]] (Dynamic Template Markup Language). Ce langage emploie lui-même des métadonnées.

Voir : [http://www.zope.org/Products/CMF/docs/devel/configuring_metadata_tool/view Zope - Configuring the Metadata Tool]

=== Gestion des [[brevet]]s ===

Les droits de [[propriété intellectuelle]] sont l'un des [[élément (métadonnée)|éléments]] du [[Dublin Core]]. Les données sur les [[brevet]]s peuvent être indexées dans des applications de [[gestion des brevets]] ou gestion des actifs novateurs (IPAM, Intellectual Property Asset Management, ou IAM), en utilisant des métadonnées.

Voir : [http://www.kmworld.com/Articles/ReadArticle.aspx?ArticleID=9062 Intellectual assets--Corporate value moves from top minds to bottom linesa price on (what's in) your head]

=== [[Progiciels de gestion intégrés]] ===

Les grands [[progiciels de gestion intégrés]] ([[Systems, applications, and products for data processing|SAP]], [[Oracle Corporation]], …) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois [[gestion des données de référence]] ou [[Master Data Management]] ([[Gestion des données de référence|MDM]]).

=== [[Gestion de contenu]], [[GED]] ===

Les applications progicielles de [[gestion des connaissances]] ont, dans la [[gestion de contenu]], des fonctions permettant de gérer les métadonnées.

À ce titre, elles sont essentielles pour la [[gestion de la preuve]] (voir ''supra'').


La norme [[SCORM]] d'[[apprentissage en ligne]] utilise le schéma de description de ressources d’enseignement et d’apprentissage [[Learning Object Metadata]].
La norme [[SCORM]] d'[[apprentissage en ligne]] utilise le schéma de description de ressources d’enseignement et d’apprentissage [[Learning Object Metadata]].
Ligne 417 : Ligne 331 :
Les outils de [[gestion électronique des documents]] peuvent également utiliser des métadonnées pour le classement des documents (voir [[Gestion électronique des documents#Classement des documents|Classement des documents par type dans la GED]]).
Les outils de [[gestion électronique des documents]] peuvent également utiliser des métadonnées pour le classement des documents (voir [[Gestion électronique des documents#Classement des documents|Classement des documents par type dans la GED]]).


=== [[Interfaces de programmation]] (API) ===
=== ===
Les droits de [[propriété intellectuelle]] sont l'un des [[élément (métadonnée)|éléments]] du [[Dublin Core]]. Les données sur les [[brevet]]s peuvent être indexées dans des applications de [[gestion des brevets]] ou gestion des actifs novateurs (IPAM, Intellectual Property Asset Management, ou IAM), en utilisant des métadonnées<ref>Dan Bolita,[http://www.kmworld.com/Articles/ReadArticle.aspx?ArticleID=9062 Intellectual assets--Corporate value moves from top minds to bottom linesa price on (what's in) your head]</ref>.


=== [[Informatique décisionnelle]] ===
Les métadonnées peuvent être employées dans les spécifications [[J2EE]] du [[langage de programmation]] [[Java (technologie)|Java]], en particulier dans les [[interfaces de programmation]] (API).
Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de [[gestion des ressources humaines]], finances, [[gestion de la relation client]]. À ce titre, elles sont un élément essentiel de la [[gouvernance d'entreprise]] (voir ''supra'').


=== Interfaces de programmation (API) ===
Elles font l'objet de formats d'interface : [[JMI]] (Java Metadata Interface), spécifique au langage [[Java (langage)|Java]].
Les métadonnées peuvent être employées dans les spécifications [[J2EE]] du [[langage de programmation]] [[Java (technologie)|Java]], en particulier dans les [[interfaces de programmation]] (API). Elles font l'objet de formats d'interface : [[Java Metadata Interface|JMI]] (Java Metadata Interface), spécifique au langage [[Java (langage)|Java]].


[[XMI]] (XML Metadata Interchange) est un standard d'échanges de métadonnées [[Unified Modeling Language|UML]].
[[XMI]] (XML Metadata Interchange) est un standard d'échanges de métadonnées [[Unified Modeling Language|UML]].


=== [[Moteurs de recherche]] ===
=== [[ ]] ===
Les logiciels libres utilisent, comme tous les logiciels, des métadonnées. Par exemple, le système de [[gestion intégrée des documents]] du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage.


En France, dans le [[Cadre Commun d'Interopérabilité]] du [[Référentiel Général d'Interopérabilité]] du programme d'[[e-Gouvernement]] [[ADELE]], les technologies du [[logiciel libre]] sont représentées par l'intermédiaire de [[Zope]], qui a des capacités à interopérer ''via'' le langage [[DTML]] (Dynamic Template Markup Language). Ce langage emploie lui-même des métadonnées<ref>[http://www.zope.org/Products/CMF/docs/devel/configuring_metadata_tool/view Zope - Configuring the Metadata Tool]</ref>.
Les [[moteurs de recherche]] peuvent s'appuyer sur des métadonnées pour améliorer les [[recherches d'information]] par rapport aux [[recherches plein texte]]. Dans les années [[1995]]-[[1999]], on utilisait beaucoup des [[métaélément]]s [[élément HTML|HTML]] pour optimiser les premiers moteurs de recherche, mais on s'est rendu compte qu'ils n'étaient pas toujours fiables.


Les [[courriel]]s gérés par les [[messageries électroniques]] peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'[[IEEE]] en [[1999]] sur l'archivage des [[Courrier électronique|courriels]] de l'[[administration américaine]]<ref>Voir : la présentation qu'il fait pour l'US National Archives and Records Administration :[https://www.erpanet.org/events/2004/antwerpen/presentations/erpaWorkshop-Antwerpen_Baron.pdf ERPA Workshop Antwerp, 15 avril 2004]</ref>.
=== [[Services Web]] ===


=== Monétique ===
Les [[services Web]] (architecture [[SOA]]) manipulent de grandes quantités de métadonnées. L'organisation [[WS-I]] (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures [[norme]]s impliquées dans l'[[interopérabilité]] des [[services Web]].
Les standards en [[monétique]] et en systèmes de paiements par [[cartes de crédit]] comportent des métadonnées<ref>[http://www.keypoint24x7.com/knowledge3.htm exemple]{{Référence à confirmer}}</ref>.


=== Moteurs de recherche ===
Voir : [http://www.forrester.com/Research/Document/Excerpt/0,7211,40901,00.html Web Services Specifications : Registry And Metadata, 28/12/2006].
Les [[Moteur de recherche|moteurs de recherche]] peuvent s'appuyer sur des métadonnées pour améliorer les [[recherches d'information]] par rapport aux [[recherches plein texte]]. Dans les années [[1995]]-[[1999]], on utilisait beaucoup des [[métaélément]]s [[élément HTML|HTML]] pour optimiser les premiers moteurs de recherche, mais on s'est rendu compte qu'ils n'étaient pas toujours fiables.


Les grands [[progiciels de gestion intégrés]] ([[Systems, applications, and products for data processing|SAP]], [[Oracle Corporation]]…) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois [[gestion des données de référence]] ou [[Master Data Management]] ([[Gestion des données de référence|MDM]]).
Les métadonnées servent à plusieurs choses : elles décrivent les formats de message que le service prend en charge, et les [[modèle (informatique)|modèles]] d'échange de messages valides pour un service, grâce à la spécification [[Web Services Description Language|WSDL]]. Les métadonnées décrivent aussi les capacités et les exigences d'un service, grâce à la spécification [[WS-Policy]]. Cette dernière forme de métadonnée se nomme la « stratégie » d'un service. Parmi les [[Liste des spécifications des Services Web WS-*|spécifications]] qu'utilisent les services web pour les métadonnées, outre [[Web Services Description Language|WSDL]] et WS-Policy, il faut citer [[WS-Security]] et WS-MetadataExchange<ref>''Introduction à l'architecture de services Web et ses spécifications WS-*'', Luis Felipe Cabrera, Christopher Kurt, Don Box, Microsoft, octobre 2004.</ref>.


=== [[Informatique décisionnelle]] ===
=== ===
Les [[services Web]] (architecture [[Architecture orientée services|SOA]]) compilent de grandes quantités de métadonnées. L'organisation [[WS-I]] (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures [[norme]]s impliquées dans l'[[interopérabilité]] des [[services Web]]<ref>[http://www.forrester.com/Research/Document/Excerpt/0,7211,40901,00.html Web Services Specifications : Registry And Metadata, 28/12/2006] {{Lien archive|url=http://www.forrester.com/Research/Document/Excerpt/0,7211,40901,00.html|titre=Copie archivée|horodatage archive=20180723143300}}</ref>.


Les métadonnées servent à plusieurs choses : elles décrivent les formats de message que le service prend en charge et les [[modèle (informatique)|modèles]] d'échange de messages valides pour un service, grâce à la spécification [[Web Services Description Language|WSDL]]. Les métadonnées décrivent aussi les capacités et les exigences d'un service, grâce à la spécification [[WS-Policy]]. Cette dernière forme de métadonnée se nomme la « stratégie » d'un service. Parmi les [[Liste des spécifications des Services Web WS-*|spécifications]] qu'utilisent les services web pour les métadonnées, outre [[Web Services Description Language|WSDL]] et WS-Policy, il faut citer [[WS-Security]] et WS-MetadataExchange<ref>Luis Felipe Cabrera, Christopher Kurt, Don Box,
Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de [[gestion des ressources humaines]], finances, [[gestion de la relation client]].
[https://msdn.microsoft.com/fr-fr/library/ms996441.aspx Introduction à l’architecture de services Web et ses spécifications WS]</ref>.


Les « [[Donnée de connexion|données de connexion]] » (ou « données techniques de connexion ») sont un type particulier de métadonnée : celles qui sont associées à toute connexion, permettant la traçabilité de conversations ou consultations et pour cette raison concernées comme des [[données personnelles]], mais néanmoins accessibles légalement (plus ou moins selon les époques et les pays) à certaines administrations chargées du Renseignement, à certaines conditions et dans certaines circonstances, par exemple en France dans le cadre du dispositif des « [[interceptions obligatoires légales]] » (ou IOL) de surveillance automatisé (« d'écoute ») du réseau [[Internet en France]] par les services de la [[communauté française du renseignement]]. Pour la justice, elles sont parfois considérées comme des [[Preuve numérique|preuves numériques]].{{Loupe|donnée de connexion|interceptions obligatoires légales}}
À ce titre, elles sont un élément essentiel de la [[gouvernance d'entreprise]] (voir ''supra'').


=== [[Commerce électronique]] ===
=== [[ ]] ===
Les balises de syndication [[RSS (format)|RSS]] contiennent des métadonnées.


=== Systèmes d'exploitation ===
Le projet Interoperability of Data in E-Commerce Systems ou INDECS (compatibilité des données dans les systèmes de commerce électronique) emploie des métadonnées.
Les métadonnées sont utilisées dans le [[système d'exploitation]] [[Microsoft Windows Vista]], dont les conditions de [[sécurité informatique|sécurité]] sont controversées<ref>Joris Evers,[http://zdnet.fr/actualites/informatique/0,39040745,39298439,00.htm Gartner s'inquiète des métadonnées dans Windows Vista]</ref>.


=== [[Système de gestion de bibliothèque|Systèmes de gestion de bibliothèque]] ===
=== [[Monétique]] ===
Les SGB sont spécialisés depuis les années 1960 (émergence du [[Ordinateur personnel|PC]] et du [[format MARC]]) dans la gestion des métadonnées bibliographiques: [[Notice bibliographique|notices bibliographiques]] et [[Autorité (sciences de l'information)|notices d'autorités]].

Les standards en [[monétique]] et en systèmes de paiements par [[cartes de crédit]] comportent des métadonnées ([http://www.keypoint24x7.com/knowledge3.htm exemple]).

=== [[Systèmes d'exploitation]] ===

Les métadonnées sont utilisées dans le système d'exploitation [[Microsoft Windows Vista]], dont les conditions de [[sécurité informatique|sécurité]] sont controversées.

Voir : [http://zdnet.fr/actualites/informatique/0,39040745,39298439,00.htm Gartner s'inquiète des métadonnées dans Windows Vista]

=== [[Messageries électroniques]] ===

Les [[courriel]]s gérés par les [[messageries électroniques]] peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'[[IEEE]] en [[1999]] sur l'archivage des [[Courrier électronique|courriels]] de l'[[administration américaine]].

Voir :
* la présentation qu'il fait pour l'US National Archives and Records Administration : [http://www.erpanet.org/events/2004/antwerpen/presentations/erpaWorkshop-Antwerpen_Baron.pdf ERPA Workshop Antwerp, 15 avril 2004]
* [http://www.archives.gov/era/pdf/baron-email-metadata.pdf E-mail metadata in a post-Armstrong world]


=== [[Systèmes de gestion de règles métier]] ===
=== [[Systèmes de gestion de règles métier]] ===

Les [[SGRM]] définissent des [[règles métier]] en employant des métadonnées.
Les [[SGRM]] définissent des [[règles métier]] en employant des métadonnées.

=== [[Syndication]] de contenu [[Web]] ===

Les balises de syndication [[RSS (format)|RSS]] contiennent des métadonnées.

=== [[Authentification unique]] ===

Lors du rapprochement de deux organisations différentes, il est nécessaire d'harmoniser les règles d'[[authentification unique]] entre les deux organisations. Ceci se fait généralement par l'échange des métadonnées qui permettent d'authetifier les individus concernés.


== Métadonnées dynamiques et contexte ==
== Métadonnées dynamiques et contexte ==

L'utilisation de métadonnées dynamiques permet de mieux interpréter le [[contexte (communication)|contexte]].
L'utilisation de métadonnées dynamiques permet de mieux interpréter le [[contexte (communication)|contexte]].


Voir :
Voir :
* {{pdf}} [http://grids.ucs.indiana.edu/ptliupages/publications/maktas_iccse05.pdf Managing dynamic metadata as context]
* {{pdf}} [http://grids.ucs.indiana.edu/ptliupages/publications/maktas_iccse05.pdf Managing dynamic metadata as context]
* [http://digilib.weblog.ub.rug.nl/node/30 Dynamic metadata]
* Dynamic metadata


Les métadonnées sont employées dans les stratégies [[réseau centré]].
Les métadonnées sont employées dans les stratégies [[réseau centré]].


== Domaines d'application ==
== Domaines d'application ==

=== [[Bibliothèque numérique]] ===
=== [[Bibliothèque numérique]] ===
* Library of Congress Digital Repository Development Core Metadata Elements<ref>https://www.loc.gov/standards/metadata.html</ref>.

* [http://www.loc.gov/standards/metadata.html Library of Congress Digital Repository Development Core Metadata Elements]


=== [[radiodiffusion|Monde vidéo]] ===
=== [[radiodiffusion|Monde vidéo]] ===

Dans l'industrie de la [[radiodiffusion|diffusion]] [[télévision|télévisée]] ou du [[cinéma]], les métadonnées attachées aux contenus audio/vidéo sont naturellement indispensables pour :
Dans l'industrie de la [[radiodiffusion|diffusion]] [[télévision|télévisée]] ou du [[cinéma]], les métadonnées attachées aux contenus audio/vidéo sont naturellement indispensables pour :
* ''identifier'' le contenant : le nom du [[Vidéo-clip|clip]], de la [[Liste de lecture|playlist]], sa durée, son [[Timecode (temporel)|code temporel]], etc.
* ''identifier'' le contenant : le nom du [[Vidéo-clip|clip]], de la [[Liste de lecture|playlist]], sa durée, son [[Timecode (temporel)|code temporel]], etc.
* ''décrire'' le contenu : remarques concernant la qualité des images, description (par exemple, lors d'une compétition sportive, on associera à certains moments des mots comme ''goal'', ''carton rouge'', ''public'', …)
* ''décrire'' le contenu : remarques concernant la qualité des images, description (par exemple, lors d'une compétition sportive, on associera à certains moments des mots comme ''goal'', ''carton rouge'', ''public''…)
* ''classer'' les médias : les métadonnées permettent également un classement ou un tri pour retrouver rapidement des images (un journal télévisé peut, à la dernière minute, nécessiter des images d'archive pour un sujet urgent)
* ''classer'' les médias : les métadonnées permettent également un classement ou un tri pour retrouver rapidement des images (un journal télévisé peut, à la dernière minute, nécessiter des images d'archive pour un sujet urgent)


Ces métadonnées ont pu être associés au contenu vidéo grâce à l'avènement des [[serveur vidéo|serveurs vidéo]] durant les dernières années. Les derniers évènements sportifs tels que [[Coupe du monde de la FIFA|la Coupe du monde de Football]] ou les [[Jeux olympiques]] utilisent énormément ces métadonnées pour distribuer les contenus à toutes les [[Chaîne de télévision|chaînes de télévision]] du monde entier via des mots clés. C'est souvent l'organisateur de l'évènement<ref>[http://www.hbs.tv/ organisateur de la Coupe du Monde]</ref> qui est en charge de l'organisation de ses métadonnées via son Centre de Diffusion International (''International Broadcast Centre'') et ses centaines de [[serveur vidéo|serveurs vidéos]] gérant le contenu<ref>[http://www.hbs.tv/hostbroadcasting/ IBC]</ref>. Les métadonnées sont enregistrées en même temps que les images et entrées par des opérateurs de métadonnées (''loggers'') qui visionnent en direct l'évènement sportif et associe les métadonnées disponibles dans des grilles pré-établies (via des programmes associés aux [[serveur vidéo|serveurs vidéos]] tels que [[Multicam LSM]] ou [[IPDirector]])<ref>[http://www.evs-global.com/01/MyDocuments/CS_BOB_EVScontributon_0808_ENG.pdf utilisation des mots-clés pendant les jeux d'été]</ref>.
Ces métadonnées ont pu être associés au contenu vidéo grâce à l'avènement des [[serveur vidéo|serveurs vidéo]] durant les dernières années. Les derniers évènements sportifs tels que [[Coupe du monde de la FIFA|la Coupe du monde de Football]] ou les [[Jeux olympiques]] utilisent énormément ces métadonnées pour distribuer les contenus à toutes les [[Chaîne de télévision|chaînes de télévision]] du monde entier via des mots clés. C'est souvent l'organisateur de l'évènement<ref>[http://www.hbs.tv/ organisateur de la Coupe du Monde]</ref> qui est de l'organisation de ses métadonnées via son Centre de (''International Broadcast Centre'') et ses centaines de [[serveur vidéo|serveurs vidéos]] gérant le contenu<ref>[http://www.hbs.tv/hostbroadcasting/ IBC]</ref>. Les métadonnées sont enregistrées en même temps que les images et entrées par des opérateurs de métadonnées (''loggers'') qui visionnent en direct l'évènement sportif et associe les métadonnées disponibles dans des grilles (via des programmes associés aux [[serveur vidéo|serveurs vidéos]] tels que [[Multicam LSM]] ou [[IPDirector]])<ref>[http://www.evs-global.com/01/MyDocuments/CS_BOB_EVScontributon_0808_ENG.pdf utilisation des mots-clés pendant les jeux d'été]</ref>.


=== [[Fonctions régaliennes]] ===
=== [[Fonctions régaliennes]] ===
==== [[Gouvernement]] et finances ====
En [[France]], les métadonnées sont employées dans le programme [[ADELE]], dans les règles relatives aux [[Composants Communs]]<ref>[https://web.archive.org/web/20061126024544/http://synergies.modernisation.gouv.fr/article.php3?id_article=393 site de la DGME], règle C73</ref> et pour l'[[archivage électronique]] selon la norme [[Open Archival Information System|OAIS]]<ref>[http://synergies.modernisation.gouv.fr/article.php3?id_article=37 site de la DGME]</ref>.


==== [[Défense et sécurité|Défense]] ====
'''[[Gouvernement]] et finances :'''
DITPR est un référentiel qui permet de déclarer les métadonnées dans le [[cadre d'architecture]] [[Department of Defense Architecture Framework|DoDAF]].
* [http://www.tbs-sct.gc.ca/its-nit/standards/tbits39/crit391_f.asp Normes des métadonnées du gouvernement canadien, sous la responsabilité du Conseil du Trésor]
* En France, les métadonnées sont employées dans le programme [[ADELE]], dans les règles relatives aux [[Composants Communs]] (voir [http://synergies.modernisation.gouv.fr/article.php3?id_article=393 site de la DGME], règle C73), et pour l'[[archivage électronique]] selon la norme [[OAIS]] (voir [http://synergies.modernisation.gouv.fr/article.php3?id_article=37 site de la DGME])


==== [[Renseignement]] ====
'''[[défense et sécurité|Défense]] :'''
Les nombreuses [[révélations d'Edward Snowden]] en 2013 ont démontré l'intérêt des métadonnées et leurs usages par les [[services de renseignements]]. Par exemple, le programme [[ICREACH]] de la [[National Security Agency|NSA]], dont l'existence a été révélée en {{date-|août 2014}}, contenaient plus de 850 milliards de métadonnées (origine, destinataire, date, localisation{{etc}}) de communications (courriel, fax, conversations téléphoniques, SMS, messageries instantanées{{etc}}) en 2007<ref name="theintercept20140825">{{article|prénom1=Ryan|nom1=Gallagher|url texte=https://firstlook.org/theintercept/article/2014/08/25/icreach-nsa-cia-secret-google-crisscross-proton/|titre=The Surveillance Engine: How the NSA Built Its Own Secret Google|périodique=The Intercept|lien périodique=The Intercept|jour=25|mois=août|année=2014|langue=en}}</ref>{{,}}<ref name="lemonde20140826">{{article|prénom1=Damien|nom1=Leloup|prénom2=Grégor |nom2=Brandy |url texte=https://www.lemonde.fr/pixels/article/2014/08/26/surveillance-la-nsa-a-cree-son-propre-google_4476822_4408996.html |titre=Surveillance : la NSA a créé son propre « Google »|périodique=Le Monde|lien périodique=Le Monde|jour=26|mois=août|année=2014}}</ref>. La NSA a d'ailleurs normalisé le format des métadonnées interceptées, afin d'en faciliter le partage avec la [[Central Intelligence Agency]] (CIA), le [[Federal Bureau of Investigation]] (FBI), la [[Defense Intelligence Agency]] (DIA), la [[Drug Enforcement Administration]] (DEA) et les services de renseignements anglo-saxons<ref name="theintercept20140825"/>.
* [https://metadata.dod.mil/mdrPortal/appmanager/mdr/mdr Site du DoD] : [[registre de métadonnées]] du [[Département de la Défense]]
* DITPR est un référentiel qui permet de déclarer les métadonnées dans le [[cadre d'architecture]] [[DoDAF]].


==== [[Justice]] ====
'''[[Développement durable]] :'''
En [[France]] : projet Solon de dématérialisation de la production normative juridique. Le périmètre défini en [[2005]] ne concerne que les décrets.
* {{pdf}} [http://www.ecologie.gouv.fr/IMG/pdf/030305metadonnees_gb_lc.pdf Fiches techniques « diffusion des données » du Ministère de l'Écologie, de l'Aménagement et du Développement durable]
* [http://www.dlib.org/dlib/december04/liu/12liu.html Metadata development in China, Department of Information Management, Peking University, Chine, décembre 2004]

'''[[Sécurité intérieure]]''' :
* [http://web-services.gov/DHSMetadata92203.doc Homeland security, meeting 2003]

'''[[Justice]]''' :
* Aux États-Unis : [http://www.it.ojp.gov/jxdm/ Modèle de données du département de la justice]
* En [[France]] : projet Solon de dématérialisation de la production normative juridique. Le périmètre défini en [[2005]] ne concerne que les décrets.


=== [[Environnement]], [[écologie]], [[agriculture]] ===
=== [[Environnement]], [[écologie]], [[agriculture]] ===
==== [[Environnement]] et [[écologie]] ====
* [[Environmental Protection Agency]] (EPA)<ref>[http://www.epa.gov/emg Environmental metadata gateway]</ref>.
* [[Agence européenne de l'environnement]]<ref> [http://www.eionet.europa.eu/gemet EIONET]</ref>.


L'[[Agence de protection de l'environnement des États-Unis]] (EPA) a défini un langage informatique à base de métadonnées : [[Ecological metadata language]].
* [[Environmental Protection Agency]] (EPA) : [http://www.epa.gov/emg Environmental metadata gateway]
* [[Agence européenne de l'environnement]] : [http://www.eionet.europa.eu/gemet EIONET]
* [http://www.fao.org/aims/agmes_intro.jsp AgMES : The Agricultural Metadata Element Set]
Sur l'[[environnement]], voir aussi : [http://hpcrd.lbl.gov/SDM/XMDR/contentlist.html Liste de registres du projet XMDR]


==== [[Développement durable]] ====
L'[[Agence de protection de l'environnement des États-Unis]] (EPA) a défini un langage informatique à base de métadonnées : [[:en:Ecological metadata language|Ecological metadata language]].
* {{pdf}} [http://www.ecologie.gouv.fr/IMG/pdf/030305metadonnees_gb_lc.pdf Fiches techniques « diffusion des données » du Ministère de l'Écologie, de l'Aménagement et du Développement durable]
* [http://www.dlib.org/dlib/december04/liu/12liu.html ''Metadata development in China'', Department of Information Management, université de Pékin, Chine, décembre 2004]


=== [[Commerce électronique]] ===
=== [[]] ===
* [http://www.fao.org/aims/agmes_intro.jsp AgMES] sur le site de la [[Organisation des Nations unies pour l'alimentation et l'agriculture|FAO]]
* [[Série d'éléments de métadonnées agricoles|AgMES]] (série d'éléments de métadonnées agricoles).


* [[Commerce électronique]] : le registre [[ebXML]], géré au niveau des [[Organisation des Nations unies|Nations unies]], utilise des métadonnées.
[[Commerce électronique]]
: le registre [[ebXML]], géré au niveau des [[Organisation des Nations unies|Nations unies]], utilise des métadonnées.


==== [[Recherche scientifique|Recherche]] ====
=== Données géospatiales ===
Le site du [[Centre pour la communication scientifique directe]] (CCSD) donne les spécifications des métadonnées pour le référentiel des publications du CNRS : [http://ccsd.cnrs.fr/spip.php?article42 Les métadonnées associées à un dépôt sur HAL].


==== Données géospatiales ====
* [[États-Unis]] : [http://www.fgdc.gov/metadata/geospatial-metadata-standards Site du federal geographic data committee]
* [[États-Unis]] : [http://www.fgdc.gov/metadata/geospatial-metadata-standards Site du Federal geographic data committee]
* [[Union européenne]] : [[directive INSPIRE]], sur les données spatiales et [[données géographiques|géographiques]]
* [[Union européenne]] : [[directive INSPIRE]], sur les données spatiales et [[données géographiques|géographiques]]


=== Autres domaines ===
=== ===

'''[[Recherche]]'''

Le site du [[Centre pour la communication scientifique directe]] (CCSD) donne les spécifications des métadonnées pour le référentiel des publications du CNRS :
* [http://ccsd.cnrs.fr/spip.php?article42 Les métadonnées associées à un dépôt sur HAL].

'''[[Agriculture]]'''
* [http://www.fao.org/aims/agmes_intro.jsp AgMES] sur le site de la [[Organisation des Nations unies pour l'alimentation et l'agriculture|FAO]]
* [[:en:AgMES|AgMES]] sur la Wikipedia anglophone.

'''[[Géologie]]'''
* [http://geology.usgs.gov/tools/metadata US Geological Survey]

'''[[Commerce international]]'''
* [http://www.jus.uio.no/lm/icc/doc#metadata Chambre de commerce internationale]

'''[[Santé]]'''
* [http://www.ushik.org/registry/x/ United States health information knowledge base]
* [http://www.ushik.org/registry/x/ United States health information knowledge base]


=== Recommandations et exploration ===
'''[[Marine]] et [[océanographie]]'''
Pour l'édition numérique, notamment, les métadonnées jouent un rôle important dans « les mécanismes de recommandation et les services d’exploration et de découverte proposés aux usagers »<ref>{{Ouvrage|langue=fr|prénom1=Benoît|nom1=Epron|prénom2=Marcello|nom2=Vitali-Rosati|titre=L’édition à l’ère numérique|lieu=Montréal|éditeur=[[La Découverte|Éditions La Découverte]]|année=2018|pages totales=114|passage=53|isbn=978-2-348-03643-9|lire en ligne=http://hdl.handle.net/1866/20642}}</ref>.
* [http://marinemetadata.org/info/confworkmtg/metareg/view Marine Metadata Interoperability]

etc.


== Organismes francophones ayant des compétences sur les métadonnées ==
== Organismes francophones ayant des compétences sur les métadonnées ==

Liste non exhaustive :
Liste non exhaustive :
* [[Association française de normalisation]] (AFNOR) ;
* [[Association française de normalisation]] (AFNOR) ;
Ligne 575 : Ligne 452 :
* Bibliothèque de l'Université Laval ;
* Bibliothèque de l'Université Laval ;
* [[École nationale supérieure des mines de Saint-Étienne]] ;
* [[École nationale supérieure des mines de Saint-Étienne]] ;
* Université Claude-Bernard Lyon 1 ;
* Université Claude-Bernard Lyon1 ;
* [[Centre national de la recherche scientifique|CNRS]], laboratoire Creatis ;
* [[Centre national de la recherche scientifique|CNRS]], laboratoire Creatis ;
* Université Pierre et Marie-Curie, LIP6 ;
* Université PierreetMarie-Curie, LIP6 ;
* [[Bibliothèque nationale de France]] ;
* [[Bibliothèque nationale de France]] ;
* [[Institut Géographique National (France)]] (IGN) ;
* [[Institut ]] (IGN) ;
* [[BRGM]].
* [[BRGM]].


== Notes ==
== Notes ==
{{Références|taille=27}}
<references/>

== Bibliographie ==

* ''Les Clés du succès en gestion des métadonnées'', Un Livre Blanc d'Alan Perkins de ASG


== Voir aussi ==
== Voir aussi ==
=== Bibliographie ===
* ''Les Clés du succès en gestion des métadonnées'', un livre blanc d'Alan Perkins de ASG
* Pascal Morisod, ''[http://arbido.ch/fr/edition-article/2017/metadonn%C3%A9es-donn%C3%A9es-de-qualit%C3%A9/donn%C3%A9es-et-m%C3%A9tadonn%C3%A9es-aux-sources-de-linformation-num%C3%A9rique-1 Données et métadonnées, aux sources de l’information numérique]'', revue en ligne [http://arbido.ch/fr/ Arbido], 2017, 3e trimestre.


=== Articles connexes ===
'''Architecture web et interopérabilité'''
* [[Standards et normes de métadonnées]]
* [[Architecture Web]]
* [[Données lisibles par machine]]
* [[Web sémantique]]
* [[Interopérabilité informatique]]
* [[ informatique]]
* [[Élément meta]] (ou métatag)

'''Référentiels'''
* [[Registre de métadonnées]]
* [[Registre de métadonnées]]
* [[Référentiel]]
* [[Dublin Core]] (initié aux États-Unis en [[1995 en informatique|1995]])


=== Liens externes ===
'''Recherches d'information'''
{{Liens}}
* [[Recherche d'information]] ; [[Z39.50]] ; [[ISO 23950]]
* [http://www.bnf.fr/pages/zNavigat/frame/infopro.htm?ancre=journeespro/no-afnor2005.htm Des métadonnées pour bien utiliser les ressources électroniques, sur le site de la BNF]
* [[Exploration de données]] (fouille de données, data mining)
* [http://www.sceren.fr/standards/metadonnees/ Dossier: Les métadonnées, élaboré par le SCÉRÉN]

'''Autres applications'''
* [[Métadonnées et développement durable]]
* [[Gestion des documents d'archives]] ; [[ISO 15489]]
* [[Sécurité des données]]
* [[Alignement stratégique]]

'''[[Union européenne]]'''
* [[MIReG]]

== Liens externes ==
{{trop de liens}}
* {{fr}} [http://www.meta-analysis.fr/ Meta Analysis] Meta Analysis, référentiel de pilotage et dictionnaire de métadonnées
* {{en}} [http://metadata-stds.org/ Metadata standards ISO/CEI JTC1 SC32 WG2]
* {{en}} [http://metadata-stds.org/ Metadata standards ISO/CEI JTC1 SC32 WG2]
* {{en}} [http://dublincore.org/ Site du Dublin Core Metadata Initiative], organisme qui fait la promotion de l'utilisation et de l'interopératibilité des métadonnées
* {{en}} [http://dublincore.org/ Site du Dublin Core Metadata Initiative], organisme qui fait la promotion de l'utilisation et de l' des métadonnées
* {{en}} [http://www.ukoln.ac.uk/ Site de l'UKOLN, United Kingdom Office for Library and Information Networking]
* {{en}} [http://www.ukoln.ac.uk/ Site de l'UKOLN, United Kingdom Office for Library and Information Networking]
* {{fr}} [http://bibliodoc.francophonie.org/article.php3?id_article=172 Dossier sur les métadonnées dans Bibliodoc.francophonie.org]
* {{fr}} [http://www.educnet.education.fr/dossier/metadata/default.htm Métadonnées, normes et standards, dossier sur les métadonnées]
* {{fr}} [http://www.bnf.fr/pages/zNavigat/frame/infopro.htm?ancre=journeespro/no-afnor2005.htm Des métadonnées pour bien utiliser les ressources électroniques, sur le site de la BNF]
* {{fr}} [http://www.sceren.fr/standards/metadonnees/ Dossier: Les métadonnées, élaboré par le SCÉRÉN]
* {{fr}} [http://www.shef.ac.uk/~scgisa/MADAMENew/french/faqfr.htm Questions fréquentes sur les métadonnées]
* {{fr}} [http://209.85.135.104/search?q=cache:x09Y44WTQdkJ:doc.dr15.cnrs.fr/IMG/ppt/metas_05_ARPIST-4.ppt+m%C3%A9tadonn%C3%A9e+%22Exalead%22&hl=fr&gl=fr&ct=clnk&cd=2 Métadonnées et ressources électroniques, CNRS]
* {{fr}} [http://www.theeuropeanlibrary.org/handbook/mdregistry.php Les Métadonnées de la Bibliotheque Europeenne ] Un exemple très interessant de métadonnées .


{{Portail|SIB|informatique}}
{{Portail||informatique}}


{{DEFAULTSORT:Metadonnee}}
[[Catégorie:Gestion des données]]
[[Catégorie:Gestion des données]]
[[Catégorie:Métadonnées]]
[[Catégorie:Métadonnées]]
Ligne 637 : Ligne 490 :
[[Catégorie:Interopérabilité]]
[[Catégorie:Interopérabilité]]
[[Catégorie:Architecture logicielle]]
[[Catégorie:Architecture logicielle]]

[[ar:بيانات وصفية]]
[[az:Metaverilənlər]]
[[bg:Метаданни]]
[[ca:Metadades]]
[[cs:Metadata]]
[[da:Metadata]]
[[de:Metadaten]]
[[el:Μεταδεδομένα]]
[[en:Metadata]]
[[eo:Meta-dateno]]
[[es:Metadato]]
[[et:Metaandmed]]
[[fa:فراداده]]
[[fi:Metatieto]]
[[he:Metadata]]
[[hr:Metapodatci]]
[[hu:Metaadat]]
[[id:Metadata]]
[[it:Metadato]]
[[ja:メタデータ]]
[[kn:ಮೆಟಾಡೇಟಾ]]
[[ko:메타데이터]]
[[lv:Metadati]]
[[ml:മെറ്റാഡാറ്റ]]
[[ms:Metadata]]
[[nl:Metadata]]
[[no:Metadata]]
[[pl:Metadane]]
[[pt:Metadados]]
[[ro:Metadată]]
[[ru:Метаданные]]
[[simple:Metadata]]
[[sk:Metadáta]]
[[sl:Metapodatek]]
[[sr:Metapodaci]]
[[sv:Metadata]]
[[ta:மேனிலைத் தரவு]]
[[th:เมทาดาตา]]
[[uk:Метадані]]
[[ur:Metadata]]
[[vi:Siêu dữ liệu]]
[[zh:元数据]]

Dernière version du 31 août 2024 à 17:46

Le catalogue de la bibliothèque universitaire de Graz en Autriche. La carte présentée renvoie à un texte de Schleimer qui a défini les règles de ce catalogue.

Une métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, électronique ou autre).

Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées géographiques du lieu où elle a été prise.

Les métadonnées sont à la base des techniques du Web sémantique. Elles sont définies dans le cadre du modèle Resource Description Framework (RDF).

Les établissements dont la mission est la gestion de l'information,comme les bibliothèques, archives et musées, ont souvent une longue pratique dans le signalement des contenus ou des documents qu'ils manipulent. Avant l'arrivée de l'informatique, on utilisait des fiches cartonnées dont la structure a été normalisée en 1954 sous la référence ISBD (International standard bibliographic description).

Ces descriptions ont ensuite été informatisées sous la forme de notices bibliographiques et normalisées (voir par exemple les formats MARC en 1964 utilisant la norme ISO 2709 dont la conception a démarré en 1960). Elles facilitent la gestion interne des ressources documentaires et, côté usagers, permettent d'optimiser la recherche et la localisation des documents.

Les bibliothèques numériques ont eu recours aux mêmes dispositifs pour gérer et localiser des documents électroniques. L'échange d'éléments de données extraits de ces notices a rapidement été normalisé au sein des applications distribuées. Puis, en 1988, la Bibliothèque du Congrès, aux États-Unis, proposa un protocole pour la recherche d'information (Z39.50) qui fut revu en 1992.

Le terme métadonnée (en anglais : metadata) est apparu dans le cadre de la description de ressources sur Internet dans les années 1990 et s'est ensuite généralisé.

Généralisation

[modifier | modifier le code]
Le Web sémantique.

Les langages de balisage de type GML, puis SGML et HTML, ont introduit une rupture dans la nature des métadonnées. Auparavant, la distinction entre les fiches, les notices d'une part et les contenus d'autre part, était quasiment absolue. Cette nouvelle structuration de l'information permit d'introduire des métadonnées dans les documents eux-mêmes. Les Communautés européennes adoptèrent le langage SGML dès 1984.

La notion de métadonnées utilisables par les ordinateurs fut proposée assez tôt dans l'histoire du Web, dès 1994, par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Les métadonnées sont en effet au cœur de l'architecture Web[1].

En 1995, les métadonnées firent l'objet d'un atelier à Dublin (Ohio), pour les méthodes de recherche d'information. En parallèle, la bibliothèque du Congrès proposait une 3e version du protocole Z39.50.

En 1999, le W3C définit le cadre permettant de créer un réseau de métadonnées acceptant le langage XML : Resource Description Framework (RDF).

Le tronc commun de métadonnées Dublin Core a été adopté par l'Union européenne en 2002.

Une notion qui concerne tous les organismes

[modifier | modifier le code]

Description

[modifier | modifier le code]

Les notices contiennent des informations sur la source d'un document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote).

Pour un document numérique, ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de ressources informatiques contenant des images ou du son (CD-ROM, DVD-ROM).

Les métadonnées sont, dans le cadre du Web sémantique, des données signifiantes qui facilitent l'accès au contenu informationnel d'une ressource informatique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple).

Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les ressources documentaires :

Les métadonnées sont un élément essentiel de l'architecture Web.

Toutefois, ce serait une erreur de limiter les métadonnées aux ressources numériques de types documents, sons et images : dans les bases de données relationnelles, les métadonnées incluent le nom de chaque table et le type de chaque colonne dans la table.

Une notion essentielle à l'interopérabilité

[modifier | modifier le code]

Les métadonnées correspondent à des marqueurs que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage XML.

Les marqueurs ont pour effet d'améliorer l'efficacité des recherches d'information par rapport aux recherches plein texte.

RDF (Resource Description Framework) crée les conditions d'interopérabilité, avec des réseaux de métadonnées, et l'utilisation du langage XML.

Les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées ou transmises par des messageries électroniques. Ceci s'applique à tous les types de ressources numériques (texte, son, image, multimédia).

Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec les tags, surtout dans le Web 2.0.

Le potentiel des métadonnées est beaucoup plus important, car elles peuvent faire interopérer les ressources informatiques, dans la mesure où elles ont été paramétrées et structurées dans des dictionnaires de données (ou registres de métadonnées). On peut alors faire communiquer les bases de données classiques, utilisées dans les progiciels de gestion intégrés) et les données non structurées (documents, images, manipulés en gestion des connaissances…).

Un impact économique dans tous les secteurs

[modifier | modifier le code]

Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris conscience, en Europe, de la sensibilité de la gestion des métadonnées pour les processus de décision dans les entreprises. Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère stratégique[2]. L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les sources ouvertes.

Les métadonnées concernent tous les secteurs de l'économie à travers la gestion de contenu, puisque tous les organismes gèrent des ressources documentaires sous forme électronique :

Dans l'économie du savoir, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles.

La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.

Différence de perception entre l'Amérique et l'Europe

[modifier | modifier le code]

Selon Robert Steele, expert américain en sources ouvertes, qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la représentation avancée de contexte dans les modèles de contrôle d'accès et les langages de ressources Web actives[3].

En Amérique

[modifier | modifier le code]

Un certain nombre d'équipes impliquées dans la sémantique sur le Web ont organisé un atelier à Dublin (Ohio) en 1995 sur les métadonnées, en définissant le standard Dublin Core.

Différents départements du gouvernement fédéral (DoD…) se sont dotés de registres de métadonnées, qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de souveraineté : défense, justice, environnement…[4]. La Bibliothèque du Congrès, située à Washington, joue un rôle moteur dans la définition des métadonnées aux États-Unis.

Les standards de métadonnées sont l'un des trois éléments clés de la stratégie données en réseau centré (Net-Centric Data Strategy) du département de la Défense des États-Unis, avec les communautés d'intérêt et les services d'entreprise GIG.

Le gouvernement canadien doit se conformer au Dublin Core depuis octobre 2001[5]. Le gouvernement canadien a édicté des lignes directrices pour décrire les métadonnées utilisées dans les ressources Web[6].

Dans l'Union européenne

[modifier | modifier le code]

Au Royaume-Uni, l'UKOLN (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et interopérabilité). Il développe des projets pour la recherche et développement financés par l'Union européenne. Il a une influence sur la réglementation, l'« awareness », la recherche et développement, les techniques Web. Le gouvernement britannique a défini un standard de métadonnées pour le e-gouvernement (e-GMS)

En France, par manque d'information ou de formation à ce propos, relativement peu de webmestres intègrent des métadonnées aux contenus numériques qu'ils publient. La raison est probablement que les métadonnées n'ont pas de valeur juridique normative au niveau européen et dans les États membres (en particulier en France), puisqu'il n'y a pas d'obligation légale, par contre des standards émergent comme le projet d’identifiant européen de la législation (ELI) adopté le par le Conseil de l'Union européenne[7]. Les webmestres introduisent au coup par coup des métaéléments (meta tags, balises meta) dans les pages Web.

Des organismes comme le Commissariat à l'énergie atomique et le CNES (membres de l'association ARISTOTE) emploient des métadonnées pour l'archivage à long terme, en utilisant les recommandations de l'OAIS.

Le projet CORES (Information Society Technologies Programme, European Union) a adopté en 2002 les identifiants uniformes de ressource (Uniform Resource Identifiers, URI) pour l'accès aux ressources Web, en s'appuyant sur des standards de métadonnées[8].

« Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards. »[réf. souhaitée]

Ce groupe de projet a travaillé pour la Commission européenne. Il est composé de personnes appartenant à :

Les classifications étant structurées, il est plus aisé de gérer la traçabilité, d'agréger les données, et de protéger le patrimoine informationnel.

Les métadonnées sont ainsi un élément essentiel du chantier de gestion de contenu en ingénierie des connaissances.

Métadonnées et traçabilité : gestion de la preuve

[modifier | modifier le code]

La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particulière sur les métadonnées (ISO 23081).

Métadonnées et agrégation des données : gouvernance

[modifier | modifier le code]

Dans le domaine de la gouvernance en général (gouvernement, administrations, entreprises), les métadonnées stockées dans des métadictionnaires (ou repository ; référentiels) sont utilisées comme « données sur les données », ou données de référence.

Les métadonnées permettent de décrire les données utilisées dans les analyses et prises de décisions :

Les métadonnées facilitent les analyses croisées dans la gouvernance d'entreprise :

Cadre de référence

[modifier | modifier le code]

Des travaux internationaux convergent pour utiliser « intelligemment » avec le Web les métadonnées avec des moteurs de recherche en décrivant les ressources numériques ou physiques et en établissant des relations avec d'autres ressources.

Mise en œuvre d'un registre de métadonnées

[modifier | modifier le code]

Le pilotage d'organisations complexes (administrations centrales et locales, pôles de compétitivitéetc.) nécessite d'employer des informations d'autorité, qui sont contenues dans des référentiels de métadonnées appelés registres de métadonnées.

Un registre de métadonnées est un « Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la sémantique et la structure de chaque élément. Pour chaque élément, le registre en donne la définition, les qualificatifs qui lui sont associés, ainsi que les correspondances avec des équivalents dans d'autres langues ou d'autres schémas ».

La norme ISO/CEI 11179, dont l'application est fortement conseillée par le gouvernement américain, inclut les recommandations pour la mise en œuvre d'un registre de métadonnées. La partie 6 contient des recommandations organisationnelles. Par exemple, il faut mettre en place, au niveau adéquat, l'organisation qui convient (architectes de données, réseau de correspondants…).

Métadonnées et structuration des données

[modifier | modifier le code]

Métadonnées et contenu des pages web

[modifier | modifier le code]

Le contenu des pages web est structuré à l'aide de balises meta, en langage HTML. Les différentes balises employées permettent de structurer les informations selon différents thèmes (mots-clés, description, auteur, titre, sujet...).

Dans les projets de données ouvertes (open data), l'organisation à but non lucratif The Open Data Foundation se consacre à l'adoption de normes de métadonnées globales et au développement de solutions open source qui utilisent des données statistiques[10].

Métadonnées et validation des documents : DSDL

[modifier | modifier le code]

Le langage XML a été conçu pour faire circuler de l'information porteuse de sémantique sur la Toile. Cette circulation permet de valider progressivement les informations pour en faire de la connaissance partagée entre des communautés de pratique. Partant du DTD de SGML, l'échelle de validation des Document Schema Definition Languages (DSDL) a été mise au point afin de valider les documents électroniques. Dans le cas d'XML, l'emploi de schémas XML permet de faire passer les documents XML du stade « bien-formé » au stade « valide ».

Les outils qui participent à cette validation progressive sont les moteurs de recherche, dont l'optimisation s'appuie largement sur les éléments méta du langage HTML employé pour les pages Web, les moteurs de règle, et les moteurs d'orchestration.

Dans ce processus global, les liens (type d'élément link dans HTML) mettent à jour en permanence les liens entre pages web pour « optimiser » la connaissance.

Par exemple, dans le commerce électronique, à partir d'une organisation en registre de métadonnées, l'utilisation conjointe du registre ebXML et du registre d'annuaires UDDI permet d'organiser une orchestration (en interne aux entreprises) et une chorégraphie (en externe aux entreprises).

Métadonnées et classification : schémas de classification

[modifier | modifier le code]

Les métadonnées constituent des schémas de classification qui permettent de structurer des documents. L'Income Revenue Service[11] et le Dublin Core constituent deux exemples de taxonomies employant des métadonnées. Le Dublin Core trouve son origine aux États-Unis, en 1995 ; il a été adopté par plus de huit gouvernements à ce jour[réf. souhaitée]. C'est la principale initiative visant la convergence des éléments de métadonnées à utiliser. C'est un schéma de métadonnées générique qui peut servir de base à des registres de métadonnées.

Le Dublin Core comprend quinze propriétés de base facultatives et répétables, relatives au contenu (titre, sujet, description, source, langue, relation, couverture), à la propriété intellectuelle (créateur, contributeur, éditeur, gestion des droits) et à l'instanciation (date, type, format, identifiant de la ressource). Le Dublin Core qualifié (qualified Dublin Core) comporte trois éléments supplémentaires (audience, provenance et rightsholder) et différents qualificatifs de raffinement (permettant de préciser les éléments titre, description, date, relation et couverture) et des schémas d'encodage (permettant d'associer la valeur d'un élément à un vocabulaire et une syntaxe contrôlés).

Le Dublin Core pousse à une normalisation dans l'Union européenne, via les données employées dans les systèmes d'information. La Commission européenne emploie donc des métadonnées dans ses livres blancs, sur des sujets pouvant toucher à la souveraineté. Le programme IDABC de la Commission européenne (3e phase du programme IDA), concernant les services d'e-Gouvernement, s'appuie largement sur les métadonnées du Dublin Core. Il a donné naissance au projet MIReG, qui vise à développer un framework de métadonnées, concernant les extensions du Dublin Core aux informations gouvernementales, qui soit basé sur les recommandations nationales sur les métadonnées des informations du secteur public. La directive INSPIRE (2007) incite les États membres et la Communauté européenne à mettre en place des organisations publiques (services de jeux de données), chargées de créer et de mettre à jour les métadonnées (registres de métadonnées), au moins pour ce qui concerne les informations géographiques. Elle devrait faire évoluer le cadre législatif[12].

L'utilisation du Dublin Core doit impérativement s'accompagner d'une organisation en registre de métadonnées. Avant toute mise en œuvre du référentiel, il faut prendre en compte son caractère sensible sur le plan de la protection du patrimoine informationnel et ses contraintes organisationnelles qui y sont liées. C'est la raison pour laquelle le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme ISO/CEI 11179 (partie 6 sur l'enregistrement).

Le moteur de recherche Google s'appuie sur le Dublin Core. La programmation network-centric utilise les métadonnées du Dublin Core. Le système de publication d'OpenWeb[13] est basé sur ce tronc commun.

La norme ISO 15836:2003 est la transposition normative de ce référentiel en version non qualifiée. Elle est utilisée par plus de huit gouvernements dans le monde[réf. souhaitée]. En France, on l'emploie dans la gestion électronique des documents (GED) ou dans les systèmes d'archivage électronique (SAE).

Il n'existe pas de traduction française officielle, complète et unique du référentiel Dublin Core, bien qu'il existe plusieurs guides d'utilisation en français[14]. Il existe un projet de traduction française de la norme internationale Dublin Core (voir site Web de Artist, 16 octobre 2006), mais aucun organisme ne semble en prendre la responsabilité ou le leadership.

Il existe d'autres référentiels de métadonnées :

  • Le standard 5015.2 du département de la défense pour le records management;
  • Open Document Management API (ODMA), très orienté sur les documents électroniques;
  • X500 Green Pages.

Autres référentiels de métadonnées

[modifier | modifier le code]

Bibliothèques

[modifier | modifier le code]

L'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux années 1960, avec le standard MARC développé par la bibliothèque du Congrès.

Le schéma MODS, développé par la Bibliothèque du Congrès, est un compromis entre la complexité de MARC et la simplicité du Dublin Core.

Archivage à long terme

[modifier | modifier le code]

L'archivage à long terme se fait selon le modèle OAIS, avec le schéma XML METS (Metadata Encoding and Transmission Standard). Il est utilisé par le Commissariat à l'énergie atomique et le CNES.

L'IPTC recommande l'utilisation d'un référentiel international de métadonnées spécifique à la presse, IPTC Core.

Cadre général : Web sémantique, RDF

[modifier | modifier le code]

Les métadonnées trouvent leur pleine utilisation dans le Web sémantique. Celui-ci repose sur les standards généraux du Web. Les principaux standards du Web sémantique sont :

Standardisation et normalisation

[modifier | modifier le code]

La quasi-totalité des standards de métadonnées ne sont disponibles qu'en anglais. Les seules normes qui soient disponibles en langue française sont celle sur le Dublin Core (qui en réalité est très courte), et surtout la norme ISO 21127 sur le patrimoine culturel immatériel et matériel.

La normalisation est importante sur différents aspects : la recherche d'information, la structuration d'ontologies dans le web sémantique, et la définition de règles métier.

METS (Metadata Encoding and Transmission Standard) est un schéma XML développé à l'initiative de la Digital Library Federation (DLF), et autorisant la création et la description intégrale (données descriptives, administratives et structurelles) d'objets numériques textuels ou graphiques.

Les normes sur les registres de métadonnées (ISO 11179, complétée par deux autres normes, Dublin Core) définissent les concepts et l'organisation.

En plus de ces normes générales, il existe des normes et standards particuliers à certains domaines :

Risques liés aux métadonnées

[modifier | modifier le code]

Les métadonnées sont utiles à l'interopérabilité, mais leur emploi sans précaution présente des risques. On a déjà souligné que la mise en œuvre d'un registre de métadonnées nécessite de s'appuyer sur la norme idoine (ISO/CEI 11179) et certains experts préconisent d'enlever les métadonnées des documents électroniques[15].

Le plus grand risque serait d'ignorer l'importance des métadonnées, et de ne pas percevoir qu'elles sont largement utilisées dans beaucoup de systèmes informatiques.

Olivier Ertzscheid qualifie d’enclosure algorithmique[16] l'exploitation des métadonnées laissées par les internautes lors de leur navigation sur le web, au moyen d'algorithmes. Dans un contexte d’économie de l’attention, ces métadonnées sont traitées à l’insu des usagers, posant des questions d’ordre juridique[17],[18] et éthique. L’enclosure algorithmique constitue donc une forme de rétention et de détournement des données des usagers, afin de les exploiter commercialement[16],[19]. Cette situation de non transparence informationnelle ne facilite pas les travaux de recherche scientifique, dans la mesure où les métadonnées en question ne sont pas accessibles aux chercheurs[20]. L’exploitation de ces métadonnées conditionne également la recherche en ligne des usagers, qui n’ont pas toujours conscience[21] des logiques marchandes mises en place notamment lors de l'affichage des résultats par les moteurs de recherche. C’est notamment ce qu’Eli Pariser nomme les « bulles cognitives »[22] ou « filter bubble ». L’utilisation des métadonnées s'accroît et se diversifie. Désormais se met en place une véritable création d’opinions par l’exposition de contenus jouant sur l’affect des usagers[16], notamment par les réseaux sociaux où se créent très rapidement des phénomènes viraux[23].

Les métadonnées peuvent être utilisées dans les langages de marquage : SGML, HTML, XHTML.

XML, et ses langages dérivés :

Le langage SKOS, en cours de développement au W3C pour utilisation dans la Communauté européenne, prévoit d'employer des métadonnées dans le cadre RDF en environnement web sémantique.

Le langage Java accepte également les métadonnées[24].

Génération des métadonnées

[modifier | modifier le code]

Les métadonnées peuvent être introduites de façon manuelle, mais aussi semi-automatique, ou automatique[25].

Le concept de métadonnées peut avoir des inconvénients ; un des problèmes est de définir un noyau d'informations standards, l'ensemble des données possibles étant vaste. De plus, les métadonnées peuvent être subjectives et dépendantes du contexte, ce qui rend difficile leur exploitation[26] (par exemple, la donnée « photo prise à 1:00 » dépendra du temps local). Pour les documents multilingues, il faut assurer la traduction des métadonnées, ce qui accroît la complexité et les risques. La création des métadonnées peut donc dans certains cas être consommatrice de temps, ce qui pourrait donc décourager des entreprises (pour des questions d'argent), ou des particuliers (pour des questions de complexité).

Utilisations par types de ressources

[modifier | modifier le code]

Pour un fichier audio numérique, les métadonnées peuvent être utilisées pour nommer, décrire, cataloguer et indiquer la propriété ou le droit d'auteur.

Les métadonnées numériques décrivent des sources. Les métadonnées enregistrées dans une image photographique la caractérisent et lui apportent du sens. Elles garantissent sa traçabilité.

Le langage HTML permet de structurer la nature et le contenu des pages Web. C'est l'utilisation la plus classique. Cependant, les métadonnées ne sont plus véritablement pertinentes pour les moteurs de recherche. En effet, les éléments meta ne sont pratiquement plus pris en considération par la plupart des moteurs de recherche. Google par exemple, ne tient compte que de la meta description et de la meta robots. Cette situation est la conséquence du référencement abusif depuis 1999.

Les bases de données relationnelles utilisent aussi des métadonnées dans les tables.

C'est dans la phase d'alignement stratégique des projets de système d'information, en particulier d'urbanisation, que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information.

Systèmes de fichiers Unix

[modifier | modifier le code]

Les systèmes de fichiers disposent de quelques informations de base sur les fichiers, qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification.

Dans les systèmes UNIX, les droits d'accès (en lecture, écriture et exécution selon l'utilisateur, le groupe, ou les autres) sont des métadonnées sensibles. Ces droits d'accès sont décrits dans ce que l'on appelle les inodes (contraction d'index-node, nœud d'index).

Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'information dans les systèmes de fichiers passe par l'utilisation massive des métadonnées. Certains systèmes de fichiers en cours de développement comme la version 4 de ReiserFS ou WinFS ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les fichiers seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent.

Le principe n'est pas nouveau : le BeOS file system (BFS) était notamment réputé pour son support des métadonnées. Le ressource fork du système de fichiers utilisé par les anciennes version de Mac OS permettait également ce type de gestion.

Fichiers bureautiques

[modifier | modifier le code]

Des formats de fichiers tels que PDF, Word, Excel, le format OpenDocument utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu Fichier > propriétés du document dans l'interface des applications correspondantes.

Le format de document OpenDocument (ou ODF), ouvert, contient des métadonnées dans le fichier meta.xml. Ce format a été recommandé par Bernard Carayon[27] et a été adopté par l'Union européenne.

  • MPEG-7 est une norme de description de contenu qui intègre des métadonnées
  • MPEG-21
  • MXF est un conteneur vidéo. Il permet la prise en charge, dans un même fichier, d'un média vidéo et de ses métadonnées

Les technologies applicables sont PRISM, NewsML (en), et NITF.

Chaque format d'image numérique implémente une façon spécifique de stocker les métadonnées, mais il existe certaines normes communes à plusieurs types, par exemple :

Il y a plusieurs familles de métadonnées pour l'audiovisuel, les métadonnées d'identification destinées au grand public et d'autres destinées à l'univers professionnel de l'audio ou de l'audiovisuel. Les formats de son numérique intègrent des métadonnées :

Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la date de sortie.

Objets numériques

[modifier | modifier le code]

Les métadonnées utilisées pour les objets numériques peuvent être employées dans le cadre de projet muséal ou de bibliothèques virtuelle[28] :

  • METS (Metadata Encoding and Transmission Standard)
  • MODS (Metadata Object Description Schema)

Les familles de métadonnées suivantes sont utilisées dans le cadre de projets pédagogique[28] :

  • CanCore (Canadian Core Learning Object Metadata),
  • GEM (the Gateway to Educational Materials),
  • LOM (Learning Object Metadata) Scheme.

Utilisations par types d'applications

[modifier | modifier le code]

Authentification unique

[modifier | modifier le code]

Lors du rapprochement de deux organisations différentes, il est nécessaire d'harmoniser les règles d'authentification unique entre les deux organisations. Ceci se fait généralement par l'échange des métadonnées qui permettent d'authentifier les individus concernés.

Le projet Interoperability of Data in E-Commerce Systems ou INDECS (compatibilité des données dans les systèmes de commerce électronique) emploie des métadonnées.

Gestion de contenu, gestion électronique des documents

[modifier | modifier le code]

Les applications progicielles de gestion des connaissances ont, dans la gestion de contenu, des fonctions permettant de gérer les métadonnées. À ce titre, elles sont essentielles pour la gestion de la preuve (voir supra).

La norme SCORM d'apprentissage en ligne utilise le schéma de description de ressources d’enseignement et d’apprentissage Learning Object Metadata.

Les outils de gestion électronique des documents peuvent également utiliser des métadonnées pour le classement des documents (voir Classement des documents par type dans la GED).

Gestion des brevets

[modifier | modifier le code]

Les droits de propriété intellectuelle sont l'un des éléments du Dublin Core. Les données sur les brevets peuvent être indexées dans des applications de gestion des brevets ou gestion des actifs novateurs (IPAM, Intellectual Property Asset Management, ou IAM), en utilisant des métadonnées[29].

Les métadonnées permettent d'effectuer des analyses multidimensionnelles, dans les applications de gestion des ressources humaines, finances, gestion de la relation client. À ce titre, elles sont un élément essentiel de la gouvernance d'entreprise (voir supra).

Interfaces de programmation (API)

[modifier | modifier le code]

Les métadonnées peuvent être employées dans les spécifications J2EE du langage de programmation Java, en particulier dans les interfaces de programmation (API). Elles font l'objet de formats d'interface : JMI (Java Metadata Interface), spécifique au langage Java.

XMI (XML Metadata Interchange) est un standard d'échanges de métadonnées UML.

Les logiciels libres utilisent, comme tous les logiciels, des métadonnées. Par exemple, le système de gestion intégrée des documents du gouvernement du Québec emploie des métadonnées avec des composants d'indexation et de stockage.

En France, dans le Cadre Commun d'Interopérabilité du Référentiel Général d'Interopérabilité du programme d'e-Gouvernement ADELE, les technologies du logiciel libre sont représentées par l'intermédiaire de Zope, qui a des capacités à interopérer via le langage DTML (Dynamic Template Markup Language). Ce langage emploie lui-même des métadonnées[30].

Les courriels gérés par les messageries électroniques peuvent véhiculer des métadonnées. Jason R. Baron a fait une étude dans le cadre de l'IEEE en 1999 sur l'archivage des courriels de l'administration américaine[31].

Les standards en monétique et en systèmes de paiements par cartes de crédit comportent des métadonnées[32].

Moteurs de recherche

[modifier | modifier le code]

Les moteurs de recherche peuvent s'appuyer sur des métadonnées pour améliorer les recherches d'information par rapport aux recherches plein texte. Dans les années 1995-1999, on utilisait beaucoup des métaéléments HTML pour optimiser les premiers moteurs de recherche, mais on s'est rendu compte qu'ils n'étaient pas toujours fiables.

Les grands progiciels de gestion intégrés (SAP, Oracle Corporation…) ont des fonctions permettant de gérer les métadonnées. On les appelle quelquefois gestion des données de référence ou Master Data Management (MDM).

Services Web

[modifier | modifier le code]

Les services Web (architecture SOA) compilent de grandes quantités de métadonnées. L'organisation WS-I (Web Services Interoperability) a développé une série de profils pour faire évoluer les futures normes impliquées dans l'interopérabilité des services Web[33].

Les métadonnées servent à plusieurs choses : elles décrivent les formats de message que le service prend en charge et les modèles d'échange de messages valides pour un service, grâce à la spécification WSDL. Les métadonnées décrivent aussi les capacités et les exigences d'un service, grâce à la spécification WS-Policy. Cette dernière forme de métadonnée se nomme la « stratégie » d'un service. Parmi les spécifications qu'utilisent les services web pour les métadonnées, outre WSDL et WS-Policy, il faut citer WS-Security et WS-MetadataExchange[34].

Les « données de connexion » (ou « données techniques de connexion ») sont un type particulier de métadonnée : celles qui sont associées à toute connexion, permettant la traçabilité de conversations ou consultations et pour cette raison concernées comme des données personnelles, mais néanmoins accessibles légalement (plus ou moins selon les époques et les pays) à certaines administrations chargées du Renseignement, à certaines conditions et dans certaines circonstances, par exemple en France dans le cadre du dispositif des « interceptions obligatoires légales » (ou IOL) de surveillance automatisé (« d'écoute ») du réseau Internet en France par les services de la communauté française du renseignement. Pour la justice, elles sont parfois considérées comme des preuves numériques.

Les balises de syndication RSS contiennent des métadonnées.

Systèmes d'exploitation

[modifier | modifier le code]

Les métadonnées sont utilisées dans le système d'exploitation Microsoft Windows Vista, dont les conditions de sécurité sont controversées[35].

Les SGB sont spécialisés depuis les années 1960 (émergence du PC et du format MARC) dans la gestion des métadonnées bibliographiques: notices bibliographiques et notices d'autorités.

Les SGRM définissent des règles métier en employant des métadonnées.

Métadonnées dynamiques et contexte

[modifier | modifier le code]

L'utilisation de métadonnées dynamiques permet de mieux interpréter le contexte.

Voir :

  • [PDF] Managing dynamic metadata as context[36]
  • Dynamic metadata

Les métadonnées sont employées dans les stratégies réseau centré.

Domaines d'application

[modifier | modifier le code]
  • Library of Congress Digital Repository Development Core Metadata Elements[37].

Dans l'industrie de la diffusion télévisée ou du cinéma, les métadonnées attachées aux contenus audio/vidéo sont naturellement indispensables pour :

  • identifier le contenant : le nom du clip, de la playlist, sa durée, son code temporel, etc.
  • décrire le contenu : remarques concernant la qualité des images, description (par exemple, lors d'une compétition sportive, on associera à certains moments des mots comme goal, carton rouge, public…)
  • classer les médias : les métadonnées permettent également un classement ou un tri pour retrouver rapidement des images (un journal télévisé peut, à la dernière minute, nécessiter des images d'archive pour un sujet urgent)

Ces métadonnées ont pu être associés au contenu vidéo grâce à l'avènement des serveurs vidéo durant les dernières années. Les derniers évènements sportifs tels que la Coupe du monde de Football ou les Jeux olympiques utilisent énormément ces métadonnées pour distribuer les contenus à toutes les chaînes de télévision du monde entier via des mots clés. C'est souvent l'organisateur de l'évènement[38] qui est chargé de l'organisation de ses métadonnées via son Centre de diffusion international (International Broadcast Centre) et ses centaines de serveurs vidéos gérant le contenu[39]. Les métadonnées sont enregistrées en même temps que les images et entrées par des opérateurs de métadonnées (loggers) qui visionnent en direct l'évènement sportif et associe les métadonnées disponibles dans des grilles préétablies (via des programmes associés aux serveurs vidéos tels que Multicam LSM ou IPDirector)[40].

En France, les métadonnées sont employées dans le programme ADELE, dans les règles relatives aux Composants Communs[41] et pour l'archivage électronique selon la norme OAIS[42].

DITPR est un référentiel qui permet de déclarer les métadonnées dans le cadre d'architecture DoDAF.

Les nombreuses révélations d'Edward Snowden en 2013 ont démontré l'intérêt des métadonnées et leurs usages par les services de renseignements. Par exemple, le programme ICREACH de la NSA, dont l'existence a été révélée en , contenaient plus de 850 milliards de métadonnées (origine, destinataire, date, localisation, etc.) de communications (courriel, fax, conversations téléphoniques, SMS, messageries instantanées, etc.) en 2007[43],[44]. La NSA a d'ailleurs normalisé le format des métadonnées interceptées, afin d'en faciliter le partage avec la Central Intelligence Agency (CIA), le Federal Bureau of Investigation (FBI), la Defense Intelligence Agency (DIA), la Drug Enforcement Administration (DEA) et les services de renseignements anglo-saxons[43].

En France : projet Solon de dématérialisation de la production normative juridique. Le périmètre défini en 2005 ne concerne que les décrets.

L'Agence de protection de l'environnement des États-Unis (EPA) a défini un langage informatique à base de métadonnées : Ecological metadata language.

  • AgMES sur le site de la FAO
  • AgMES (série d'éléments de métadonnées agricoles).
  • Commerce électronique : le registre ebXML, géré au niveau des Nations unies, utilise des métadonnées.

Le site du Centre pour la communication scientifique directe (CCSD) donne les spécifications des métadonnées pour le référentiel des publications du CNRS : Les métadonnées associées à un dépôt sur HAL.

Données géospatiales

[modifier | modifier le code]

Recommandations et exploration

[modifier | modifier le code]

Pour l'édition numérique, notamment, les métadonnées jouent un rôle important dans « les mécanismes de recommandation et les services d’exploration et de découverte proposés aux usagers »[47].

Organismes francophones ayant des compétences sur les métadonnées

[modifier | modifier le code]

Liste non exhaustive :

Notes et références

[modifier | modifier le code]
  1. Tim Berners-Lee, Metadata architecture.
  2. Robert S. Seiner, Selecting the “Ring” Meta Data to Manage.
  3. Communication de Robert Steele sur le rôle des métadonnées.
  4. Le responsable du chantier DRM (data reference model) du projet FEA du gouvernement fédéral, Michael Daconta, est l'ancien responsable du centre d'excellence sur les métadonnées du département de la Sécurité intérieure[réf. nécessaire]
  5. Norme des métadonnées du Gouvernement canadien en direct
  6. Métadonnées pour décrire les métadonnées du gouvernement du Canada
  7. un nouvel identificateur pour la législation européenne
  8. (en) « Identifying Metadata Elements with URIs — The CORES Resolution) »
  9. « NASA Taxonomy 2.0 », sur nasa.gov via Wikiwix (consulté le ).
  10. Site de l'organisation The Open Data Foundation
  11. Metadata/Taxonomy
  12. La directive 2003/98/CE fournit un cadre pour la réutilisation des informations du secteur public. Les conditions d'application de la directive sont fonction des États membres et des organismes de secteur public.[réf. nécessaire]
  13. Présentation des métadonnées « Dublin Core »)
  14. Projet de traduction française de la norme internationale de métadonnées Dublin Core « Copie archivée » (version du sur Internet Archive).
  15. Content Security Risks sur le site metadatarisk.org
  16. a b et c Olivier Ertzscheid, « Usages de l’information numérique : comprendre les nouvelles enclosures algorithmiques pour mieux s’en libérer », Revue française des sciences de l’information et de la communication, no 6,‎ (ISSN 2263-0856, DOI 10.4000/rfsic.1425, lire en ligne, consulté le )
  17. « La Cour de justice européenne choisit de protéger les données personnelles », sur enssib.fr (consulté le )
  18. « CURIA - Documents », sur curia.europa.eu (consulté le )
  19. Marc Ménard, « Systèmes de recommandation de biens culturels », Les Cahiers du numérique, vol. 10, no 1,‎ , p. 69–94 (ISSN 1622-1494, lire en ligne, consulté le )
  20. Dirk Lewandowski et Nadine Höchstötter, « Mesurer la qualité des moteurs de recherche Web », Questions de communication, no 14,‎ , p. 75–93 (ISSN 1633-5961, DOI 10.4000/questionsdecommunication.672, lire en ligne, consulté le )
  21. InternetActu.net, « Internet ne nous séduit pas seulement par ses contenus, mais par sa structure », sur InternetActu.net (consulté le )
  22. Frédéric Joignot, « Sur Internet, l’invisible propagande des algorithmes », Le Monde.fr,‎ (ISSN 1950-6244, lire en ligne, consulté le )
  23. « Combien de likes pour rétablir la peine de mort ? », sur affordance.info (consulté le )
  24. Voir : Liste des JSR sur l'interopérabilité informatique
  25. Voir : [PDF] Propagation de métadonnées par l'analyse des liens ; Toward a metadata generation framework
  26. Vipul Kashyap et Amit Sheth, Semantic Heterogeneity in Global Information Systems : The Role of Metadata, Context and Ontologies, (lire en ligne)
  27. [PDF] Rapport À armes égales de Bernard Carayon, 2006
  28. a et b (en) Gordon McKenna, Chris De Loof, « Report on existing standards applied in European museums », Athena,‎ (lire en ligne)
  29. Dan Bolita,Intellectual assets--Corporate value moves from top minds to bottom linesa price on (what's in) your head
  30. Zope - Configuring the Metadata Tool
  31. Voir : la présentation qu'il fait pour l'US National Archives and Records Administration :ERPA Workshop Antwerp, 15 avril 2004
  32. exemple[réf. à confirmer]
  33. Web Services Specifications : Registry And Metadata, 28/12/2006 « Copie archivée » (version du sur Internet Archive)
  34. Luis Felipe Cabrera, Christopher Kurt, Don Box, Introduction à l’architecture de services Web et ses spécifications WS
  35. Joris Evers,Gartner s'inquiète des métadonnées dans Windows Vista
  36. Managing dynamic metadata as context
  37. https://www.loc.gov/standards/metadata.html
  38. organisateur de la Coupe du Monde
  39. IBC
  40. utilisation des mots-clés pendant les jeux d'été
  41. site de la DGME, règle C73
  42. site de la DGME
  43. a et b (en) Ryan Gallagher, « The Surveillance Engine: How the NSA Built Its Own Secret Google », The Intercept,‎ (lire en ligne)
  44. Damien Leloup et Grégor Brandy, « Surveillance : la NSA a créé son propre « Google » », Le Monde,‎ (lire en ligne)
  45. Environmental metadata gateway
  46. EIONET
  47. Benoît Epron et Marcello Vitali-Rosati, L’édition à l’ère numérique, Montréal, Éditions La Découverte, , 114 p. (ISBN 978-2-348-03643-9, lire en ligne), p. 53

Bibliographie

[modifier | modifier le code]

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]