Métadonnée
Gelose | Tous les portails | Portail Medecine | Portail Biologie | Portail Biochimie | Portail Microbiologie | Portail Ecologie | Portail Botanique | Biologie cellulaire | Portail Zoologie | Science de la terre | Portail Eau |
Inscrivez votre site en haut de cette page Soumission direct par Allopass, obtenez 1 lien de qualite en haut de cette page Metadonnee ainsi que sur la page des nouveaux sites inscrits pour seulement 20 euros!
|
Une métadonnée (du grec meta "après" et du latin data "informations") est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).
[] Une notion qui concerne tous les organismes
[] À l'origine, une utilisation dans les bibliothèques numériques
Dans les médiathèques, on a pris l'habitude d'utiliser des notices bibliographiques pour décrire le contenu et les aspects formels d'un document. Elles facilitent la gestion interne des ressources documentaires et, côté usagers, permettent d'optimiser la recherche et la localisation des documents électroniques.
Ces notices contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, cédérom, dévédérom, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote).
[] Description
Pour un document numérique, ces notices s'appellent des métadonnées et sont contenues dans le document lui-même.
Les métadonnées servent à vulgariser le contenu informationnel d'un document électronique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple).
Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les ressources documentaires :
- Contenu : titre, sujet, description, source, langue, relation, couverture.
- Propriété intellectuelle : auteur, éditeur, contributeur, droits (droits d'auteur,...).
- Matérialisation : date, type, format, identifiant.
[] Tous les secteurs de l'économie sont concernés
Pour un ensemble de raisons, tant historiques que juridiques, la gestion des métadonnées n'est pas véritablement entrée dans les préoccupations des entreprises en Europe.
Les métadonnées concernent tous les secteurs de l'économie, puisque tous les organismes gérent des ressources documentaires sous forme électronique :
- Administrations centrales et territoriales,
- Entreprises,
- Universités et grandes écoles,
- Centres d'études et de recherches,
- Médiathèques.
Dans l'économie de l'immatériel, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles.
La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.
[] En gestion électronique de documents et en ingénierie des connaissances
[] Différence de perception entre l'Europe et les Etats-Unis
Dans l'Union européenne
Par manque de formation ou d'information à ce propos, peu d'utilisateurs et de webmestres intègrent des métadonnées aux contenus numériques qu'ils publient. En conséquence, on ne fait pas ou peu de recherches structurées en fonction des métadonnées avec les moteurs de recherche. La raison est probablement que les métadonnées n'ont pas de valeur juridique normative au niveau international (pas d'obligation légale), ni en France.
Aux États-Unis
La sensibilisation est très supérieure, en raison d'une législation plus stricte, notamment sur les assurances, de sorte que l'ingénierie des connaissances y est plus développée Par ailleurs, il faut signaler que les métadonnées peuvent décrire des règles et contraintes sur les données. Il existe un ensemble de normes sur la gestion des documents d'archive (records management). L'une de ces normes concerne l'utilisation des métadonnées.
Voir dans la Wikipedia anglophone :
- General IT metadata,
- Catégorie medata, sur l'importance accordée aux métadonnées aux États-Unis.
[] Travaux en cours
Les normes sur la gestion des documents d'archive sont, avec d'autres types de normes, utiles afin de structurer des architectures cohérentes de systèmes d'information et de gestion des connaissances, en particulier sur le cycle de vie des documents, depuis l'élaboration des contrats jusqu'à la comptabilisation. La normalisation des comptabilités avec IAS/IFRS dans le cadre de l'économie de l'immatériel rend cette problématique stratégique.
Sur Internet, il n'existe pas encore de moteur de recherche (en tout cas gratuit ou libre d'accès) qui sache utiliser « intelligemment » ces données, mais des travaux et des volontés convergent dans ce sens. La principale est le Dublin Core qui est une initiative dédiée à ces questions depuis 1995. Les métadonnées ont une valeur ajoutée certaine et seront sûrement normalisées (type ISO) à terme.
En effet, des moteurs de recherche dédiés à la lecture et au décryptage sémantique de ces données permettraient une optimisation et une efficacité accrue des recherches d'information opérées par un internaute ou une machine sur le Web.
La valeur ajoutée de cette solution technique repose sur un mode de requêtage qui écarte les informations parasites (le bruit documentaire) et réduit simultanément les silences documentaires (les informations pertinentes existantes mais non rapportées).
C'est de plus un moyen pour mettre en place un web sémantique par une optimisation des méthodes et moyens appliqués à la recherche d'information et de documentation dans un système d'information donné :
- ne rendre visibles et lisibles que les informations pertinentes pour l'utilisateur (avec indice de pertinence).
- diminuer les risques de désorientation liées à un déluge d'information (nombre de réponses non pertinentes rapportées à la question posée qui peuvent faire dériver l'internaute) comme c'est le cas aujourd'hui.
Par ailleurs, cela permettrait d'opérer des recherches plein texte différentes sur le Web, comme avec les logiciels utilisés par les bibliothèques.
[] Utilisation des métadonnées pour la prise de décision dans les grandes entreprises
[] Métadonnées dans la gouvernance d'entreprise
Dans le domaine de la gouvernance d'entreprise, les métadonnées stockées dans des métadictionnaires (ou repository ; référentiels) sont utilisées comme « données sur les données », ou données de référence.
Les métadonnées permettent de décrire les données utilisées dans les analyses et prises de décisions :
- la définition exacte des données (sémantique)
- la source des données (date, origine)
- la façon dont elles sont calculées, agrégées, ... (règles de calcul)
- les règles métier qui s'y rapportent
- le processus d'extraction, transformation et chargement (voir ETL) qui a été mis en œuvre.
Les différents types de systèmes de gouvernance d'entreprise rencontrés sont :
- Les tableaux de bord de gestion et l'informatique décisionnelle (entrepôts de données et datawarehouse) : dans ce cas, les outils d'extraction et de gestion des métadonnées sont répertoriés dans la liste d'outils décisionnels.
- Les tableaux de bord prospectifs, encore peu employés en France.
[] Gestion des métadonnées dans les systèmes de fichiers
Les systèmes de fichiers disposent de quelques informations de base sur les fichiers, qui sont à ce titre des métadonnées. Les principales sont le nom du fichier, sa taille, la date de création et de dernière modification.
Dans les systèmes UNIX, les droits d'accès (en lecture, écriture et exécution selon l'utilisateur, le groupe, ou les autres) sont des méta-données sensibles (voir infra).
Il semblerait que l'avenir de la localisation, de la lecture-repérage et de la collecte d'information dans les systèmes de fichiers passe par l'utilisation massive des métadonnées.
Certains systèmes de fichiers en cours de développement comme la version 4 de ReiserFS ou WinFS ont pour objectif de rendre la recherche des fichiers plus simple et plus intuitive, et les métadonnées permettent d'y arriver. Tous les fichiers seront donc pourvus de métadonnées permettant de savoir ce qu'ils contiennent.
Il faut noter que le principe n'est pas nouveau : le BeOS file system (BFS) était notamment réputé pour son support des métadonnées. Le ressource fork du système de fichiers utilisé par les anciennes version de Mac OS permettait également ce type de gestion.
[] Utilisation des métadonnées dans l'informatique distribuée
[] MP3
Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la date de sortie.
[] Fichiers graphiques
Chaque format implémente une façon spécifique pour stocker les métadonnées, mais il existe certaines normes communes a plusieurs types : par exemple le standard EXIF est utilisable à la fois dans les fichiers JPEG ou TIFF, et le standard XMP est intégrable à une douzaine de types de fichier différents (JPEG, JPEG 2000, TIFF, GIF, PNG, etc.).
[] Fichiers bureautiques
Des formats de fichiers tels que PDF, Word, Excel, ou OpenOffice.org utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu Fichier > propriétés du document dans l'interface des applications correspondantes.
[] Métadonnées et protection du patrimoine informationnel
Les métadonnées sont essentielles pour certifier et qualifier le contenu des bases de données, et donc conforter les analyses effectuées à partir des données.
C'est dans la phase d'alignement stratégique des projets de système d'information, en particulier d'urbanisation, que l'on est amené à étudier comment les données de sécurité se positionnent dans l'architecture de données des systèmes d'information, qui est largement définie par quelques méta-données décrivant le contenu des documents, essentiellement situées dans le titre et le sujet (client, produit / service, fournisseur, contrat, compte). Une telle étude permet de déterminer le profil de protection correspondant le mieux aux besoins de sécurisation de l'organisme.
La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particulière sur les méta-données (ISO).
Dans les systèmes UNIX, les métadonnées qui permettent de gérer les droits d'accès aux systèmes de fichiers sont décrites dans ce que l'on appelle les inodes (contraction d'index-node, noeud d'index).
[] Normalisation
La norme ISO/IEC 11179 est une norme pour la représentation des métadonnées d'une organisation dans un registre de métadonnées.
[] Voir aussi
- Gestion des documents d'archives ; ISO 15489
- Urbanisation (informatique)
- Structure de données
- Sécurité des données
- Alignement stratégique
[] Liens externes
- (en) The Dublin Core Metadata Initiative est un organisme qui fait la promotion de l'utilisaton et l'interopératibilité des métadonnées
- (en) David Marco
- (fr) Métadonnées, normes et standards, dossier sur les métadonnées
- (fr) Des métadonnées pour bien utiliser les ressources électroniques, sur le site de la BNF
- (fr) Dossier: Les métadonnées, élaboré par le SCÉRÉN
| Portail de l'informatique – Accédez aux articles de Wikipédia concernant l’informatique. |