Photos numériques: présentation des métadonnées

Avec la photo numérique est apparu un nouveau vocabulaire. Les métadonnées, et les acronymes EXIF et IPTC en font partie. Ils constituent également un excellent exemple de technologie dont on parle depuis longtemps, sans disposer pour autant, d’outils réellement efficaces pour les exploiter. Aujourd’hui ce n’est plus le cas: les logiciels grand public offrent un support complet et satisfaisant de ces informations.
Voici donc un bref rappel de ce que sont les métadonnées, et comment les utiliser.

Méta données

Définissons d’abord le mot métadonnée: Une métadonnée est une information ou un ensemble d’informations sur une donnée ou une ressource. Si l’on considère une image ou une photo comme une ressource, les métadonnées de cette image sont donc des informations la décrivant.

Dans le domaine de la photo numérique, les deux modèles de métadonnées qui reviennent le plus souvent sont EXIF et IPTC. Ils sont universellement utilisés, reconnus, et peuvent donc être considérés comme des standards de fait.

EXIF

Le format EXIF (EXchangeable Image File) a été élaboré en 1995, par un organisme japonais, le JEIDA ( Japan Electronic Industry Development Association ). L’objectif de ce format est de donner les informations techniques de prise de vue (équipement, vitesse, ouverture, utilisation du flash, …).
On y trouve également des informations de géo-localisation.

Le format a évolué jusqu’à la version 2.2, sortie en 2002. En l’absence d’une organisation de standardisation capable de le soutenir, le format n’est plus maintenu. Il est cependant utilisé par la quasi-totalité des constructeurs d’appareils photos.

Les champs EXIF sont très nombreux. Le tableau ci-dessous donne un exemple des champs EXIF enregistrés par un Canon 40D. Vous pouvez trouver la liste complète de ces champs sur le site exif.org.

EXIF MakerNotes
FileName IMG_5773.CR2 MacroMode Normal
Make Canon SelfTimer 10 s
Model Canon EOS 40D Quality RAW
Orientation Horizontal (normal) CanonFlashMode External flash
ExposureTime 1/125 ContinuousDrive Single
FNumber 8.0 FocusMode One-shot AF
ApertureValue 8.0 RecordMode CR2
ExposureProgram Manual Contrast Normal
ExposureMode Manual Saturation Normal
ISO 200 MeteringMode Evaluative
ExifVersion 0221 FocusRange Not Known
DateTimeOriginal 2008:09:30 07:50:49 CanonFirmwareVersion Firmware Version 1.0.3
CreateDate 2008:09:30 07:50:49 LensType Canon EF-S 17-55mm f/2.8 IS USM
ExposureCompensation 0 LongFocal 55 mm
MeteringMode Multi-segment ShortFocal 17 mm
Flash On FocalUnits 1
FocalLength 31.0 mm MaxAperture 2.8
ColorSpace sRGB MinAperture 23
ExifImageWidth 3888 FlashActivity 141
ExifImageHeight 2592 FlashBits E-TTL, External
BitsPerSample 8 8 8 MeasuredEV 6.00
WhiteBalance Auto FocusDistanceUpper 2.18
SceneCaptureType Standard FocusDistanceLower 1.87
GPSVersionID 2.2.0.0 ColorTemperature 5200

IPTC

Un peu d’histoire

L’International Press Telecommunications Council (IPTC), est un consortium regroupant la plupart des agences de presses du monde. Fondée en 1965, ses objectifs sont de développer, maintenir et promouvoir des standards d’échange des données dans le domaine de la presse et du journalisme.

Avec l’aide d’autres associations, telles que la NAA (Newspaper Association of America), le consortium a défini un modèle de données appelé IPTC-NAA. Ce modèle a ensuite évolué, portant le nom de IIM (Information Interchange Model). La version 4 apparue en octobre 1997 est appelée IIMV4.

La société Adobe s’est appuyé sur ce standard pour définir son propre modèle, destiné à son logiciel PhotoShop. Apparu en 2001, le modèle XMP est une amélioration notable du modèle standard. Il reprend les champs de IIM, en ajoute d’autres, et offre beaucoup plus de souplesse:

  • La taille des champs n’est plus limitée,
  • Le multilinguisme est géré, ainsi que les accentuations (unicode),
  • Le modèle est extensible.

Pour faire évoluer le standard IIM obsolescent, l’IPTC et Adobe ont crée un groupe de travail appelé IPTC for XMP (ITPC4XMP). En 2005, ce groupe de travail donne naissance au modèle IPTC Core 1.0, chargé de remplacer les modèles existants basés sur IIM.

Basé sur XMP, IPTC Core 1.0, reprend la plupart des champs définis par IIM, et en ajoute de nouveaux, pour une meilleure description du contenu (Intellectual Genre, IPTC Scene), et la gestion des droits (Rights Usage Terms). Certains champs disparaissent, comme Category et subCategory.

C’est le modèle IPTC Core 1.0 qui est aujourd’hui utilisé par la plupart des logiciels du marché, qu’ils soient commerciaux ou open source.

Le consortium IPTC vient de publier en juillet 2008, la version 1.1 intitulée IPTC Photo Metadata 2008. Cette version complète simplement les champs de la version 1.0, avec des informations liés aux personnes ou sujets photographiés (personnes figurant sur l’image, âge, …).

Les champs

La gestion des métadonnées IPTC par les logiciels, ne me semblait pas très claire jusqu’en 2006/2007. Tous les logiciels n’utilisaient pas le même modèle (IIM / XMP), et n’utilisait pas non plus les mêmes conventions pour les noms des champs.

Depuis 2006, les choses évoluent positivement: la plupart des logiciels se basent sur le modèle IPTC Core 1.0, et les conventions de nommage sont les mêmes (ou presque). Nous n’avons donc plus trop à nous poser de questions concernant les champs à utiliser, ne pas utiliser …

Pour garder une certaine compatibilité avec le modèle IIM, et leurs versions antérieures, certains logiciels conservent toutefois des champs et des noms de champs, qui sont obsolètes aujourd’hui.

Le tableau suivant présente la plupart des champs du modèle IPTC Core 1.0:

Description de l’image
Date Created Date de création Attention, existe déjà dans les champs EXIF
Intellectual genre (1) domaine Description du sujet traité (pas forcement du contenu)
Scene code (1) Scene Description de la scène figurant sur la photo (exemple: actualité, interview, rétrospective, …)
Sublocation / Location Lieu / Emplacement Lieu de prise de vue
City Ville
Province or State Région
Country Pays
Country code Code du pays 2 à 3 caractères. Les codes sont normalisés – ISO 3160
Description du contenu
Headline Titre principal
Entête
Ce champ peut-être considéré comme une description ou un sous-titre.
Description Description Description de la photo
Keywords Mots-Clés Champ libre permettant une description précise de la scène
Subject Code (1) Rubrique Classification du sujet (exemple: Police/Arrestation, Finances/Banque, Médias/Cinéma …). Peut-être comparé aux rubriques d’un journal.
Description Writer Auteur de la description
Status
Title Titre du document Titre principal
Job Id Identifiant de la tâche
Instructions Instructions Champ libre
Provider / CreditLine Fournisseur
Source Source
Copyright Notice Mentions légales Copyright © – 2008 – Emmanuel GEORJON
Rights Usage Terms Conditions d’utilisation License Creative Commons NA-BY-…
Contact
Creator Créateur
Creator’s jobtitle Fonction du créateur
Address Adresse Coordonnées du créateur
City Ville
Country Pays
Email address(es) Adresse de messagerie
Phone number(s) Numéro de téléphone
Postal Code Code postal
State/Provice Région
Web URL(s)

(1) Les codes sont nomenclaturés. Les listes sont disponibles sur le site de l’IPTC

Ou sont stockées les métadonnées

Les balises EXIF sont de type interne: elles sont systématiquement stockées dans l’image. Pour les informations IPTC, les choses sont un peu plus compliquées: Dans le cas des fichiers JPEG, elles sont internes. Dans le cas des fichiers RAW, elles sont souvent stockées dans un fichier annexe, pourtant le même nom que la photo, mais suffixé différemment, l’extension souvent rencontré étant XMP.

Lorsque vous effectuez des opérations sur des fichiers RAW, veillez bien à ce que les fichiers XMP s’il y en a, suivent les fichiers « image ».

Concurrents ou complémentaires

Le début de cet exposé sous-entend que les balises EXIF sont dédiées aux informations techniques de la prise de vue, tandis que les balises IPTC permettent une description sémantique du contenu de la photo.

Cette affirmation est plus ou moins vraie: certains champs EXIF permettent de décrire la photo (Exif ImageDescription, Exif Artist, Exif Copyright …).
De même, les champs IPTC permettent de définir des dates de prises de vue, alors que ces informations sont déjà stockées dans le modèle EXIF.

Jusqu’à l’apparition de l’IPTC Core 1.0 en 2005, nous pouvions éventuellement considérer les deux modèles comme concurrents.
Aujourd’hui, ce n’est plus le cas: l’IPTC offre des fonctionnalités bien supérieures à EXIF pour la description du contenu.

  • Les balises EXIF décrivent uniquement les données techniques de la prise de vue. Ces informations sont créées lors de la prise de vue par l’appareil photo, et ne doivent plus être modifiées par la suite. Les seules exceptions concernent des champs comme l’orientation, qui peuvent changer lorsque l’on effectue une rotation des clichés,
  • Les balises IPTC sont dédiées à la description du contenu de l’image, et sont complétées manuellement.

A quoi servent les métadonnées

Concernant les balises EXIF, l’utilité est évidente: le photographe disposant de toutes les informations de prise de vue, il peut

  • corréler la qualité et les paramètres de la prise de vue, ce qui constitue un formidable outil d’apprentissage,
  • identifier les clichés dans des cas spécifiques, comme l’utilisation du braketing.

Ces informations servent également à certains logiciels de développement (dérawtisation) tels que DxO par exemple, pour identifier le matériel utilisé.

Si vous avez l’habitude de consulter régulièrement des galeries photos ou des forums tels que Passion-Photo, prenez le temps de consulter les EXIF des clichés proposés. Cela permet de comprendre ce qui fait une bonne ou une mauvaise photo dans beaucoup de situations différentes.

Si vous êtes un utilisateur de Firefox, vous pouvez installer l’extension FxIF qui donne accès à ces informations via le menu « propriétés ».

Le rôle des balises IPTC est moins technique: elles permettent de mieux gérer les photos. Un simple classement par répertoire ne suffit pas à classer efficacement des photos. Aussi élaborée qu’elle soit, une arborescence de répertoire ne permet pas de classements multicritères.
Les balises IPTC servent donc à décrire une photo selon de multiples paramètres: le lieu, l’évènement, le sujet, l’auteur, le reportage … Dans le cas des fichiers JPEG, les informations étant stockées dans le fichier, elles sont définitivement associées à l’image.
Il ne reste plus ensuite qu’à « indexer » les photos, en utilisant un logiciel capable de lire les balises IPTC, et de les stocker dans une base de données.

Les outils

Quasiment tous les outils savent aujourd’hui lire les données EXIF, qu’il s’agisse de visionneuses ou d’outils d’édition. Pour les données IPTC, les choses sont un peu plus compliquées. Globalement, nous pouvons rencontrer 3 cas:

  1. Compatibilité totale avec la norme IPTC Core 1.1: Tous les champs sont correctement identifiés, et bien utilisés (cas de Photoshop)
  2. Compatibilité IPTC Core et IIM: Tous les champs sont présent, mais parfois mal identifiés pour rester compatible avec le modèle IIM. Certains champs déclarés obsolètes sont toujours accessibles (catégory, urgency …)
  3. Compatibilité partielle: tous les champs de l’IPTC Core ne sont pas présents.

L’utilisation des logiciels des catégories 1 et 2 semble évidente.

Conclusion

L’utilisation des métadonnées est un excellent moyen pour l’indexation des photos. Elle permet une classification, un tri ou des recherches selon plusieurs critères. Il faut saluer les différents éditeurs de l’effort de standardisation effectué. La plupart des logiciels aujourd’hui se basent sur les mêmes conventions, ce qui n’était pas encore le cas il y a 2 ans.

Références

Autres articles de cette série

  1. Photos numériques: Utilisation des métadonnées (28 octobre 2008)
  2. Photos numériques: convention de nommage (17 octobre 2008)
  3. Photos numériques: présentation des métadonnées (10 octobre 2008)
  4. Photos numériques: Organisation des répertoires (5 octobre 2008)
  5. Evaluation et sélection des photos numériques (2 octobre 2008)
  6. Processus de gestion des photos numériques (nouvelle version) (28 septembre 2008)
  7. Processus de gestion des photos numériques (2 septembre 2008)
  8. Photos numériques: le stockage (15 août 2008)
  9. Gestion des photos numériques (10 août 2008)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *