Figoblog Un blog sur Internet, la bibliothéconomie et la confiture de figues

Le mapping ultime

Dans ce communiqué de presse, est annoncée la naissance d'une initiative ambitieuse : Vocabulary mapping framework.
Il s'agit d'une extension des travaux de rapprochement entre les RDA et ONIX, visant à rendre intéropérables les principaux standards de métadonnées descriptives : Dublin Core, Onix, RDA, MARC21, DOI, FRBR, LOM, etc.
La méthode proposée : réaliser un mapping universel permettant de créer des passerelles (crosswalks) entre ces vocabulaires afin de faciliter les transformations d'un format à un autre. Les mappings seront exprimés en RDF/OWL. Ce résultat est attendu pour le 9 novembre 2009, où il sera formellement présenté lors d'une conférence à la British Library.
Les étapes suivantes envisagées sont la génération automatique de mappings entre n'importe quelle paire de formats, et l'existence d'un site qui permettra de maintenir et de faire évoluer les conversions.
Derrière le projet, on trouve le DOI, la British Library et le JISC (entre autres).

Mon avis personnel : le projet n'est pas seulement ambitieux, mais un petit peu délirant. J'ai beau croire fort dans les technologies du Web sémantique, pas sûr qu'elles permettront de résoudre tous les problèmes de mappings en 6 mois.
Et puis :
- est-ce que cela a vraiment un sens de faire un mapping absolu, indépendamment de la nature et de la spécificité des données et de la façon dont chaque format est implémenté ?
- n'y a-t-il pas un peu à boire et à manger dans la liste de métadonnées ci-dessus (des formats, des modèles conceptuels, des vocabulaires, des systèmes, etc...)
- enfin quel est l'intérêt du DOI (et de l'IDF, International DOI Foundation) pour soutenir un tel projet : le revendre ? vendre les résultats ? vendre le service ? rendre plus de gens dépendants du DOI ? mettre le DOI au centre du monde (ce petit monde qu'est le milieu de l'informatique documentaire) ?

A suivre de très près.

Par Manue le 22 juin, 2009 - 22:13 dans

Commentaires

On se posait les mêmes questions avec Unicode, et ça a marché. Pourtant, il a fallu prendre en compte des encodages plus nombreux et plus hétérogènes encore. Espérons que les gens de l'IDF sont de ce niveau : il leur faudra quelques compétences techniques, mais surtout diplomatiques.

23 juin, 2009 - 09:02 — Xavier Cazin (non vérifié)

Il existe une différence de taille entre unicode et cette initiative : le but poursuivi par les différents encodages de caractères est le même alors que les différents modèles/formats/schémas pour exprimer des métadonnées descriptives ont des buts légèrement différents (dans ce domaine, le diable se cache dans les détails).

C'est tout simplement irréalisable, d'autant qu'il existe au sein d'une communauté qui utilise un de ces formats des façons différentes de l'utiliser.

23 juin, 2009 - 09:35 — Gautier (non vérifié)

Bof. Je trouve au contraire qu'il est plus que temps de s'intéresser aux transformations d'un schéma vers les autres plutôt que d'obliger tout le monde à connaître (mal) tous les schémas.

Un format pivot est idéal pour cela et ensuite, pondre 9 x 2 = 18 transformations, ce n'est pas la mort pour des gens qui connaissent XSLT, et il doit en exister encore :-)

23 juin, 2009 - 22:02 — Xavier Cazin (non vérifié)

Effectivement, un schéma donné peut être utilisé sémantiquement de plusieurs façons (contrairement à ce qui est dit sur l'Unicode), disons avec des variantes. Une telle transformation donnerait alors parfois d'étranges résultats, mais pas forcément plus étrange que l'utilisation du schéma initial.
Peut-être une tentative pour définir un ensemble temporairement universel de métadonnées... :)

29 juin, 2009 - 10:36 — Frédéric Zgud (non vérifié)

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <blockquote><img>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • Insert Flickr images: [flickr-photo:id=230452326,size=s] or [flickr-photoset:id=72157594262419167,size=m].

Plus d'informations sur les options de formatage

Mollom CAPTCHA (jouer CAPTCHA audio)
Tapez les caractères que vous voyez dans l'image ci-dessus : si vous ne n'arrivez pas à les lires, soumettez le formulaire, une nouvelle image sera générée.
Design Figoblog 2008 - Image from http://www.europeana.eu - http://photo.rmn.fr : Codex Vindobonensis, series nova 2644: folio 4 verso