Figoblog Un blog sur Internet, la bibliothéconomie et la confiture de figues

identifiants

Retour sur les identifiants

Les identifiants pérennes, mes chers identifiants, semblent revenir un peu à la mode ces derniers temps - peut-être une impression due au fait que j'ai eu l'occasion de m'y replonger profondément.

Ainsi en réécoutant les interventions du DDC workshop de juin sur ce thème, j'ai pu constater que pas mal de chemin a été fait dans la réflexion sur les identifiants et que la polémique a encore de beaux jours devant elle. Des anciennes croyances ont été pulvérisées, et de nouvelles créées.

(NB : attention la plupart des liens qui suivent pointent vers des fichiers powerpoint.)

Je dirais que la première révélation de ce workshop, c'est que la pérennité des identifiants n'a rien de technique. Il a été affirmé, répété et même proclamé haut et fort qu'aucun schème d'identifiants, qu'il s'agisse de DOI, Handle, ARK, PURL ou n'importe quoi d'autre, n'aide en quoi que ce soit à la pérennité. La pérennité n'est pas une question technique, c'est une question organisationnelle et institutionnelle, ainsi qu'une question de modèle économique et de financement. Donc si votre principal problème était de savoir quel schème choisir, faites d'emblée un trait sur la pérennité comme critère.

Face à cette assertion très généralement admise, plusieurs positions apparaissent.
Il y a ceux qui ne veulent pas mettre tous leurs oeufs dans le même

Par Manue le 22 mars, 2006 - 21:55 dans

Encore des numéros

Parce que les URIs, les ISSN, les ISBN et autres ne suffisent pas, des gens ont décidé de créer encore des numéros :

  • les ESBN pour les monographies électroniques,
  • les IBSN pour les blogs.

Le premier s'annonce comme un "DRM & copyright solution" et il est à peu près impossible, comme le remarque Catalogablog , de savoir qui est réellement derrière cette idée. Ce qui n'a pas empêché notre ami David Bigwood d'en prendre un... puisque c'est gratuit.

Le second semble émaner d'une frustration de la part de blogueurs espagnols qui n'ont pas réussi à obtenir un ISBN, et dispose d'un mode d'attribution assez original puisqu'on choisit soi-même son numéro, pourvu qu'il ne soit pas déjà attribué. L'IBSN commence à faire des émules sur quelques blogs francophones : Zaphir et Doc en Vrac.

On pourra lire ici quelques réflexions sur l'idée originale que 2006 sera l'année des identifiants uniques. C'est pas pire que celle du Web 2.0... ou d'autre chose...

Pour ma part, je vais me contenter de mes URLs et m'arranger pour qu'elles ne changent pas.

Mise à jour :

Belle synchronisation involontaire avec Vagabondages.

Par Manue le 13 février, 2006 - 21:47 dans

Des identifiants gentils avec les gens

J'en ai déjà parlé avec Coins, mais j'y reviens car le principe devient un peu plus clair dans ma tête. Il s'agit de rendre des identifiants (pérennes) actionnables à l'aide d'un agent, user agent disent-ils en anglais, et de HTML.

Voici le problème : en général, les identifiants pérennes ont l'avantage de transporter plein d'informations utiles avec eux, ou de sous-entendre cette information. Un Purl est un lien pérenne pour lequel on a enregistré dans une base sa correspondance avec la localisation réelle du document.
L'inconvénient de ce type d'identifiants, c'est qu'ils ne sont pas gentils-avec-les-gens (user-friendly). Ils ne s'affichent pas dans la barre d'URL du navigateur. La plupart du temps, on clique dessus sans même savoir qu'ils sont pérennes en fait.

Certains ont donc eu l'idée de développer des outils qui vont se comporter comme des grands, et savoir "quoi faire" quand ils sont confrontés à de tels liens.
C'est le cas de cette extension Firefox qui permet de reconnaître la présence l'un Purl sur une page Web et de faire en sorte que le Purl soit bookmarké à la place de l'adresse normale de la page.
Malheureusement elle ne fonctionne qu'avec Firefox 1.0, alors comme je suis passée à 1.5 j'ai pas eu la joie de la tester. C'est dommage il faudrait qu'ils remettent à jour.
Pour que cela puisse marcher, cependant, il faut

Par Manue le 6 février, 2006 - 20:32 dans

Agrégateur en panne

Image associée au billet

Depuis vendredi, il nous arrive un truc vachement bizarre et pour tout dire horrible : on n'a plus accès à Bloglines (ni à aucun service de Askjeeves) chez nous. Un problème de routage ou je sais pas quoi, enfin, un problème de Web qui est cassé.
Conséquence directe : je n'ai pas accès à mes fils et encore moins à mes "clippings", ces trucs qu'on peut mettre de côté dans mon agrégateur préféré. Donc pas de veille, donc pas de billet, et en particulier pas de confiture de liens.

Pour me faire pardonner, je poste une autre photo d'un truc que j'ai fait. Lequel est une pâle et imparfaite copie de ça qui est au Louvre. Au fait vous me direz je pourrais mettre un lien vers le Louvre mais qui a envie de mettre un lien pareil sur son blog. Vos identifiants pérennes, les gars !!!

En attendant je me suis rabattue sur litefeeds qui récupère automatiquement les souscriptions de Bloglines, mais c'est pas vraiment génial. Donc si quelqu'un a une idée d'agrégateur en ligne super bien avec import OPML et qui marche, merci de me passer le tuyau !!!

Par Manue le 5 février, 2006 - 18:59 dans

Confiture de "pff j'ai pas eu le temps de bloguer cette semaine"

J'ai lu un article très intéressant d'Alain Giffard sur les bibliothèques numériques en général et celle de Google en particulier.

Des gens ont parlé d'identifiants pérennes : sur catalogablog et chez Lorcan Dempsey .

Ca a bougé côté DLF : au sujet du DLF Framework qui a pour objectif de modéliser l'activité des bibliothèques si je comprends ce qu'en dit Lorcan , avec la publication des présentations d'une conférence intitulée Managing Digital Assets , et aussi avec la publication d'un document à réviser sur l'utilisation de MODS pour le patrimoine (via Digitization Blog celui-là).

Ca a bougé côté OCLC : avec la publication du rapport annuel 2005 , et celle d'un autre rapport intitulé Perceptions of Libraries and Information Resources , sur les usages et les pratiques, et qui s'inscrit en continuité du 2003 OCLC Environmental Scan: Pattern Recognition vraiment à lire si vous ne l'aviez pas fait à l'époque.

Moi, pendant ce temps, j'étais occupée à aller au ciné , faire une conférence, et rencontrer des vrais gens dans la vraie vie . C'était bien aussi.

Par Manue le 9 décembre, 2005 - 22:49 dans

Voitures et identifiants pérennes

Je me disais il y a peu que si on considère les différents systèmes de nommage unique et pérenne que l'on fréquente dans la vraie vie (lire : pas sur le Web), un des plus impressionnants est l'immatriculation des voitures.

Actif depuis plus de cinquante ans, ce système a bien des avantages : son extensibilité (passage de deux lettre à trois), sa citabilité (facile à retenir). Pourtant, ce système a vécu et on nous annonce qu'on va en changer. Petite analyse.

Par Manue le 15 juin, 2005 - 23:39 dans

PURL + OAI = POI

Les identifiants pérennes, retour de la vengeance.

Je viens de découvrir, via Catalogablog lui même via Lorcan Dempsey un système d'identifiants pérenne que je ne connaissais pas mais qui en combine deux que je connaissais :

Le système s'appelle POI pour PURL-based Object Identifier.

Les particularités de ce système : on n'a pas besoin d'enregistrer les POI pour chaque ressource, il suffit d'avoir un entrepôt OAI dans lequel les ressources ont des identifiants. On peut ensuite transformer de manière implicite les identifiants OAI en identifiants POI de la manière suivante :

un document qui porte l'identifiant :

oai:mon-nom-de-domaine.org:123456

a l'identifiant POI suivant :

http://purl.org/poi/mon-nom-de-domaine.org/1233456

Evidemment la conséquence de cette petite transformation est que le nouvel identifiant POI est compréhensible par un navigateur grâce au protocole HTTP. Et ensuite on utilise le résolveur PURL pour résoudre les POI et pointer vers les ressources elles-mêmes.

Par Manue le 6 mars, 2005 - 19:45 dans

Le W3C et les identifiants

Le W3C se penche depuis belle lurette sur l'identification pérenne des ressources numériques (dont vous devez avoir sacrément marre d'entendre parler ici à force, mais tant pis).

Il y a eu d'abord les URI (identifiants de ressources), puis les URN (noms de ressources), tous deux dès 1994.

Les URL (localisation de ressources) arrivent après, aussi bizarre que cela puisse paraître pour nous (mais du point de vue modélisation, c'est logique). Le fameux Cool URIs don't change , document fondateur de la question de la pérennité de l'identification des ressources sur le Web, date de 1998.

Passé le tournant du siècle, on entre dans le Web sémantique et de nouveaux besoins apparaissent en termes d'identification : identifier des choses abstraites, des choses qui ne sont pas nécessairement des pages Web, et qu'elles puissent être identifiées par n'importe qui de façon unique sur le Web. Ces nouvelles réflexions donnent naissance au scheme "tag" , une syntaxe simple pour permettre à n'importe qui de nommer de manière pérenne et unique une ressource (ou une personne, un concept quelconque). Les "tag URIs" ont une syntaxe simple qui permet à tout un chacun de générer des identifiants uniques :

tag:mon-nom-de-domaine.org,2005-03-01:nom

Ce genre d'identifiants est utilisé par exemple pour identifier les billets de blogs dans le

Par Manue le 1 mars, 2005 - 22:05 dans

L'identification pérenne des ressources numériques (4)

Dans les épisodes précédents (1 , 2 , 3 ), nous avons vu :

  • les objectifs de l'identification pérenne des ressources numériques
  • les principales fonctionnalités des identifiants
  • les caractéristiques communes aux différents systèmes existants.

Aujourd'hui, je m'attaque à deux compléments indispensables de l'identifiant : le résolveur, et les métadonnées.

Le contexte de l'identifiant pérenne doit permettre de savoir à quoi celui-ci correspond et d'accéder à la ressource elle-même. Pour reprendre une métaphore que j'ai déjà utilisée : si on a votre nom, et qu'on veut vous trouver, il y a deux possibilités. Soit on dispose d'autres informations sur vous : votre photo, votre numéro de téléphone, votre adresse, votre CV ou n'importe quoi d'autre incluant dans le meilleur des cas votre adresse : ce sont les métadonnées. Soit on consulte un annuaire qui va donner l'adresse correspondant à ce nom : c'est le résolveur.

L'un n'exclut pas l'autre évidemment. On peut avoir un identifiant associé à des métadonnées et en plus un résolveur qui va donner l'URL correspondante.

Certains systèmes d'identification pérenne vont demander ou recommander la saisie de métadonnées conjointement avec l'enregistrement de la ressource. C'est le cas par exemple de DOI et de ARK .

D'autres systèmes sont dédiés à l'échange de métadonnées, mais

Par Manue le 15 février, 2005 - 21:59 dans

L'identification pérenne des ressources numériques (3)

Dans les épisodes précédents (1 et 2 ), nous avons vu que définir un système d'identification pérenne de ressources numériques passait par le choix d'un certain nombre de propriétés et de fonctionnalités du système.

Ceci étant posé, l'heure est maintenant venue de faire un choix parmi les sytèmes d'identification pérenne existants aujourd'hui sur le Web.

Si on essaye de faire une typologie des différents systèmes, on se trouve bien en peine de trouver un critère qui permette de les classer tous. En fait, il y a plusieurs critères à prendre en compte, parmi lesquels on peut citer :

  • l'indépendance : il y a les systèmes où les identifiants sont donnés par le créateur de la ressource, et les systèmes où ils sont donnés par un tiers
  • l'unicité : il y a des systèmes qui garantissent l'unicité seulement au sein d'un système, d'autres qui la garantissent de manière totale et mondiale à l'échelle du Web
  • la structure : il y a des systèmes qui attribuent des identifiants opaques, ou aveugles, et d'autres qui donnent des identifiants signifiants
  • etc.

Je pourrais continuer comme ça presque indéfiniment. En fait, ce qu'il faut retenir, c'est que la plupart des systèmes combinent ces différents aspects à différents niveaux. Le choix va être difficile car il n'existe pas de critère de différenciation clair et net. Ils ont chacun leur

Par Manue le 9 février, 2005 - 18:32 dans
Design Figoblog 2008 - Image from http://www.europeana.eu - http://photo.rmn.fr : Codex Vindobonensis, series nova 2644: folio 4 verso