Le JISC a publié récemment deux études intéressantes :
- Library Management Systems Study (mars 2008), un état de l'art comparatif des principaux systèmes de SIGB utilisés dans les bibliothèques anglo-saxonnes et leurs perspectives d'évolution ;
Le JISC a publié récemment deux études intéressantes :
- Library Management Systems Study (mars 2008), un état de l'art comparatif des principaux systèmes de SIGB utilisés dans les bibliothèques anglo-saxonnes et leurs perspectives d'évolution ;
En date du 1er avril, le W3C annonce avoir mis à jour le document Cool URIs for the Semantic Web, passé du statut de "draft" à celui de "interest group note" (ceux qui y comprennent quelque chose à la normalisation apprécieront cette évolution ;-)
Dans cet article, un gars de Google raconte les problèmes de gestion de l'information et du document qu'ils ont rencontrés en mettant en place Google Books Search. On y trouvera des réflexions sur l'OCR, l'analyse de documents, l'extraction de métadonnées, le traitement des images, l'affichage et la visualisation des documents ou extraits de documents, le logiciel libre et la R&D.
En vrac, l'actualité de ces derniers mois sur les normes et bonnes pratiques qui intéressent les données bibliographiques.
Un peu de pub : l'association Aristote et le groupe PIN organise un séminaire le Jeudi 10 avril 2008 à l'Ecole Polytechnique à Palaiseau. Le thème en est : "Pérennisation de l’information numérique : les changements spectaculaires du paysage national et du contexte européen" (programme complet). Ca devrait être assez intéressant pour tous les gens qui s'intéressent à la préservation des documents numériques.
La Bibliothèque Royale des Pays-Bas (KB) et Portico annoncent qu'ils viennent de passer un accord. Ces deux acteurs sont des mastodontes dans le contexte de la préservation des revues électroniques.
Au départ, Dublin Core, ça a l'air simple : il y a 15 éléments, tous facultatifs et répétables, et voilà.
Après, ça se complique : à ces 15 éléments (le Dublin Core dit "simple") vient s'ajouter le Dublin Core qualifié, dans lequel on dispose d'attributs pour préciser le sens des 15 éléments de base.
Par exemple, pour prendre un truc simple et connu, on peut qualifier l'élément DC:coverage par l'attribut "spatial" ou "temporal".
Un article à lire : Semantic MARC, MARC 21 and the Semantic Web par les gens de Talis.
Dans cet article, ils exposent comment transformer "facilement" des données en MARC 21 en RDF, avec une méthodologie qui selon eux pourrait permettre de créer en un clin d'oeil un réseau de données entre des catalogues distants.
Après quelques mois dans le giron de la France sous la forme d'un prototype que vous connaissez probablement (et qui a désormais rejoint l'histoire), Europeana vole maintenant de ses propres ailes au niveau européen.
Difficile question quand on décide de passer une bibliothèque numérique du mode image au mode texte : faut-il, ou non, montrer l'OCR brut aux utilisateurs ?
Oui, parce que des fois, l'OCR brut ça ressemble à ça :
i defon Camp tout herifâ de lances
•sgrands efforts, dont furent affaillis
ennemis ï vi les grands chamaîlHs
e$cmbatdnsJmlescri4ejfr'oydbles
es Vietnam & Huîtres redoutables,,
mhants au choc de nos braues lanàers,
tfout le huride nos rudes piquiers%-