Bibliothéconomie

SIGB et métadonnées

Le JISC a publié récemment deux études intéressantes :

- Library Management Systems Study (mars 2008), un état de l'art comparatif des principaux systèmes de SIGB utilisés dans les bibliothèques anglo-saxonnes et leurs perspectives d'évolution ;

Des URI sympas pour le Web sémantique

En date du 1er avril, le W3C annonce avoir mis à jour le document Cool URIs for the Semantic Web, passé du statut de "draft" à celui de "interest group note" (ceux qui y comprennent quelque chose à la normalisation apprécieront cette évolution ;-)

Histoires de numérisation

Dans cet article, un gars de Google raconte les problèmes de gestion de l'information et du document qu'ils ont rencontrés en mettant en place Google Books Search. On y trouvera des réflexions sur l'OCR, l'analyse de documents, l'extraction de métadonnées, le traitement des images, l'affichage et la visualisation des documents ou extraits de documents, le logiciel libre et la R&D.

Normes

En vrac, l'actualité de ces derniers mois sur les normes et bonnes pratiques qui intéressent les données bibliographiques.

Séminaire sur la préservation numérique

Un peu de pub : l'association Aristote et le groupe PIN organise un séminaire le Jeudi 10 avril 2008 à l'Ecole Polytechnique à Palaiseau. Le thème en est : "Pérennisation de l’information numérique : les changements spectaculaires du paysage national et du contexte européen" (programme complet). Ca devrait être assez intéressant pour tous les gens qui s'intéressent à la préservation des documents numériques.

Préservation numérique : accord Portico / KB

La Bibliothèque Royale des Pays-Bas (KB) et Portico annoncent qu'ils viennent de passer un accord. Ces deux acteurs sont des mastodontes dans le contexte de la préservation des revues électroniques.

Dublin Core : on n'y comprend plus rien

Au départ, Dublin Core, ça a l'air simple : il y a 15 éléments, tous facultatifs et répétables, et voilà.

Après, ça se complique : à ces 15 éléments (le Dublin Core dit "simple") vient s'ajouter le Dublin Core qualifié, dans lequel on dispose d'attributs pour préciser le sens des 15 éléments de base.
Par exemple, pour prendre un truc simple et connu, on peut qualifier l'élément DC:coverage par l'attribut "spatial" ou "temporal".

Marc 21 et le Web sémantique

Un article à lire : Semantic MARC, MARC 21 and the Semantic Web par les gens de Talis.

Dans cet article, ils exposent comment transformer "facilement" des données en MARC 21 en RDF, avec une méthodologie qui selon eux pourrait permettre de créer en un clin d'oeil un réseau de données entre des catalogues distants.

Europeana : l'aventure continue

Après quelques mois dans le giron de la France sous la forme d'un prototype que vous connaissez probablement (et qui a désormais rejoint l'histoire), Europeana vole maintenant de ses propres ailes au niveau européen.

Pour ou contre... montrer l'OCR brut

Difficile question quand on décide de passer une bibliothèque numérique du mode image au mode texte : faut-il, ou non, montrer l'OCR brut aux utilisateurs ?

Oui, parce que des fois, l'OCR brut ça ressemble à ça :

i defon Camp tout herifâ de lances
•sgrands efforts, dont furent affaillis
ennemis ï vi les grands chamaîlHs
e$cmbatdnsJmlescri4ejfr'oydbles
es Vietnam & Huîtres redoutables,,
mhants au choc de nos braues lanàers,
tfout le huride nos rudes piquiers%-

Syndiquer le contenu