Month of janvier, 2005

Contrôle qualité pour l'EAD

Si vous produisez des descriptions en EAD, vous pouvez être intéressés par le nouvel outil proposé par RLG : le EAD Report Card . Cet outil se donne pour objectif de vérifier la qualité des fichers EAD, avec pour critère la conformance avec les recommandations de RLG : EAD best practice guidelines .

Ces guidelines, émises en 2002, avaient pour objectif d'améliorer l'interopérabilité des descriptions en EAD par la désignation d'un "coeur" (core data elements) qui permette de définir un niveau basique d'uniformité entre les différentes applications possibles de la DTD.

L'outil proposé par RLG permet de vérifier la conformité avec ces recommandations à deux niveaux : seulement les éméments obligatoires, ou tous les éléments. Il s'utilise en ligne mais une version téléchargeable, capable de traiter des gros fichiers, est prévue.

Mon moteur et moi

Encore un rapport du Pew Internet & American life project : cette fois sur les usages des moteurs de recherche .

Les conclusions du rapport sont assez prévisibles : les internautes sont satisfaits de leurs moteurs de recherche préférés et ils ont tendance à être fidèle à un, voire deux outils. Par contre, ils ne sont pas très au fait des implications politiques et économiques de l'usage des moteurs. Un des paradoxes soulignés dans le résumé, par exemple : seul un utilisateur sur 6 pense pouvoir différencier clairement les liens sponsorisés ou payés, alors que la moitié d'entre eux déclarent qu'il cesseraient d'utilser leur moteur préféré s'ils pensaient que sa politique à ce sujet n'est pas claire.

Cela montre assez bien la relation ambigue de l'internaute à son outil. Entre une méfiance théorique et une pratique presque inconsciente, il n'y a parfois qu'un pas. Et vous, seriez-vous prêts à vous passer de votre moteur de recherche préféré ?

Générateur automatique de sites web de bibliothèques

Image associée au billet

J'ai eu un petit coup de coeur pour cette initative espagnole : le générateur de sites Web de bibliothèques publiques .

L'idée : les bibliothèques publiques ont toutes les mêmes besoins en matière de site Web. Par contre, elles manquent de moyens et de compétences techniques. Alors on met à leur disposition un outil pour générer automatiquement des pages, suivant une maquette paramétrable et à l'aide d'une procédure simple. Quelques informations sur la bibliothèque, quelques photos, les actualités, la liste des nouveautés, un lien vers le catalogue... et le tour est joué !

Je suis sûre que les mauvais esprits vont trouver le moyen de dire que c'est affreusement castrateur de cantonner ces bibliothèques dans ce schéma pré-déterminé, qu'on les prive de leur liberté d'expression et d'innovation, quoi d'autre, que l'outil fait des sites moches et pas accessibles... Enfin la réalité c'est qu'avant il n'y avait rien, et maintenant, il y a quelque chose.

C'est l'occasion de visiter par exemple le site de la Bibliothèque publique de Salamanque , ne serait-ce que pour voir les photos... c'est un bijou, comme tout le reste de la ville.

C'est une initative de la sous-direction des bibliothèques , au ministère de la Culture (ne vous embrouillez pas, on est en Espagne). Via Véase además .

La photo c'est pas Salamanque mais Tolède. Mais vous

www.figoblog.org

Ca y est je me suis lancée : j'ai acheté un nom de domaine ! Grâce aux bons offices de mon geek, tout semble fonctionner correctement et la nouvelle adresse qui s'affiche est www.figoblog.org.

La bonne nouvelle, c'est que si un jour je change d'hébergeur, je pourrai garder mon nom de domaine et j'aurai des URI cool qui ne changent pas .

Geeks et bibliothèques numériques

Quand on lit ce qu'Eric Baillargeon écrit sur Constellation W3 au sujet du nouveau portail de la Bibliothèque nationale du Québec , on se dit que les bibliothèques numériques ont encore du chemin à faire avant d'acquérir la moindre once de reconnaissance devant cette communauté exigeante que sont les geeks. Ceci dit il a raison : ce portail a des URL pas possibles (avec 2 http par exemple !) Quant à la navigation par pop-up je ne vais pas me mettre à la défendre.

Le principal reproche qu'adresse Eric Baillargeon à ce portail, c'est son manque d'accessibilité. Sujet que l'on ne peut négliger puisque maintenant, garantir l'accessibilité est une obligation légale pour les sites Web publics.

Ceci dit, si on s'intéresse au contenu, c'est assez prometteur, il faut lire l'article original d'un autre Baillargeon pour se faire une idée. Il y a entre autres un gros projet de numérisation de presse ancienne. Et ils n'ont pas peur de mettre des documents dans des résolutions lisibles (par exemple pour les cartes).

Mais bon, tout n'est pas perdu : du côté de chez Sébastien Paquet l'image de la bibliothèque, associée par ses missions à celle du monde du libre, est plutôt reluisante. Et s'il y a besoin de s'en convaincre (que les bibliothèques ont à voir avec le libre), j'ajouterai un lien vers cette bibliographie sur les bibliothèques et l'open

Comptes-rendus sur l'organisation des connaissances

Suite à une journée d'études qui a eu lieu à Paris 8 (laboratoire Paragraphe) sur l'organisation des connaissances, nous avons la chance de trouver deux comptes-rendus de blogueuses qui manifestement étaient sur place :

  • sur le nouveau et prometteur Tribune libre
  • sur Arkandis , récent aussi et plutôt orienté knowledge management.

Sur ce deuxième, je lis :

Avec la numérisation, le document s’est liquéfié. Le document était cristallin, parfait, organisé, il avait une identité qui ne pouvait pas être remise en cause. Avec la numérisation, le texte sort de sa linéarité et donc de sa géométrie au profit d’une recomposition lié au regard de son utilisateur. La métaphore de l’information liquide semble parfaitement en cohérence avec le vocabulaire utilisé pour en parler: « baigner dans l’information, se noyer dans l’information, un océan d’informations, surfer ». On pourrait donc parler de déglaciation du document par la numérisation.

Evidemment, le sujet me touche, même s'il s'agit d'un compte-rendu dont je ne connais pas l'exactitude par rapport aux mots de l'intervenant, Michel Authier.

L'utilisation du mot "numérisation" me semble ici recouvrir une réalité plus large que celle que j'ai l'habitude de mettre sous ce terme, il s'agirait plutôt d'un "passage au numérique" plus global. L'idée de la

Mise à jour :

Les actes de la journée (en vidéo) : ici .

Trucs à la figue

Image associée au billet

C'est authentique, encore à cette période de l'année, dans les magasins de primeurs les mieux fournis, on trouve encore quelques figues. On trouve bien des framboises et n'importe quoi d'autre, aussi. Enfin, c'est vrai : des figues. J'ai pas encore cédé à la tentation d'en acheter, de peur d'être déçue, mais si elles continuent à me faire de l'oeil, je pense que je vais céder.

Enfin sinon, pour compenser, ya toujours la confiture bien sûr, et tous les trucs à la figue dont je m'entoure...

  • crèmes, gels douches et eaux de toilette à la figue : dans tout bon magasin Séphora qui se respecte. Cette gamme "plaisir de figue" est excellente, elle sent vraiment la figue, en particulier l'eau de toilette qui est bien agréable
  • produits d'intérieurs à la figue, comme des bougies, des huiles de senteur, etc : il y en a une gamme chez Truffaut mais ça ne sent pas vraiment la figue, plutôt décevant
  • l'encens "sieste sous le figuier", un classique du genre, disponible chez Nature et Découverte.

Un autre jour je vous parlerai des aliments à base de figue qu'on peut consommer en toute saison.

La jolie figue verte de la photo vient d'un site d'images gratuites et libres assez fourni : Morgue File . Le nom ne fait très engageant en français mais c'est très vivant contrairement aux apparences...

Boîte à outils du catalogueur

A tous ceux qui s'intéressent de près ou de loin au catalogage, je recommande ce billet de ResourceShelf qui signale deux très riches ressources pour les catalogueurs :

Il y a plein de liens intéressants à suivre, par exemple dans la partie lectures du premier. Je n'en citerai qu'un dans la masse : What should catalogs do ? , un récapitulatif sur les bienfaits des catalogues bien faits.

C'est très orienté catalogage et pas trop nouvelles techno / métadonnées, ce qui me change un peu de mon ordinaire ; mais pour compenser, on peut aller voir le numéro de Library High Tech sur MARC et les métadonnées (2), gratuit cette semaine.

Les métadonnées descriptives de RLG

RLG vient de publier : "Descriptive Metadata Guidelines for RLG Cultural Materials" , un guide de bonnes pratiques pour la soumission de métadonnées descriptives pour Cultural Materials .

Je n'ai pas encore vraiment eu le temps de le lire jusqu'au bout. Quelques observations sur la partie concernant les formats :

  • à peu près tous les formats sont acceptés, en commençant par XML (c'est vague) et MARC (aussi). Et en allant jusqu'aux champs séparés par des tabulations et des virgules.
  • le document semble converger vers une préférence pour les métadonnées les plus détaillées dans leur format d'origine, plutôt que vers un échange basé sur une conversion avec perte potentielle d'information.

Je trouve ces premiers choix assez étranges, pour ma part j'aurais tendance à penser que quand on cherche à faire converger des sources hétérogèmes, une perte d'information descriptive est acceptable au profit de la cohérence du tout.

Je ne peux guère en dire plus pour l'instant mais je pourrai mettre ce billet à jour quand je serai allée jusqu'au bout ;-)

Numériser ce n'est pas éditer (2)

Lire aussi le (1) : Les joies de la déconstruction numérique .

Dans le cadre du numérique, les champs d'action des différents métiers de la chaîne du livre sont à redéfinir. L'équilibre auteur - éditeur - lecteur devient biaisé. L'élément livre, qui faisait le lien entre l'auteur et le lecteur dans la bibliothèque, n'était pas une production de la bibliothèque. La numérisation, qui tient le même rôle, en est une.

Et pourtant, apportant une solution au fameux paradoxe de la conservation vs. la communication, la diffusion par la numérisation est clairement une mission de la bibliothèque. Mais on ne se contente pas de scanner un livre : il faut aussi des outils pour recréer un objet physique consultable et compréhensible. La bibliothèque devient productrice de ces outils. Son rôle d'intermédiaire en est changé.

La bibliothèque produit : elle fait acte de publication. Le problème est de définir la frontière entre la mise au public et l'édition, frontière de plus en plus insensible qui amène assez facilement à une tentation d'amalgame.

Dans la numérisation en mode image, les frontières sont relativement simples à délimiter. Pour le bibliothécaire, l'essentiel est de garder l'intégrité de l'ouvrage : le montrer dans une forme aussi proche que possible de celle qui a été communiquée au public à l'origine. On est plus dans le

Crumble

Ce week-end j'ai expérimenté avec succès une évolution de ma recette habituelle de crumble (ou pour être plus précise, de tarte au crumble, vous allez comprendre la nuance).

J'avais l'habitude de faire une tarte où je mélangeais tous les fruits de saison, couronnée par une croûte croustillante de type crumble, mais très fine. Mon geek était content, mais je sentais que je pouvais faire mieux. J'ai donc supprimé tous les ingrédients superflus et doublé la quantité de ceux qui faisaient que c'était bon.

Donc voilà.

  • Dans un moule assez profond, étaler une pâte brisée ou sablée.
  • Couper en dés quatre pommes et deux bananes. Répartir les fruits sur la pâte en une couche de 2cm d'épaisseur environ.
  • Enfourner dans un four préchauffé à 220° pendant 1/4 d'heure.
  • Pendant ce temps, préparer le crumble : on malaxe 50g de beurre mou et 50g de sucre, puis on ajoute 100g de farine et un peu de canelle. On doit obtenir une poudre pas trop fine, granuleuse.
  • Au bout d'1/4 d'h de cuisson, sortir le plat du four, verser 1/2 verre de jus d'orange sur les fruits, et étaler le crumble sur les fruits. Remettre au four jusqu'à ce que la croûte soit bien dorée.

Cette recette est excellente mais terriblement éloignée de l'authentique crumble véritable. Si quelqu'un a une autre recette, je suis preneuse.

Et si on arrêtait de faire des métadonnées ?

Cet article (pdf) au titre un brin provocateur était arrivé dans mes fils dans le lot nombreux de documents en tous genres sur les métadonnées, et je ne pensais pas m'y attarder plus que ça.

Mais comme il commence par une amusante parabole et que j'adore ça, je me suis laissée prendre par sa lecture, et même intéresser par cette proposition ô combien indécente : et si on faisait un moratoire sur les métadonnées ?

De fait, les idées exposées par l'auteur de cet article ont un côté pragmatique assez séduisant. Le constat est le suivant : le travail élaboré depuis 10 ans sur les métadonnées, notamment avec Dublin Core, MPEG-7 pour les vidéos, et le Web sémantique, est arrivé à un certain plafonnement. On s'aperçoit aujourd'hui (toujours d'après l'auteur de l'article, je précise) que rien ne remplace en performance et en pertinence la recherche plein-texte. Et pourtant, pour ce qui est de la recherche de documents multimédias, on n'a pas vraiment avancé. On sait aujourd'hui que quel que soit le nombre de mots qu'on accolera à une image pour la décrire, il sera impossible d'anticiper tous les usages. Quant aux métadonnées techniques qui sont les seules qu'on extrait automatiquement, elles se révèlent inutiles quand l'objectif est de trouver.

L'auteur propose de valider une bonne fois les acquis puis de cesser de faire des métadonnées,

Nouvelle interface de visualisation par OCLC

OCLC vient de sortir une démo d'interface de visualisation pour accéder à des e-books. L'interface est développée par Antartica systems et vise les utilisateurs de FirstSearch.

J'ai testé un peu le truc, bien sûr il me manquait toujours l'étape finale d'accès à l'e-book puisque je n'avais pas les droits. J'avoue que tout ceci me laisse perplexe.

Une fois passée la première réjouissance de se ballader dans une navigation arborescente assez bien faite (y compris lorsqu'on s'intéresse à un truc totalement bizarre comme... je sais pas moi... la diplomatique contemporaine ;-), on se demande tout de même à quoi servent ces carrés de toutes les couleurs qui n'apportent pas grand chose.

Quelques hypothèses :

  • vous êtes un lecteur particulièrement docile et obéissant, et vous avez lu jusqu'à la dernière ligne le tutoriel par lequel on vous oblige à passer avant d'accéder à l'interface. Donc vous savez à quoi servent les carrés et les couleurs. Bravo. Pas moi (je l'ai lu seulement après).
  • pour l'expérience utilisateur. C'est plus joli des carrés verts clairs que des résultats noirs sur blanc. Ce qui reste à prouver.
  • pour connaître d'un seul coup d'oeil l'état de la collection. Là je vous renvoie au premier point. En outre, mon côté pervers m'incite à cliquer en priorité sur les plus petits carrés et ceux dont on ne voit pas

Format du 3e millénaire

Imaginez un format d'images ouvert, avec un excellent taux de compression mais sans pertes. Imaginez que ce format permette de stocker aussi bien des métadonnées descriptives que techniques et des métadonnées de préservation à l'intérieur même du fichier. Imaginez enfin que ce format permette de stocker dans le même fichier plusieurs résolutions d'une image pour gérer différents affichages ou des fonctionnalités de zoom.

Ce format il existe, c'est le Jpeg2000.

Pour en savoir plus sur le Jpeg2000 et son implantation dans les bibliothèques et les archives, un nouveau site vient d'être créé : JPEG 2000 in Archives and Libraries .

En fait, ce qui est intéressant dans ce site outre son sujet, c'est que c'est un blog (même s'il ne dit pas son nom). Il se propose aussi d'ouvrir un espace de blog personnel pour les particiapnts, mais ce n'est pas encore très actif de ce côté. Et bien sûr, il dispose d'un fil RSS .

Merci à Digitization blog .

Les joies de la déconstruction numérique (1)

J'aime bien dire (et mon geek ne me contredira pas sur ce point ;-) que le numérique change à la fois beaucoup et pas grand chose dans la façon dont on appréhende le document, ou même, la bibliothèque.

Quand on essaye de définir ce qu'est une bibliothèque numérique, on en arrive assez rapidement à repartir des bonnes vieilles missions de la bibliothèque tout court : sélectionner, décrire, ranger, communiquer, etc.

Du point de vue du document, la numérisation est un exercice plus complexe que simplement passer un bouquin dans un scanner. Parce que numériser un livre, c'est le déconstruire : il faut ensuite lui rendre son intégrité par les métadonnées , la navigation et les interfaces. La tentation aussi est grande d'en profiter pour rajouter de l'information, voire de l'analyse, ce en quoi il faut aussi se méfier car numériser, ce n'est pas éditer. L'intégrité du document prime donc sur le reste, la numérisation doit tenir pour essentiels les concepts de respect de l'original et de mise en contexte, à la fois à l'échelle du document, mais aussi du corpus ou du fonds dans lequel il se trouve.

C'est seulement à ce prix que la numérisation est utile, parce qu'elle est alors un véritable support de substitution pour le chercheur, parce qu'elle garantit grâce à cette intégrité du document la confiance que peut avoir le chercheur dans la

Internet, une menace pour les bibliothèques ?

Alors que Google se lance dans une numérisation de masse sans précédent, décidé à faire entrer le livre dans le Web dans des proportions jusque-là inégalées, on se demande si les bibliothèques devraient trembler de peur devant ceux qui annoncent que bientôt, complètement dépassées par l'Internet, elles devront fermer leurs portes.

En ce qui concerne les américains, on peut dire qu'ils sont plutôt confiants. Cet article rapporte les résultats d'une étude qui montre au contraire que sur les cinq dernières années, l'usage d'Internet et celui des bibliothèques aux Etats-Unis ont été parfaitement complémentaires. Une population jeune, avec un niveau d'éducation élevée, tend à utiliser aussi bien les bibliothèques qu'Internet dans une démarche de recherche d'information globale.

La présidente de l'ALA citée dans cet autre article fait la même constatation sur l'augmentation de la fréquentation des bibliothèques américaines depuis l'explosion du Web.

Les bibliothèques ont donc encore de beaux jours devant elles, pour peu qu'elles se montrent capables de suivre le mouvement. Comme le suggère ce plaidoyer pour que la bibliothèque nationale canadienne numérise l'intégralité de son fonds (à condition que l'Etat fasse en sorte qu'elle puisse en avoir le droit).

Tout ceci est bel et bien, et nous laisse imaginer que les bibliothèques

Bonne année 2005

Image associée au billet

Pour commencer cette nouvelle année, quelques bonnes résolutions s'imposent.

Si vous n'avez pas d'idée de bonne résolution, vous pouvez en générer automatiquement chez rMen's.

J'ai aussi quelques propositions de mauvaises résolutions à adopter illico presto :

Merci à Fred Cavazza , Sebastien Bailly , et Faut le savoir .

Et mainentant, au boulot. Et bonne année.