Month of avril, 2005

user warning: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'auteur'' at line 1 query: SELECT DISTINCT mm.uri as uri FROM moat_meanings mm, term_data td WHERE mm.tid = td.tid AND mm.nid = '668' AND td.name = 'droits d'auteur' in /home.10.23/lespetitA/www/figoblog/includes/database.mysql.inc on line 172.

Fini de bricoler

Alors qu'aux tout débuts de la numérisation on évoluait dans un monde incertain d'expérimentation, d'apprentissage sur le tas, et de tâtonnements, aujourd'hui il n'est plus question de procéder de la sorte. La numérisation s'est stabilisée et normalisée, pour preuve ce document publié par l'organisme de normalisation américain (NISO) : A Framework of Guidance for Building Good Digital Collections . Le "good" annonce bien la couleur : il s'agit de recommandations pour construire des collections numériques de qualité.

Le document est organisé en 4 grands axes : les collections , les objets numériques , les métadonnées et les projets .

Parmi les principales problématiques soulevées, qui sont les points critiques de la construction de "bonnes" collections numériques, on notera la cohérence de la politique documentaire, la pérennité des objets et des métadonnées, les identifiants pérennes, l'intéropérabilité et l'accessibilité, la gestion des droits.

Un des points vraiment intéressants dans ce document c'est les tableaux qui récapitulent les "guidelines" disponibles sur les formats de numérisation et les formats de métadonnées.

Beaucoup de références, beaucoup de liens, un document qui fait le tour de la question, hautement recommandable. Merci à Digitization 101 (qui nous signale au passage qu'il s'agit d'une nouvelle

Pêle-mêle dans les cartons

Comme vous avez pu le remarquer, je ne suis pas très disponible en ce moment : c'est les vacances, je déménage, dans mon nouvel appartement je n'ai qu'une connexion RTC... et en plus mon hébergeur a des soucis avec ses bases MySQL. Bref, je fais de mon mieux, mais on a l'impression que je délaisse un peu le Figoblog ces derniers temps. Et c'est pas faux.

Sur le principe du carton dans lequel on fourre pêle-mêle, dans l'urgence, tout ce qu'on veut emporter en se disant qu'on fera le tri plus tard, voici donc ce que je peux vous proposer :

Oui ou non ?

Quand je lis des arguments comme "moi, la Constitution, je l'ai pas lue, alors je dis non" mon sang ne fait qu'un tour. C'est pas comme si c'était difficile de trouver le texte, il suffit de taper constitution européenne dans son moteur de recherche préféré pour tomber dessus .

Bon, ceci dit, c'est vrai que le texte est long et particulièrement indigeste en PDF .

Histoire libre

Should Historical Scholarship Be Free? Tel est le titre d'un article que l'on peut lire sur le site de l'Association des historiens américains. Comme on peut l'imaginer, il s'agit de débattre de l'opportunité et de la faisabilité d'appliquer les concepts de l'open access, bien connu en sciences dites dures, aux sciences historiques.

Longue vie aux données

Le National Science Board , un organisme américain d'expertise et de conseil dans le domaine de la science et de l'industrie, vient de publier le "brouillon" d'un rapport sur les collections de données numériques et leur préservation : Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century (PDF, 64 pages). Le document est soumis aux commentaires de la populace internationale.

Le champ de ce rapport est large, puisque sous le terme de "data" on trouve any information that can be stored in digital form, including text, numbers, images, video or movies, audio, software, algorithms, equations, animations, models, simulations. On focalise ensuite sur l'idée que ces données sont organisées, structurées en collections dans leur stockage, mais aussi dans leur production et leur consultation. Et enfin, le point clef est la nécessité de conserver ces données dans le temps, en faisant référence au modèle OAIS.

Je n'ai pour l'instant que jeté un oeil rapide à la table des matières, mais l'impression que cela donne est que l'approche disciplinaire plus ou moins orientée sur les données scientifiques devrait être intéressante pour nous, bibliothécaires. Cela permet toujours de sortir de nos concepts bibliothéconomiques, et en voyant comment ils peuvent s'appliquer dans d'autre domaines, à mieux les

Si j'avais un jardin...

Image associée au billet

Si j'avais un jardin, je me dirais, tiens c'est le printemps, et si j'achetais des choses pour mon jardin. Je me rendrais chez un fameux marchand de mobilier en banlieue et j'irais au rayon des trucs pour le jardin.

Evidemment, si on me demandait ce que je voudrais acheter comme objet en faïence kitsch à la place de mon nain de jardin qui a fini par prendre sa retraite, je dirais, bien sûr : une figue géante.

Eh ben, croyez-le ou pas, au milieu des champignons en porcelaine, des concombres pas masqués et des cactus en plastique, on trouve des figues géantes en faïence chez Ikea. Trop fou.

(Heureusement pour mon geek, notre nouveau chez-nous n'a pas de jardin !)

La numérisation de la Licorne

Image associée au billet

Ce matin avec mon petit déjeuner, j'ai savouré un article passionnant qui raconte l'aventure de la numérisation des tapisseries de la Chasse à la Licorne du Cloister's Museum de New York.

Annotation collaborative

Pas besoin de développer des interfaces extraordinaires pour permettre l'annotation collaborative d'une ressource disponible en ligne, comme le montre le site ''Annotated NY Times . Celui-ci est construit à partir des fils rss des blogs qui commentent les articles du New York Times. On peut suivre les discussions par article, par auteur des articles ou par thème. Le site agrège les billets qui citent le NY Times, et propose plus de 6000 fils RSS pour suivre chaque discussion.

"NOT affiliated with The New York Times" peut-on lire sur la page learn more . C'est dommage... et si les journaux utilisaient la puissance de RSS et la richesse des blogs pour permettre de suivre l'impact d'un article sur le Web ?

Je trouve cette initiative vraiment intéressante et elle montre bien qu'avec des outils simples on peut construire un véritable contexte collaboratif autour d'une ressource. Un journal, mais pourquoi pas, demain, un inventaire d'archives en EAD annoté par les chercheurs qui font du dépouillement, un catalogue de bibliothèque commenté et annoté par les lecteurs, ou encore une bibliothèque numérique enrichie ? Bien sûr, il faudrait que les institutions soient prêtes à s'ouvrir à des contenus dont la validation leur échappe, ou plutôt, dont la validation se fait a posteriori du côté des lecteurs, par simple confrontation de la multiplicité des

Relire Borges

En lisant cet article signé par un sénateur (vu chez S. Bailly ), je me suis dit qu'il était vraiment temps de relire Borges et sa Bibliothèque de Babel :

La bibliothèque imaginée par Borges est une métaphore de l’univers (...) « Et si la bibliothèque contenait tous les mondes » écrit Borges. 50 ans avant l’avènement du Web, Borges avait déjà inventé le concept d’hyperlien et d’hypertexte, et pressenti l’avènement des mondes virtuels ! (...) « La bibliothèque universelle, Borges l’a rêvée, Google l’a fait »

Cela me laisse sans voix. Il faut relire la nouvelle de Borges avant de parler du "rêve" de la bibliothèque universelle. Ce n'est pas un rêve, mais bien un cauchemar, dans lequel la bibliothèque devenue inutile par excès de perfection en vient à menacer l'humain.

Lisez donc plutôt cet autre article d'Alberto Manguel , l'auteur des excellents Une histoire de la lecture et Le livre d'images.

Avec ce projet, Google tend vers le cauchemar de Borges à propos de la bibliothèque de Babel: tout ce qui peut être dit ou écrit par la combinaison des lettres de l'alphabet y est. (...) En un sens, Internet est l'incarnation de ce labyrinthe-là.

Bon la conclusion est en fait la même : Internet (Google ?) est l'incarnation de cette bibliothèque de Babel. Rêve ou cauchemar, telle est la question .

Ordinateurs et bibliothèques

Les présentations de la conférence Computers in Libraries 2005 sont en ligne.

Il y en a un peu pour tous les goûts, je note par exemple :

  • le design d'interfaces pour la recherche fédérée
  • les blogs collaboratifs (retour d'expérience de LISnews )
  • les moteurs de recherche
  • les bibliothèques et la gestion de contenu
  • OpenURL
  • la visualisation de données
  • Google et le contrôle de l'information (sympa celui-là, dommage qu'il ne mentionne pas les extra-terrestres
  • XML et XSLT
  • l'OAI

Bon j'arrête. Si j'étais sympa j'aurais mis à chaque fois le lien vers les présentations mais bon, mettre des liens vers tous ces fichiers powerpoint, beuah.

Cela vaut le détour en tout cas.

Submergée

Eh oui, voilà ce qui arrive quand on fait des billets bidons au lieu d'être sérieux, et aussi quand on a des problèmes de connexion à répétition :-( Les choses intéressantes s'accumulent, on n'a pas le temps de les lire, et encore moins de les bloguer.

Bon, je vais essayer de résumer.

Du côté de la Library of Congress, plusieurs infos intéressantes :

  • le rapport Amega sur les applications de génération automatique de métadonnées
  • un autre travail sur l'Access level cataloguing pour les ressources en ligne (???)
  • dans le cadre du NDIIPP , leur groupement national de veille sur la préservation des documents numériques, ils ont mis en place un toolkit ou un modèle d'archivage, dont l'objectif est de fournir une métohodologie pour la mise en oeuvre de l'archivage de documents numériques.

Dans le domaine de la préservation, il y a un questionnaire qui circule, composé d'une seule et étrange question : combien de temps voudriez-vous que votre support de stockage soit capable de durer ? En gros, vos CD, est-ce que vous comptez dessus pour 20, 30, 40 ans ? Vu que le minimum c'est 20 ans, tout ceci me paraît légèrement utopique. J'aurais dit 5.

Bon et puis dernier truc, un outil vient de sortir, le TeiPublisher , qui permet de gérer des collections de documents en XML ou XHTML (pas forcément en TEI d'ailleurs apparemment). Il est basé sur le

Google et le contrôle de l'information

On a enfin découvert pourquoi Google cherche à contrôler l'ensemble de l'information de la planète. D'après un communiqué du SETI (Search for Extraterrestrial Intelligence Institute) publié en ce vendredi 1er avril, l'observatoire SOFIA aurait enregistré des communications dans une langue inconnue entre le Googleplex de Mountain View et des objets volants non identifiés de petite taille, situés en orbite de la Terre, et qui étaient auparavant considérés comme des météorites inoffensives. Ces météorites seraient en réalité composées d'un matériau inconnu dans notre galaxie, capable de stocker des milliers de teraoctets de données sur une surface minuscule.

A l'échelle de cette découverte, on comprend mieux comment Google fait pour offrir désormais 2 gigas de stockage aux utilisateurs de son système de messagerie Gmail . Cela fait en fait partie d'un grand complot intergallactique visant à contrôler tous les flux d'informations de la planète Terre, utilisés comme source d'énergie primaire par les extraterrestres ayant mis en place cet ingénieux processus. En fait, plus l'espace de stockage occupé est important, plus le flux d'information générée est intense, et peut ainsi être réutilisé pour fournir de l'énergie.

Il paraîtrait même que les extraterrestres qui ont mis en place Google auraient lancé une boisson énergétique,

Mise à jour :

Dans le même genre :