Month of juin, 2004

user warning: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'auteur'' at line 1 query: SELECT DISTINCT mm.uri as uri FROM moat_meanings mm, term_data td WHERE mm.tid = td.tid AND mm.nid = '235' AND td.name = 'droits d'auteur' in /home.10.23/lespetitA/www/figoblog/includes/database.mysql.inc on line 172.

Exotisme

Ca vous est égal, mais la nuit dernière j'ai rêvé que je partais en voyage à New York. C'était super, à dire vrai je tombais complètement amoureuse de cette ville.

Alors forcément, aujourd'hui je ne pouvais qu'être aguichée par ce sympathique projet : un plan de métro des bloggeurs new-yorkais, réalisé en fonction de leur emplacement dans la ville. Dans le genre ramenons l'Internet à l'échelle locale, ça m'a plu.

Pour continuer dans l'exotisme, je vous invite à visiter African Online Digital Library : une bibliothèque numérique avec des textes, des images, plein de ressources sur l'Afrique dont beaucoup en français.

Plus exotique encore, la Bibliothèque numérique indienne (autant vous prévenir, celle-ci ne m'a pas laissé un souvenir impérissable).

J'ai oublié de noter mes sources, ça sent le relâchement dû aux vacances.

Aggrégateur de pages

Puisqu'on en est à parler de cette fichue île déserte, sur laquelle je viens de passer un week-end excellent, merci, j'observe que l'île déserte est un endroit où l'on emmène volontiers ce bouquin énorme et un peu rébarbatif, qu'on aurait toujours voulu lire sans en prendre le temps.

Ce rêve bleu...

Dans le dernier Dlib qui vient de sortir, on peut lire un long article en forme d'appel à contribution, intitulé Search Engine Technology and Digital Libraries : Libraries Need to Discover the Academic Internet . Le titre l'annonce : il s'agit de capitaliser la technologie des moteurs de recherche, assez avancée (on avait remarqué), pour l'appliquer aux bibliothèques, numériques ou pas.

L'auteur défend l'idée qu'il serait dans les missions des bibliothèques aujourd'hui de donner à voir le Web "académique" (on dirait plutôt scientifique en français), non pas en répertoriant des sites Web, non pas en faisant de la recherche fédérée avec des métamoteurs dans des bases distribuées, non pas (même pas) en constituant des entrepôts de métadonnées grâce à l'OAI... mais en indexant.

Bref, un autre Google, mais... en mieux, bien sûr, puisqu'il n'indexerait que des ressources de qualité, duement validées, adaptées à la préservation à long-terme, et pourvues de métadonnées surpuissantes d'une qualité inégalée.

Ce moteur de recherche idéal, tenez-vous bien, il est à notre portée. Il suffirait que tous les bibliothécaires du monde se donnent la main...

Sérieusement. Que nous faudrait-il pour réaliser cette grande oeuvre bibliothéconomique ? Tout d'abord, une coopération internationale et des normes fiables et ouvertes, intéropérables

Mise à jour :

Curiosités bibliothéconomiques

J'ai eu un vrai coup de coeur pour ce site en portugais (brésilien pour être précise), Diretório de curiosidades sobre Biblioteconomia, Documentação, Gestão e Ciência da Informação .

On y trouve une foule de ressources "non-officielles" sur la bibliothéconomie : des blogs , des citations (attention, powered by IFLA), des petites BD ... c'est tout ce que j'aime, un peu de sérieux, beaucoup d'humour, et... partout de la bibliothéconomie.

Surtout ne vous laissez pas rebuter par le fait que le site soit en portugais. Il se traduit volontiers en un anglais à peu près compréhensible en un clic (grâce à Google), et il recense autant de ressources anglophones que portugaises ou espagnoles, et même un peu de français (merci à lui).

A ne pas manquer.

Catalogues et valeur ajoutée

Aller plus loin avec nos bons vieux catalogues et nos bonnes vieilles classifications, c'est possible. Voici encore deux projets qui le prouvent...

Catalog enrichment initative est un projet piloté par la Library of Congress dont l'objectif est de donner plus de visibilité aux documents hors ligne (aux livres, quoi). On peut se demander pourquoi nos catalogues de bibliothèques ne sont pas capable de fournir la même valeur ajoutée que, par exemple, Amazon . L'idée est d'enrichir nos notices bibliographiques superficielles et descriptives par des informations plus "profondes" telles que les tables des matières des ouvrages. On utiliserait des standards comme MODS, METS ou ONIX pour encapsuler les tables des matières dans les notices, notices qu'on partagerait ensuite dans la communauté bibliothéconomique internationale en utilisant l'OAI. Plus d'infos dans la colonne de Roy Tennant sur Library Journal.

Simile est un projet collaboratif, impliquant notamment le MIT et le W3C, dont l'objectif est d'améliorer l'intéropérabilité des métadonnées en utilisant le Web sémantique. Concrètement, il s'agit de créer des interfaces uniques pour accéder à des ressources hétérogènes, en utilisant RDF et les classifications à facettes pour y naviguer avec un taux élevé de serendipité (traduction peu heureuse mais y en a-t-il une autre...) On

A la pêche aux liens

Alors que le Web se googlise de plus en plus chaque jour (entendez par là la démarche suivante : je me pose une question - je tape ma question dans une case - j'obtiens la réponse dans la 1e page de résultats), certains continuent à aborder le Web avec des annuaires, directory en anglais.

Je ne pense pas que ce soit nécessairement une vision passéiste de l'accès à l'information, c'est une façon différente d'aborder la masse, par la classification et la sélection... par la méthode bibliothéconomique pure, en somme.

Cela devient en fait intéressant, à mon humble avis, lorsqu'à ce catalogue de liens vient s'ajouter une dimension temporelle, comme c'est le cas dans la navigation sociale à la del.icio.us . Au-delà du catalogue de liens, on crée une sorte de traçabilité de la navigation du "catalogueur", qui pose des jalons au fil de ses déplacements sur le Web.

Il y a ainsi effet de méta-annuaire lorsque le répertoire de sites se dote d'un moyen de suivre régulièrement ses mises à jour, par exemple grâce à RSS. A la description pure s'ajoute l'aspect progressif et prospectif qui fait la richesse d'un répertoire en évolution, suivant le rythme du Web, par rapport à un catalogue en apparence inerte.

Quelques exemples de répertoires de sites disposant d'un fil RSS :

Droit à l'innovation

Mediatic signalait hier un très beau texte sur la culture et l'information, plus exactement sur les difficultés promises à ceux qui voudront encore innover en grimpant sur les épaules des géants qui les ont précédés.

Un peu de nouveau quand même...

... du moins sur le Figoblog.

Grâce aux efforts renouvelés et bénévoles de mon geek et de l'équipe de Lodel , le Figoblog propose maintenant deux nouvelles fonctionnalités :

Rien de nouveau

L'idée du jour, c'est que l'information est une denrée recyclable. Même si elle trouve beaucoup de sa valeur dans l'actualité, l'information devient connaissance en étant dûment conservée (ce n'est pas à nous bibliothécaires qu'on va apprendre cela !) Pour preuve...

Escalibade

Image associée au billet

Rien à voir avec les figues, mais cette recette catalane de ma maman mérite tout de même le détour.

Prendre une aubergine, un poivron rouge, un poivron vert, deux tomates, deux oignons doux. Les couper en lamelles.

Validation de l'information

La validation de l'information sur Internet, voila un sujet qui a toujours fait frémir les bibliothécaires. Aujourd'hui, avec les blogs, les wikis et toutes ces choses qui sont des sites perso mais sont aussi parfois un peu plus que cela, ce sujet fait aussi frémir les journalistes .

A ce sujet, Mediatic a mentionné il y a quelques temps une petite étude sur la validité de l'information sur Wikipedia . Elle semble tirée d'une journée d'études journalistique où il s'est dit des choses aussi sur les blogs.

A propos, quelqu'un pourrait me dire, franchement, l'intérêt de créer un blog dont l'unique but est de démontrer que les blogs sont stupides et ne servent à rien... Surtout que prendre pour cible les blogs de bibliothécaires est particulièrement mal venu, vu le nombre d'entre eux qui sont professionnels et intéressants. Quant aux autres, est-ce que, parce qu'ils sont bibliothécaires, ils n'ont pas le droit de raconter simplement leur vie comme le font tant de gens sur le Web ? Décidément, il y a des trolls partout, et ils ont vraiment du temps à perdre.

Mise à jour :

Je brûle d'envie d'ajouter un sympathique billet du blog outils de veille qui dit si bien la difficulté d'être veilleur, devant cette masse d'information non validée...

URL, identifiants et compagnie

Plein de questions un peu partout en ce moment sur les identifiants, les URI (qui sont cool s’ils ne changent pas ), les URL, ce qu’ils veulent dire, combien de temps ils durent et comment les utiliser.

Je trouve amusant de voir les différents points du vue sur le sujet :

  • du côté des geeks blogueurs, l’identifiant de rêve c’est le mod_rewrite d’Apache , ou le permalink du blog associé à la grave question de savoir comment il va se bidouiller dans le fil RSS et survivre en cas de déménagement.
  • du côté des geeks standard, la question devient tout de suite plus complexe : les URL doivent-elles avoir un sens ? d’où la question qui en découle aussitôt du rapport entre URN et URL , à savoir entre nom et adresse…
  • enfin du côté des geeks bibliothéconomiques (oui oui, ça existe, un peu), l’identifiant à l’honneur est notre bon vieux ISBN mangé à la sauce URN, URI et RDF.

Et nous, les bibliothécaires ? Nous qui jonglons depuis toujours avec des identifiants pérennes locaux basés sur des adresses (les cotes) ou internationaux basés sur des noms (ISSN, ISBN…), pour nous c’est quoi un identifiant pérenne, un URI, un URN ? Comme d’habitude, cela recouvre une réalité complexe et mouvante, sur laquelle personne n’est d’accord, qui implique à la fois les problèmes des métiers du livres en général et les besoins

DOAJ passe à l'article

Le DOAJ est un répertoire de revues en libre accès qui indexe plus d'un millier de titres.

Il vient de lancer, le 3 juin , un moteur de recherche au niveau article (auteur, titre, mots-clef, résumé) qui porte sur environ 270 titres (ceux qui fournissent les métadonnées appropriées). On peut croiser la recherche avec le titre du journal ou l'ISSN pour faire une recherche dans les article d'un titre.

J'ai été un peu en mal d'informations techniques hélas, mais tout ceci semble reposer sur l'utilisation d'OAI et d'OpenURL .

Errol

Voici un petit outil qui s'agite depuis un moment dans un coin de mes marque-pages : Errol .

Errol est à la fois un projet pour créer des identifiants pérennes à partir de requêtes OAI, un outil de navigation dans des entrepôts OAI, et un générateur de valeur ajoutée : on peut par exemple créer le fil RSS d'un entrepôt OAI en utilisant la syntaxe suivante

"http://errol.oclc.org/" + RepositoryIdentifier + ".rss"

A noter toutefois, le "OAI Viewer" ne fonctionne vraiment bien que sous IE, et il faut que l'entrepôt OAI de vos rêves soit enregistré dans leur répertoire pour que ça fonctionne. Mais sinon c'est pas mal.

Pour en savoir plus sur les implications profondes du projet, consulter les Powerpoint de son papa Jeff Young : ici et .

Premières figues

Image associée au billet

Les voici, les premières figues de l'année. Elles ne sont pas très belles, elles n'ont pas beaucoup de goût, mais... c'est tout de même un bonheur !

Aujourd'hui, c'est bien ma fête...

Compte-rendu d'expérience

Image associée au billet

Cette semaine, les premières figues fraiches sont apparues à l'étalage des épiciers arabes de luxe. Eh oui, dans mon quartier c'est comme ça, quand on veut les plus beaux fruits de Paris, et avant tout le monde, on va chez les épiciers arabes et on paye... Bref, je me disais qu'il était plus que temps, avant que cette info ne se périme, que je donne les résultats de mon enquête sur la confiture de figues sèches .

Donc, j'en ai testé trois : une au jus de raisin, une aux pommes et une au thé.

La confitures de figues sèche au jus de raisin , franchement m'a donné du fil à retordre. Beaucoup d'opérations dans un temps limité pour aboutir à un résultat décevant. Cette confiture est à la confiture de figues ce que la figue sèche est à la figue. Bof, quoi.

Celle qui a mariné dans des pommes râpées est à la limite plus proche de la compote de pommes que de la confiture de figues. Peut-être qu'il faudrait rententer en diminuant le ratio de pommes.

Quant à la confiture de figues sèches au thé de Zabelle , elle était tellement bonne, extraordinaire et sublime que je la mangeais à la petite cuiller en bloguant (si, si, demandez à mon geek). Elle était tellement incroyablement délicieuse qu'elle mérite que je résume ici la recette.

  • on fait mariner les figues sèches coupées en dé une nuit entière dans du thé bien fort (j'avais opté

OpenURL : qu'est-ce que c'est ?

OpenURL est un protocole en cours de normalisation qui sert à créer des liens contextuels. Concrètement, il s'agit de lier des métadonnées (par exemple, les références bibliographiques d'un article) à la ressource elle-même (l'article en plein-texte).

Vous me direz, un protocole de métadonnées, très bien, on en a déjà qui fonctionnent parfaitement, OAI par exemple. Oui mais là, il ne s'agit pas d'un simple lien, mais d'un lien contextuel. Pour une ressource (toujours notre article) on connaît le contexte dans lequel elle est citée (la bibliographie qui la cite), décrite (les métadonnées de l’article et qui les a rédigées), utilisée (le lecteur qui la recherche et les droits dont il dispose), et la façon dont on utilise le protocole (quel résolveur, pour obtenir quel service) pour la lier à ce qu’elle décrit (l’article lui-même).

En fait, la norme OpenURL Framework se compose de trois choses

  • le ContextObject : le paquet de métadonnées qui contient les informations sur une ressource et son contexte
  • l’OpenURL proprement dit : un protocole de transport de ces paquets basé sur HTTP
  • le registry qui contient les spécifications des différents éléments constitutifs des ContextObjects et de l’OpenURL.

Qu'est-ce qu'un ContextObject ?

Il s'agit d'un paquet de métadonnées qui décrivent une ressource et son contexte :

  • les

De l'accès (et autres questions)

Le CLIR publie un ouvrage collectif sur les tendances qui affectent les bibliothèques, et en particulier la manière dont elles donnent accès aux ressources qui intéressent les chercheurs.

Access in the future tense rassemble six articles, qui abordent en fait aussi bien le problème de la préservation de l'information que celui de l'accès proprement dit (mais comme on le sait, ces deux notions sont aussi indissociables qu'antinomiques pour les bibliothèques...)

L'ouvrage est disponible librement, en texte ou en PDF, et on peut aussi le commander en papier pour 20$.

Moins accessible hélas, le numéro 39 (4e volume, 2004) de Journal of Library Administration est un numéro spécial sur l'accès (plus précisément : Improved Access to Information: Portals, Content Selection, and Digital Information). Il semble que les heureux suscripteurs d'un abonnement à ce journal se régaleront d'articles orientés usagers et services. Les autres se contenteront d'enrichir leur bibliographie.

Enfin, les lecteurs d'Outils Froids ont eu la joie de plonger à l'intérieur de l'esprit des utilisateurs de moteurs de recherche pour y découvrir comment ceux-ci s'orientent dans les listes de résultats. Utile et à mettre en perspective avec nos propres interfaces de recherche : de telles études pourraient bien apporter un coup mortel au mythe de la liste de réponses

Classifications appliquées au Web sémantique

Rapidement, avant que ces ressources ne disparaissent sous la pile virtuelle de choses intéressantes que j'amasse en ce moment, voici deux sites intéressants pour les cliqueurs fous qui chercheraient des centaines de liens sur la classification de l'information pour le Web sémantique :

Merci à InfoDesign et à Michel Dumais .