Figoblog Un blog sur Internet, la bibliothéconomie et la confiture de figues

Web sémantique

ORE, un modèle d'objet numérique pour le Web sémantique

L'initiative OAI-ORE, développée dans l'environnement de l'Open Archive Initiative, vient de sortir en version "alpha" ses premières specifications. Depuis le début, je regarde d'un oeil attentif ces travaux qui me semblent répondre à pas mal de questions pertinentes dans l'environnement des bibliothèques numériques, comme par exemple celle de l'interopérabilité des objets complexes. En effet l'objectif d'ORE est de rendre "machine readable" des descriptions de documents complexes qui sont présents sur le Web.

Par Manue le 14 décembre, 2007 - 21:36 dans

Le catalogue en prison

A l'origine, le catalogue était un meuble, composé de tiroirs et de fiches, trônant dans la salle de référence. Pour le consulter, il fallait s'y rendre. Les données étaient prisonnières d'un objet.

Alors, on a fait des catalogues imprimés : diffusés en plusieurs exemplaires, on pouvait les consulter à distance. Mais c'étaient toujours des catalogues en papier, uniquement compréhensibles pour les yeux avisés de lecteurs humains. Les données étaient prisonnières d'un support.

Par Manue le 5 novembre, 2007 - 09:20 dans

RDF et les bibliothèques, biblio

Tiens c'est marrant je ne suis plus toute seule :

- Semantic Libraries, a change of direction ? puis Semantic Web - A Librarian's perspective sur Panlibus

Par Manue le 8 octobre, 2007 - 22:09 dans

RDF et les bibliothèques : FAQ

Ok, c'est un non-sens de parler de "FAQ" pour un sujet sur lequel jamais personne ne pose de questions. Disons que voici quelques réponses aux questions que je me pose souvent à moi-même ;-)

C'est quoi, déjà, RDF ?
Comme son nom l'indique, c'est un cadre de description de ressources. C'est un modèle conceptuel qui permet de décrire des choses. Toutes sortes de choses.

Je suis bibliothécaire. En quoi suis-je concerné par RDF ?

Par Manue le 26 septembre, 2007 - 21:21 dans

RDF et les bibliothèques : avant-goût

Parfois la pensée fonctionne comme un boeuf-carottes : il faut laisser mijoter. Tous les ingrédients sont là avec une saveur simple et claire, mais pas extraordinaire. On a la recette sous les yeux, à première vue il suffit de mélanger. Mais la révélation, le goût subtil, le fumet délicieux, ne vient que bien plus tard, après que ces ingrédients aient été longuements mélangés et tournés dans la cocotte de notre esprit.

Par Manue le 24 septembre, 2007 - 22:18 dans

Recette du Web sémantique à l'usage des bibliothèques nationales

Pour réussir cette recette, vous aurez besoin de :
- 2 kg d'identifiants pérennes (les URIs, de préférence sympas, ont la meilleure saveur)
- un bon morceau de vocabulaire contrôlé (vous pouvez en panacher plusieurs)
- un chapelet d'interfaces de recherche
- assaisonnement : des FRBR, des notices bibliographiques, du Dublin Core, du RDF et autres selon votre goût.

Par Manue le 5 septembre, 2007 - 20:44 dans

La collection numérique dans l'espace

Un des gros problèmes avec le numérique, c'est l'absence totale de perception spatiale qu'on peut avoir en entrant dans la collection. Or nous autres êtres humains, nous avons besoin de nous représenter notre environnement, et le sens que nous utilisons le plus volontiers pour cela, c'est la ''vue''. Avoir une vue d'ensemble d'une collection numérique, ce n'est pas un gadget, c'est complètement essentiel pour permettre d'appréhender sa nature, son contenu, sa forme et son potentiel.

Par Manue le 14 juillet, 2007 - 11:20 dans

Bibliothèques et Web sémantique : le projet VIAF

Le projet VIAF, Virtual International Authority File, est un projet d'OCLC research qui vise à l'origine à aligner des listes d'autorités (notamment sur les noms propres) en vue de constituer une base de référence internationale.

Les premiers à tester ont été la Library of Congress et la Deutsche Bibliothek, qui travaillaient donc à l'alignement de leurs thésaurus respectifs ainsi que c'était décrit ici (ppt) ou .

Dès le départ, le projet affichait des intentions intéressantes en termes d'utilisation des technologies du Web sémantique. Il était aussi question de choses plus traditionnelles mais sur lesquelles on se posait aussi des questions, comme l'utilisation de l'OAI pour échanger des notices d'autorités (alors que, soyons clair, à première vue ce n'est pas fait pour ça).
De plus, cela s'inscrivait dans la continuité de services intéressants offerts par OCLC autour des autorités comme Worldcat Identities qui est un bon exemple de ce qu'on peut obtenir en "faisant travailler les données" comme diraient Lorcan et ses amis.

Aujourd'hui, d'après cette communication prévue à l'IFLA 2007 à Durban, le projet s'élargit avec de nouveaux partenaires, et le discours se radicalise assez nettement autour de l'idée de Web sémantique : ce n'est plus présenté comme une possibilité éventuelle de seconde main, mais comme le coeur du

Par Manue le 13 juin, 2007 - 16:51 dans

Ceci est un blog sérieux

A tous les gens qui seraient susceptibles de débarquer ici pour la première fois, suite à un événement impromptu survenu dans ma vraie vie, je voudrais dire que ce blog a beau être rose fluo (j'ai essayé de changer, mais franchement vous seriez déçus) c'est quand même un blog vachement sérieux.

Il y est question de sujets aussi graves que les rapports de la commission européenne sur les droits d'auteurs qui impactent la numérisation, la construction de la bibliothèque numérique du monde, et la préservation des données numériques.

Y sont évoquées des tas de technologies compliquées comme le passage de MARC en RDF, l'impact de l'OAI sur l'interopérabilité, et les services de terminologie.

Ce blog se pose des tas de questions existentielles pour l'avenir de la bibliothéconomie numérique, telles que la modélisation conceptuelle des accès, les entrepôts du Web 2.0, et l'univers des données scientifiques du futur.

Enfin ce blog est truffé de références vers des sites originaux et pertinents, comme la Chronologie d'histoire de l'art du Metropolitan Museum of Art et le moteur BabyGo destiné aux enfants.

En plus, ce blog est vraiment sérieux car il cite ses sources : Resourceshelf et Catalogablog souvent, mais parfois aussi Open Access News et des collègues français comme Affordance. Alors, hein, si c'est pas sérieux tout ça !!! Le

Web sémantique appliqué aux collections numériques

En ce moment, je fais un peu de veille sur les technologies du Web sémantique appliquées aux bibliothèques (en général) numériques (en particulier). Je vous propose de m'accompagner dans cette découverte, à travers quelques exemples commentés.

Le premier que j'ai choisi est cette démo qui propose de construire une interface à facettes dans des images à partir de données en RDF. On peut consulter dans ce prototype trois collections d'images, indexées avec 4 vocabulaires différents.

Les "plus" : c'est le côté facettes que j'aime toujours autant, mais aussi la possibilité de rebondir de concept en concept à l'infini. Le système est tolérant aux erreurs ("fuzzy search"). Les données permettent de générer un accès chronologique aux objets (périodes, personnes, oeuvres) en relation avec une requête. D'ailleurs c'est très performant en termes de recherche temporelle (on peut chercher des notions comme avant, après...) On peut exprimer des notions assez complexes (comme la relation plus ou moins éloignée entre deux choses). En plus, les images sont très belles ce qui ne gâche rien.

Les "moins" : l'affichage de certaines données est parfois assez cryptique pour des gens qui ne manipulent pas les technos du web sémantique... notamment tout ce qui permet d'accéder aux relations. Heureusement la FAQ donne quelques

Par Manue le 29 novembre, 2006 - 20:30 dans
Design Figoblog 2008 - Image from http://www.europeana.eu - http://photo.rmn.fr : Codex Vindobonensis, series nova 2644: folio 4 verso