Internet

Du spam dans mon RSS

Ca faisait un moment que j'avais remarqué des dysfonctionnements dans mon bon vieux Bloglines. Par exemple, pour des raisons inexpliquées, certains blogs très intéressants ne reçoivent plus aucune mise à jour dans Bloglines depuis des mois, et j'arrive pas à réparer. Pour d'autres, j'ai été obligée de me désabonner et de me réabonner dans la foulée.

Mais alors ce matin ça dépasse tout :

RDF et les bibliothèques : avant-goût

Parfois la pensée fonctionne comme un boeuf-carottes : il faut laisser mijoter. Tous les ingrédients sont là avec une saveur simple et claire, mais pas extraordinaire. On a la recette sous les yeux, à première vue il suffit de mélanger. Mais la révélation, le goût subtil, le fumet délicieux, ne vient que bien plus tard, après que ces ingrédients aient été longuements mélangés et tournés dans la cocotte de notre esprit.

Réseaux sociaux et numérisation

Les bibliothécaires 2.0 se prennent la tête en ce moment pour essayer de trouver ce que les réseaux sociaux ont à apporter à la connaissance, la science, la culture, enfin aux bibliothèques. Chez Facebook apparemment ils ont trouvé la réponse : ils utilisent maintenant une version adaptée du système ReCaptcha.

A chaque fois que quelqu'un envoie un message ou ajoute un ami dans Facebook, il numérise un mot en mode texte pour Internet Archive.

31-08

Aujourd'hui c'est le blog day. Donc, il faut faire découvir 5 blogs de préférence, en dehors de mon monde habituel... Je vais essayer mais ça ne va pas être facile, car je dois bien avouer que je n'ai pas eu beaucoup de temps à consacrer à la découverte de nouveaux blogs ces derniers mois. Enfin, s'il faut en citer 5...

Le blog du Bibliophile : et ne me dites pas que c'est dans mon environnement habituel ! Des énigmes, de très jolies choses et de la bonne humeur.

Plein d'exemples de visualisation

On peut facilement passer plusieurs heures à explorer le site Visual Complexity. Il référence près de 500 projets de visualisation d'information, classés par sujet avec des copies d'écran.

Ca va trucs assez old style comme ça :

Migration

Il y a quelques semaines, Got m'a proposé de venir habiter chez lui. C'était une décision difficile, mais parfois il faut savoir s'engager, dans la vie : je lui ai donc dit "oui", pour le meilleur et pour le pire ;-)

Retour sur Facebook

Après cette courte introduction, je vais essayer de re-bloguer. Il me reste exactement une semaine avant de vous quitter pour des cieux plus radieux, n'emportant dans ma besace que ce qui est nécessaire à ma survie, et une connexion internet n'en fera pas partie. Espérons que je trouve l'énergie d'écrire entre temps les quelques petits billets qui me trottent dans la tête.

L'avenir de l'OCR : l'HCR

"HCR" pourrait vouloir dire "human character recognition", eh oui, je vous présente aujourd'hui un projet révolutionnaire qui permet de faire de la reconnaissance automatique de caractères en utilisant... des gens.

Le projet reCAPTCHA est tout à fait emblématique du pragmatisme à l'américaine qui caractérise des projets comme Internet Archive. Il part d'un genre de syllogisme :

  • quand on numérise, on a du mal avec l'OCR parce que certains mots ne peuvent être reconnus que par des humains
  • sur le web, on utilise des mots qui ne peuvent être reconnus que par des humains pour faire barrage aux robots
  • on n'a qu'à utiliser les mêmes humains pour reconnaître les deux types de mots !

Donc voilà, on va proposer aux blogs et autres sites de ce genre d'utiliser comme antispam un captcha à deux mots : le premier, connu par l'ordinateur, permet de faire barrage aux robots, et le second est un mot extrait de la numérisation d'IA qu'on n'arrive pas à océriser. Si plusieurs utilisateurs "numérisent" le même mot, celui-ci est validé dans IA.

Amis blogueurs qui avez des problèmes de spam de commentaires (ce n'est pas mon cas parce que je suis sous Lodel, mais bon, ça va peut-être changer, enfin bref), faites une bonne action : utilisez un captcha reCaptcha. C'est gratuit, c'est un web service, c'est accessible et en plus, ça génère de la

Livre dans ta Face

Du côté de nos amis biblioblogueurs anglosaxons, j'observe depuis quelques temps un certain "buzz" autour du réseau social Facebook. Un buzz à vocation bibliothéconomique, indéniablement ; d'ailleurs la première fois que j'en ai entendu parler ça devait être à ELAG.

En fait, je n'ai jamais été très branchée réseaux sociaux ; à part une courte expérience sur Ning dans la continuité des biblioblogs, je ne me suis jamais inscrite au moindre réseau auparavant. Donc voilà, Facebook, je tente ou plutôt, j'explore.

En fait ce qui a attiré mon attention sur Facebooks c'est un autre outil, Libguides. Il s'agit d'un système de publication qui permet de fabriquer facilement des descriptions de collections dans une style "2.0", comme par exemple ça : Finding Newspapers. Vous remarquerez le côté "humain" du bibliothécaire, dont on peut voir la photo à côté de son oeuvre et à qui on peut laisser un message même en temps réel : un service qui autant que je puisse en juger n'existe pas dans une bibliothèque de la vraie vie parce que 1. les bibliothécaires ne signent pas personnellement leurs outils de recherche et 2. la consultation de l'outil et la rencontre avec le bibliothécaire sont souvent des phénomènes asynchrones.

En outre, ce système de publication de guides est Facebook-proof, ce qui semble être un gros

Your Archives

Créez "vos archives" : telle est la proposition des Archives Nationales de Grande-Bretagne aux internautes à travers ce wiki.

Ce wiki permet aux usagers des archives britanniques, après enregistrement sur le site, d'enrichir les notices des inventaires (avant/après), de faire des transcriptions, ou de rentrer des informations utiles sur n'importe quel sujet de recherche en liaison avec les archives anglaises, nationales ou non.

On peut saluer le pragmatisme typiquement anglo-saxon du projet :

  • il utilise le logiciel Mediawiki, du coup ça "ressemble" à wikipédia et de fait, cela acquiert un côté rassurant, parce que connu
  • le système de modération est hyper-simple (il faut être enregistré, mais n'importe qui peut s'enregistrer après avoir lu les conditions d'utilisation). On peut également signaler un abus.

Le site n'est pas très rempli pour l'instant mais à mon avis c'est une expérience à suivre.

Vu chez Peter Scott.

Syndiquer le contenu