Pas besoin d’avoir fait la Techcrunch Academy pour savoir: que XML est partout; que les bibliothèques sont dans le business des données (bibliographiques), et qu’elles ne sont pas toutes seules sur ce créneau.
Maintenant que Yahoo! remplace le CNDP en lançant Yahoo! Teachers, une plateforme proposant, sur le mode social devenu habituel, des ressources pour aider les enseignants à préparer leurs cours, on comprend bien qu’aucune pratique professionnelle ne peut prétendre vivre protégée de ces développements.
Comme le dit Anna Gold en introduction d’un article de DLib Mag (pas encore lu), il est clair que tout le monde,
tous ceux qui ont un rôle dans l’infrastructure traditionnelle de la recherche et de la communication (scientifique) tente de prendre sa place dans le paysage émergent des données (scientifiques): bibliothèques nationales; agences de financement de la recherche; universités et bibliothèques; géants du logiciel et de l’édition.
Et le débat des bibliothécaires entre collections et services perd beaucoup de son sens quand on est en ligne, car il est impossible, en ligne, de proposer des services sans avoir de bonnes données sous-jacentes: les services sont construits sur les données. Dans l’ordre, il faut donc d’abord mettre la main sur les données pour pouvoir réfléchir aux services qu’on collera par-dessus.
A cet égard, les bibliothèques ont plusieurs problèmes:
- leur volume de données est trop petit. Avec 500.000 notices bibliographiques, tu ne peux pas faire grand chose en terme de web 2.0. Car le web 2.0, c’est le règne de la masse critique, de l’algorithme, de la statistique. Ca ne marche bien que si on peut brasser de grands volumes de données: avec trois mots clés tu fais pas un nuage de tags. En France, seuls la BnF et le SUDOC ont le volume de données idoine.
- leurs données sont cachées: planquées au fond du SIGB, dans un format ésotérique (MARC), qu’on peut le plus souvent seulement exporter d’un bloc, sans synchronisation, sans xml: tout aux forceps
Où je veux en venir? A l’idée que les données sont rendues publiques en xml, qu’on doit en produire, en consommer, en digérer pour à notre tour les diffuser. e.g.: j’ai une notice bibliographique, que j’exporte en XML vers mon site web, que j’enrichis en allant chercher, en xml, des tags chez Librarything, des snippets chez Google Books, des vignettes chez Amazon; que l’usager peut mettre dans “Ma Bibliothèque”, l’enrichir de notes personnelles, de liens entre notices, et à son tour exporter en xml.
Tim Spalding, qui propose, je l’ai déjà dit, l’opac le plus riche que je connaisse sur librarything.com (à défaut du plus esthétique), a franchit un pas de plus en proposant un bookmarklet qui permet de récupérer les identifiants uniques des livres de Google Book Search. Ce qui lui permet de proposer un lien vers les snippets ou le plein texte dans GBS quand il existe.
C’est d’une simplicité enfantine (il l’explique dans un post): il prend le catalogue LibraryThing, interroge GBS (par ISBN, titre, auteur), et quand il a trouvé un résultat, récupère l’identifiant unique GBS. Dans le flux XML de réponse, Google donne identifiant, titre, auteur… et ISBN, ce qui permet de relancer le flux vers Amazon pour aller chercher d’autres informations, la vignette par exemple.
Vous me suivez? Comme dirait Plotin, tout est dans tout, suffit de se servir.
Par parenthèse, j’ai fait le test sur ma propre bibliothèque dans LT: sur un peu plus de 700 livres, environ 600 existent dans GBS et ont donc été numérisés…
1 Response to “Tim Search Search”