openlibrary.org

Via Tim Spalding: ouverture publique d’openlibrary.org.

Le projet, soutenu par Internet Archive, propose des notices et, quand il le peut, le plein texte (Internet Archive scanne de très nombreux ouvrages), de tous les livres. Avec, parmi les projets de développement futur, une fonctionnalité Print-on-Demand.
L’objectif, en terme de contenus, est simple: tous les livres. Ils partent d’une copie du catalogue de la Bibliothèque du Congrès et des catalogues fournis par certains éditeurs; l’interface fonctionne sous forme de “wiki structuré”, permettant à quiconque le souhaite d’alimenter la notice catalographique. C’est le première sens de l’ouverture dans “open” library.
Le second sens? Les notices seront téléchargeables gratuitement. Avec des API.

Intéressant: les notices ne sont pas en MARC mais dans un schéma qu’ils appelent futurelib. On peut le voir dans une première version sur le site. Le shéma, par rapport à MARC, est remarquable de simplicité et, pour autant qu’on puisse porter ce genre de jugement sur un schéma parcouru à la va-vite, de pragmatisme. Futurelib semble prendre acte du fait que toutes les études statistiques ont montré que la plupart des champs MARC ne sont que très (très très très) rarement utilisés. Voici par exemple les champs pour l’auteur. Et je vais être franc: je pense que ça suffit.

‘author’:
{
‘name’: { ‘type’: ’string’ },
‘birth_date’: { ‘type’: ‘date’ },
‘death_date’: { ‘type’: ‘date’ },
‘bio’: { ‘type’: ‘text’ },
},

Ils ajoutent à ce schéma un nouveau numéro identifiant, Open Library Number (OLN) – une sorte d’ISBN pour tous les livres, pas seulement les livres récents.

Mais le premier objectif, bien sûr, est de récupérer le plus de notices possibles. Il y a une rubrique sur le site vous indiquant comment aider le projet. Entre autres: aidez openlibrary à récupérer des notices.
Je pense que l’ABES serait tout indiquée: un petit dump de la base Sudoc, c’est vite fait, ça coûte pas cher. Et je ne pense pas que ça ne pose de problème juridique: openlibrary.org ne fait aucun usage commercial des notices récupérées…
Ce serait un bon moyen d’avoir toutes les notices des BU françaises sur le web, facilement récupérables, indexables par les moteurs de recherche, etc. Bref, de pousser nos données vers le web.

1 Response to “openlibrary.org”


  1. 1 Syma

    A noter tout de même que pour le moment, l’openlibrary n’est pas très clair quant à la licence qu’ils veulent appliquer aux données.

    Si eux ne font pas une usage commercial, il faut voir sous quelle licence ils fournissent leur contenu et ce que les gens risquent d’en faire derrière, avec les api mises à disposition. Richard Wallis en parle sur panlibus : http://blogs.talis.com/panlibus/archives/2007/07/license_for_ope.php

    Pas sur que le sudoc veuille que ses notices passent sous GFDL !

Comments are currently closed.