Hubert Villard, directeur de la Bibliothèque Cantonale et Universitaire de Lausanne, est venu à l’enssib faire une conférence sur la participation de sa bibliothèque au programme Google Book Search. Mes notes ci-dessous (merci à H. Villard pour sa relecture).
Hubert Villard note d’abord que ce projet s’insère pour la BCU dans une vision, imaginée dès 1992 à l’occasion de la réflexion sur l’avenir des systèmes informatiques de bibliothèque, d’un système global de bibliothèque incluant le plein texte. Une bibliothèque numérique globale qui, en 1992, rencontrait plusieurs obstacles: la qualité insuffisante des scanners de l’époque, le coût des mémoires de stockage et, déjà, la question des droits d’auteur.
Les deux premiers problèmes ont été en grande partie réglés par l’évolution technologique, le troisième, juridique, non.
La BCU s’est d’abord lancée dans des programmes de numérisation interne, soit à partir des microfilms realisées pour des quotidiens et revues (dont il note qu’ils sont de qualité suffisante pour une numérisation en vue de diffusion web, mais pas dans une optique de sauvegarde), soit à partir d’originaux. Les numérisations de ce type ont concerné, et concernent encore, des collections de périodiques locaux, et elles sont faites pour partie en partenariat avec une société locale, Assy. Le problème de ce programme initial est que les montants que la BCU peut y engager ne permettent pas de numériser des quantités significatives de documents: la conclusion est qu’à ce rythme-là, pour les livres en particulier, il est illusoire pour la BCU d’avancer raisonnablement vers la “bibliothèque numérique”.
Des contacts sont pris par la BCU avec Google en novembre 2006. Le processus de discussion décrit par Hubert Villard est intéressant: les discussions sont informelles et faites de demandes de renseignements mutuelles, sur la collection en particulier: son contenu, son caractère encyclopédique et multilingue, son état, etc.; la BCU s’assure aussi de l’absence d’opposition politique au projet, auprès des élus, de la Bibliothèque nationale suisse (on est dans un état fédéral, ne pas l’oublier), de l’université; Google fait signer un “non disclosure agreement”, qui interdit toute communication jusqu’au communiqué de presse élaboré en commun.
Dans l’analyse rétrospective de Hubert Villard, il apparait clairement que le fait d’être un premier partenaire francophone a favorisé la BCU; Patrick Bazin, directeur de la BM de Lyon, présent lors de la conférence, fera ensuite remarquer à raison qu’il n’est sans doute pas innocent que le premier signataire francophone n’ait pas été Français.
Une fois le contrat signé, le travail commence, et c’est la partie la plus intéressante de la conférence, parce qu’on voit très concrètement en quoi consiste le programme. Ce qui frappe, c’est à la fois son pragmatisme et son professionnalisme.
La BCU prend à sa charge la confection des programmes informatiques nécesaires à l’édition des signets et des listes de chargement, la préparation des collections à expédier en numérisation, et les suivis des sorties et retours de documents: elle y consacre 3 personnes à mi-temps.
Tout le reste, ou peu s’en faut, est pris en charge par Google.
Ca commence par les chariots, fournis par Google: il s’agit d’un modèle spécifique, identique pour toutes les bibliothèques partenaires du programme, avec un gabarit déterminé qui permet de savoir combien de pages on a à numériser: deux chariots peuvent contenir un nombre de livres très différent, mais ils auront toujours, à 2% ou 3% prêt, le même nombre de pages à scanner.
Le choix des livres est très soigneusement fait: une fiche (signet) est tirée par programme à partir du catalogue de la bibliothèque, par ordre de cote, et indique, outre un code barres, quelques éléments d’identification, et une longue liste de raisons pour lesquelles le document pourrait être écarté: abîmé, hors gabarit (les livres trop volumineux sont écartés), etc. L’absence de notice au catalogue n’est pas un obstacle: les métadonnées seront fournies a posteriori. Afin d’être en conformité avec les lois sur le droit d’auteur, sont exclus systématiquement les ouvrages postérieurs à 1867 (un auteur ayant publié à l’âge de 20 ans en 1880 n’est pas nécessairement mort depuis 70 ans s’il a vécu repu de jours). Ces dates, souligne H. Villard, sont un choix de Google, volontairement très prudent dans la détermination de ce qui est hors-droit en Europe. Un volumineux “manuel” établi en commun recense les critères de sélection, qui peuvent être différents d’une bibliothèque à l’autre.
Les livres, prélevés rayon par rayon, sont mis en chariots, protégés par une bâche et chargés dans un camion: le sens de chargement dans le camion est prescrit, les secousses avant-arrière étant plus importantes que les mouvements latéraux; on est visiblement très attentif aux détails. D’ailleurs, Google assure les livres, à hauteur d’un prix forfaitaire, ici, de 100€ le document. Ils sont emmenés ensuite en Angleterre. Pour l’instant, et pour la BCU, plus petit partenaire de GBS, les envois se font à hauteur de 5000 docs / mois. Ce rythme augmentera sans doute ensuite. Dans la première étape prevue par le contrat, la BCU va faire ainsi numériser 100.000 documents, soit 5% de ses fonds.
La numérisation faite par Google doit donner lieu à deux copies: une pour Google, une pour la BCU, chacun ayant libre disposition de sa propre copie, hormis le droit de la mettre à disposition de programmes concurrents. La BCU bénéficie aussi d’une copie du texte OCRisé.
La question pour la BCU est désormais de savoir comment preserver et sécuriser sa copie numérique. On peut faire un lien URL depuis le catalogue vers l’exemplaire en ligne sur GBS; on peut opter pour l’offre d’hébergement proposée par Google eux-même, qui propose ainsi une “vue BCU” de la collection GBS (“hosted solution”); on peut mettre en ligne une version de diffusion (pdf?) sur le serveur académique de Lausanne. Quant à l’archive pérenne (format tiff), sa gestion reste à envisager. Ce sont, pour la BCU, les challenges à venir.
C’est vraiment un programme remarquable à bien des points de vue: partenariat public / privé, vision pour l’avenir, gestion de flux et de volumes, questionnements informatiques et techniques, etc.
Dans une bibliothèque qui, il est vrai, a l’habitude du dynamisme: je vous invite à lire leur “vision stratégique” pour 2006-2010: c’est simple, clair, et cela fixe réellement un cap que bien des bibliothèques pourraient adopter. Ne serait-ce que par le fait qu’il est formulé.
Allier le pragmatisme de la réalisation avec la vision prospective: Messieurs les Vaudois, chapeau bas.
Pingback: apsed | La procédure de numérisation d’une grande bibliothèque
Pingback: Google et le blues des bibliothécaires « Des Bibliothèques 2.0