Le point sur Google Livres par un bibliothécaire suisse, éminent spécialiste des bibliothèques numériques, et qui présente une synthèse exhaustive, objective et stimulante de la question. 

Il est non seulement normal, mais sain et même indispensable que l'ambitieux projet de bibliothèque numérique universelle annoncé par Google fin 2004 provoque un débat. Malheureusement ce débat a aussitôt pris en France un tour fâcheusement polémique attisé par l'antiaméricanisme rageur dont les hommes politiques et hauts fonctionnaires français ne sont que trop coutumiers. On saluera donc la parution d'un ouvrage non partisan dont le propos est d'informer ses lecteurs sur l'historique du projet, d'en dresser un bilan provisoire et de faire le point sur les problèmes – techniques, conceptuels, juridiques – qu'il pose. Nul n'était mieux qualifié qu'Alain Jacquesson pour l'entreprendre : ancien directeur de l'École de bibliothécaires de Genève, du réseau des bibliothèques municipales de Genève et enfin de la bibliothèque de la ville, il a déjà consacré plusieurs livres à la question de l'informatisation des bibliothèques et à celle des bibliothèques numériques.

 

 

Comme l'auteur le souligne à juste titre, Sergey Brin et Larry Page, fondateurs de Google, sont des chercheurs et des inventeurs avant d'être des hommes d'affaires : la société qu'ils ont fondée en 1998 – et dont le nom, nous est-il rappelé, résulte d'une confusion sur l'orthographe de "googol", mot fantaisiste inventé en 1938 par le jeune neveu du mathématicien Edward Kasner pour désigner le nombre formé par le chiffre un suivi de cent zéros – est sorti de leurs projets de thèse en science de l'informatique à l'université Stanford. L'idée même de bibliothèque numérique universelle découle naturellement de la mission que s'est donnée Google, "organiser l'information du monde entier et la rendre universellement utile et accessible". Cette haute ambition, dont on peut sourire si l'on y tient, a l'avantage de s'appuyer sur des moyens techniques et sur une conception d'ensemble qui surpassent, quels que soient leurs mérites individuels, tous les autres projets de bibliothèques numériques qui avaient vu le jour auparavant – le Projet Gutenberg remonte au début des années 1970 – et qu'A. Jacquesson a étudiés plus en détail dans son ouvrage Bibliothèques et documents numériques   . C'est donc en pleine connaissance de cause, et muni d'un outil plus performant qu'aucun autre, que Larry Page prenait un premier contact en 2002 avec la bibliothèque de son alma mater, l'université du Michigan. Des contrats étaient ensuite discrètement négociés avec celles de Stanford et Harvard, puis avec la Bodléienne  et la bibliothèque publique de New York, avant que soit officiellement révélé dans un communiqué de presse de décembre 2004 ce qui s'intitulait alors, pas de la manière la plus claire, "Google Print for Libraries" avant de devenir Google Books.

 

Dénoncé aussitôt par Jean-Noël Jeanneney, alors président de la Bibliothèque nationale de France, dans un article du Monde en janvier 2005, puis dans un pamphlet aux accents gaulliens dont nous avons rendu compte dans ces colonnes, comme une entreprise d'impérialisme culturel destinée à imposer par le biais de l'internet une "vision américaine du monde", Google Books a aujourd'hui des bibliothèques partenaires dans plusieurs pays : Allemagne, Belgique, Espagne, France, Italie, Japon en plus du Royaume-Uni dont il a été question plus haut. La BnF elle-même, désormais dirigée par Bruno Racine, est entrée en pourparlers avec Google, avec la bénédiction, semble-t-il, de Christine Albanel, même si aucun accord n'a été officiellement annoncé depuis que le cabinet de Frédéric Mitterrand s'est saisi du dossier.

 

 

L'un des grands enjeux de toute bibliothèque numérique, sinon le principal, est ce qu'on appelle le  contrôle bibliographique, en d'autres termes la qualité, l'exactitude, la précision, l'exhaustivité et (critère important pour une bibliothèque mondiale) la cohérence des données, dites "métadonnées", qui sont derrière chaque image et permettent de repérer sans risque d'erreur tout ce que l'on cherche et rien que ce que l'on cherche. Il est probable que Google ait mésestimé l'ampleur et la complexité du problème. Il l'a partiellement résolu en s'alliant, en 2008, avec le catalogue collectif OCLC (WorldCat), alimenté au départ par les bibliothèques américaines, en vue de créer un lien entre ses notices et Google Books. Mais il faut bien reconnaître que Google – de même qu'OCLC d'ailleurs, instrument précieux mais nullement parfait   – a encore un long chemin à accomplir pour maîtriser un problème que les grandes bibliothèques du monde sont elles-mêmes loin d'avoir maîtrisé, comme le montre, par exemple, l'insuffisance chronique de la recherche par sujet au catalogue en ligne de la BnF.

 

 

Un deuxième problème de taille, technique et non intellectuel cette fois, est le passage des images scannées au mode texte, préalable à toute indexation du contenu. Or si le processus de reconnaissance optique des caractères (OCR) est très fiable pour les ouvrages récents, plus on remonte dans le temps et plus les mauvaises surprises s'accumulent. Un exemple parlant, et particulièrement désastreux, tiré de la troisième édition du Théâtre d'agriculture d'Olivier de Serres, est fourni par A. Jacquesson p. 172. On voit au premier coup d'œil que le logiciel utilisé par Google aussi récemment qu'en 2007 était incapable de distinguer entre un long "s" et un "f"   . Pour une bibliothèque universelle dont la richesse principale, vu les problèmes juridiques évoqués ci-dessous, devrait être sa partie ancienne, une carence aussi grave ne peut qu'inquiéter. Quant aux projets reposant sur la dactylographie de documents anciens – Text Creation Partnership de l'université du Michigan, ou en liaison avec la base de données Early English Books Online –, qui peut croire sérieusement qu'ils seraient totalement exempts d'erreurs ? La numérisation n'est pas si différente, sous ce rapport, des migrations d'un support à un autre au cours de l'histoire (du papyrus au parchemin, du volume au codex, des manuscrits en onciales à la minuscule caroline, du livre manuscrit au livre imprimé...).

 

 

Le problème juridique est évidemment celui qui a fait couler le plus d'encre (et enrichi le plus grand nombre d'avocats). A. Jacquesson présente très clairement cette question complexe que nous ne tenterons pas de résumer ici. Elle met en jeu de manière très intéressante deux conceptions différente de la protection des œuvres publiées. Dans la tradition anglo-américaine, celle du Copyright Act de 1710 et de la Constitution américaine, ce qui prime avant tout est le progrès des sciences et des arts, et la disponibilité et la libre circulation des œuvres prônées par Google Books vont dans cette direction. Certes, sous la pression des grands éditeurs new-yorkais d'une part et des producteurs de films californiens de l'autre, le Congrès américain a, en 1998, étendu la durée de protection après la mort de l'auteur de 50 à 70 ans (et 95 ans pour les films, comédies musicales et autres), mais les États-Unis ont borné à 1923 la limite hors de laquelle cette protection cesse, alors qu'en Europe elle reste fixée à 1868. Caractéristique est la réaction de Robert Darnton, désormais directeur de la bibliothèque de Harvard, et très critique vis-à-vis de Google Books, mais préconisant un raccourcissement de la durée de protection. En Europe en revanche, il est clair que la balance penche dans la direction opposée, situation compliquée de surcroît par les "exceptions culturelles" comme le droit moral, supposé perpétuel et source de tant d'abus. Il y a là une différence philosophique fondamentale, et qui n'est pas prêt d'être résolue, mais qui sous-tend également la controverse juridique, des deux côtés de l'Atlantique, sur le statut des œuvres dites orphelines, dont les ayants droits ont disparu ou ne peuvent être localisés. Dans l'état actuel des choses, Google Livres fonctionne à deux vitesses : ses utilisateurs américains ont accès à une multitude de documents qui, en Europe, ne sont que des cases vides. Et du point de vue de la recherche, ce sont, une fois de plus, les Européens qui y perdent.

 

 

Dans un monde où tout change de plus en plus rapidement, nul ne peut évidemment prévoir quelle place occupera Google Books dans dix ou vingt ans. Comme le souligne A. Jacquesson, il faut d'abord reconnaître à ce grand projet, même s'il est actuellement générateur, force est de le reconnaître, de plus de frustration que de satisfaction, d'avoir stimulé et complètement renouvelé la perception de la nature et des problèmes de la bibliothèque numérique. Certes, il est légitime de s'inquiéter d'une situation potentielle de monopole de fait, dont le principal risque serait que Google, ne se satisfaisant plus ou ne pouvant plus vivre de ses ressources publicitaires, devienne un service payant, encore qu'avant de s'en indigner, en France en tout cas, on ferait bien de se rappeler que l'accès à la Bibliothèque nationale, pourtant subventionnée par le contribuable, est loin d'être gratuit (contrairement à la Bibliothèque du Congrès ou à la British Library). Et qui nous dit que les usagers suivraient ? Si Google domine le champ, il n'est pas – A. Jacquesson nous le rappelle – l'unique bibliothèque numérique   . Plus la concurrence sera grande, plus Google Books sera contraint de rester compétitif par la qualité et la gratuité de ses prestations. Dans ce domaine comme dans d'autres, le marché est infiniment plus profitable aux chercheurs que le protectionnisme culturel.

 

 

On n'en finirait pas d'évoquer, même brièvement, les questions capitales que pose cet ouvrage, dont on peut recommander la lecture à toute personne désireuse d'avoir une présentation objective d'un des grands débats de notre temps

 

A lire aussi sur nonfiction.fr : 

- Dossier sur le livre numérique : "Pourquoi les éditeurs français courent à leur perte". 

- Jean-Noël Jeanneney, Quand Google défie l'Europe. Plaidoyer pour un sursaut, par Vincent Giroud.