Google books : le vrai piège

L'annonce par Google de numériser des bibliothèques entières a, en son temps, déclenché les ires de tous les Jeanneney du monde. À bien des égards, ils n'ont pas eu tort. Pour autant, la question la plus essentielle n'a pas encore été présentée ou soulignée comme elle le méritait, alors que le programme de numérisation de masse de Google date déjà de plusieurs années. Quelle est cette question ? Elle porte sur la nature précise du document numérique que nous offre Google chaque fois que les lois le permettent.
La procédure, on le sait, est d'une simplicité enfantine. Je me place dans Google Books et j'inscris ma requête au bon endroit pour immédiatement obtenir le résultat. Tapons « Bovary » pour voir, et immédiatement se révèle une liste de possibilités, dont la première est le livre complet, disponible par le biais du Taylor Institute d'Oxford. Prenons cet exemplaire et affichons-le. Superbe ! Tout y est, y compris les illustrations dans une édition datant de 1885 (A. Quantin éditeur-imprimeur). Cherchons maintenant « Homais » ; le voilà qui apparaît trente fois, chaque fois accompagné d'un court passage et de la page correspondante. Voilà en vérité un outil de travail impressionnant.
L'étape suivante paraît évidente : je veux cet exemplaire ici, chez moi. Aucun problème ! Obligeamment, Google nous permet de télécharger le fichier offert. Il nous permet aussi de le placer dans une bibliothèque personnalisée (en ligne). Pour couronner le tout, on trouve une invite à commentaire. Malgré tout, l'instinct de possession reprend vite le dessus, et je fais venir le fichier, gros de ses six-sept méga-octets. Je viens de devenir l'heureux propriétaire d'une édition de 1885 de Madame Bovary.
Mais de quoi suis-je réellement propriétaire ? Pour voir, je vais afficher le fichier maintenant localisé sur mon disque dur et vérifier ce que je peux faire avec. Je peux le lire à l'écran mais lire tout un livre à l'ordinateur, très peu pour moi ! Faisons quelque chose de mieux et recherchons « Homais » de nouveau. Docilement, mon lecteur de fichiers pdf cherche, cherche, et, au bout de quelques secondes m'annonce qu'il ne trouve rien. Madame Bovary sans Homais, ce n'est plus Madame Bovary. Que se passe-t-il donc ?
La réponse est simple. Google numérise à toute vitesse des millions de pages-images. Ensuite, en utilisant des logiciels de reconnaissance de caractères, il se crée un fichier texte de ces pages images. L'utilisateur, à condition de passer par Google, visionne la page image, mais il peut aussi faire usage du fichier texte invisible pour retrouver, par exemple, les occurrences de « Homais » dans le roman. Malheureusement, quand il télécharge les pages-images du roman de Flaubert, le fichier texte ne l'accompagne pas. Le résultat est donc un objet lisible à l'écran, point final. La recherche de « Homais » par ordinateur n'est plus possible.
Qu'à cela ne tienne, je puis imprimer ce roman. Effectivement, on peut imprimer les 472 pages de ce fichier et, peut-être, les faire relier quelque part... Mieux vaut probablement placer ce fichier sur un lecteur de eBooks et ainsi le lire plus confortablement que sur un écran. C'est un petit progrès, mais c'est le seul. Cela dit, le résultat n'est quand même pas nul ! Avec Google, on a accès à toutes sortes de textes, y compris des textes rares ou des éditions anciennes d'ouvrages célèbres qui sont désormais dans le domaine public.
Au final, la générosité de Google dissimule quelque chose de beaucoup plus profond et important. Rechercher les occurrences de « Homais » dans le roman de Flaubert ne peut s'effectuer que si l'on a accès à une version du fichier ouverte aux opérations algorithmiques des ordinateurs et de leurs logiciels. Le grand secret, c'est que cette dimension nouvelle de nos documents est en train de prendre de plus en plus d'importance. Le grand secret, c'est que Google se réserve cette version du document. Ce que cherche Google, c'est de devenir le système d'exploitation dominant, voire unique, de cette algorithmique. Vous cherchez quelque chose ? Passez par Google ! Sinon, restez chez Gutenberg et amusez-vous bien ! Et retrouvez les trente occurrences de « Homais »...
La menace de Google, ce n'est pas une question de diversité culturelle. Mon Flaubert arrive d'Oxford, après tout. Cette diversité culturelle, elle se fonde sur les collections des bibliothèques et non sur le processus de numérisation. La menace de Google, c'est de monopoliser tout le champ algorithmique en train de croître autour des documents numérisés. Grâce à cette algorithmique, la lecture va être profondément enrichie et même modifiée. Par conséquent, ceux qui ne passeront pas par Google demeureront coincés dans le XXe siècle.
LE LIVRE
LE LIVRE

76 de Google books : le vrai piège, Editorial Tamarisco

SUR LE MÊME THÈME

Blog « Notre Antigone n'a pas pu sortir »
Blog Le bel avenir de la presse papier
Blog Entre les murs

Dans le magazine
BOOKS n°123

DOSSIER

Faut-il restituer l'art africain ?

Chemin de traverse

13 faits & idées à glaner dans ce numéro

Edito

Une idée iconoclaste

par Olivier Postel-Vinay

Bestsellers

L’homme qui faisait chanter les cellules

par Ekaterina Dvinina

Voir le sommaire