Culturonomics

Le projet de bibliothèque numérique universelle de Google a déjà permis l'avènement d'une nouvelle branche des sciences humaines, la « culturonomie ». Une équipe de chercheurs de Harvard a publié en décembre 2010 dans la revue Science (1) une étude montrant comment on peut mettre à profit cette base de données pour détecter l'évolution de mots et des concepts, en fonction de la fréquence de leur utilisation depuis l’orée du XVIème siècle jusqu’à 2008 (inclus !), en anglais, français, allemand, russe, espagnol, chinois – et hébreu. 

 
« On peut étudier quantitativement la culture comme on peut étudier l'évolution en biologie », proclame le chercheur en psychologie Jean-Baptiste Michel, qui est à l'origine de cette initiative – et de cette nouvelle science. Plus précisément, il s'agit d'étudier les changements des « sensibilités culturelles », depuis l'invention de l'imprimerie, comme on traque les modifications d'un gène ou d'un phénotype. Certes, tout cela est encore balbutiant, et bute sur des limites importantes. L'une d'entre elle est la question des « métadonnées », c'est-à-dire les informations bibliographiques fournies par Google, problème évoqué dans le numéro 21 de Books (« le musée des erreurs de Google Books »): à ce jour, elles ne sont fiables que pour environ un tiers des livres numérisés - soit tout de même 5 millions ; pour le reste, les erreurs de datation sont plus que fréquentes. 
 
L'autre limite – nettement plus gênante – concerne le glissement sémantique d'un mot, phénomène que la fréquence de son utilisation ne permet pas d'éclaircir. Le mot « ennui » a, par exemple, une évolution tourmentée : un pic d’utilisation mi-XVIIème, un autre fin XVIIIème, un autre à l’époque romantique, puis, après un long déclin, une spectaculaire reviviscence depuis 2000. Fort bon – mais il ne s’agit pas du même « ennui », concept complexe dont le spectre va des émois amoureux aux emmerdements financiers. L'intérêt d’une telle analyse quantitative, nuance modestement Jean-Baptiste Michel, c'est de soulever des questions plutôt que d'apporter des réponses. Mais surtout, ce nouvel outil permet à tout un chacun (en allant sur Google labs) d'effectuer des recherches sur la célébrité des noms propres ou la popularité de certains concepts à travers les années. 
 
Ce passe-temps est très en vogue dans les bureaux américains, où la crise autorise encore quelques libertés. Le plus intéressant est toutefois d’étudier l’évolution comparée, transcrite sous la forme d'un graphique, entre deux mots ou concepts. Essayez par exemple « Dieu » vs. « sexe » depuis 1850 : le premier prend la main, si l’on ose dire, vers 1860, creuse l’écart avec un pic en 1880 (l’Ordre Moral !), puis stagne jusqu’à nos jours ; le second redresse un peu la tête dans l’entre-deux guerres, et les deux courbes se rejoignent - mais oui ! - en 1968 ; puis la courbe devient une belle droite pointant à 45° vers le coin haut du graphique. Toute l’histoire de notre civilisation.
 
(1) « Quantitative Analysis of Culture Using Millions of Digitized Books », Jean-Baptiste Michel et al. Science Magazine, 14 January 2011:

SUR LE MÊME THÈME

Blog « Notre Antigone n'a pas pu sortir »
Blog Le bel avenir de la presse papier
Blog Entre les murs

Dans le magazine
BOOKS n°123

DOSSIER

Faut-il restituer l'art africain ?

Chemin de traverse

13 faits & idées à glaner dans ce numéro

Edito

Une idée iconoclaste

par Olivier Postel-Vinay

Bestsellers

L’homme qui faisait chanter les cellules

par Ekaterina Dvinina

Voir le sommaire