Il vous manque un numéro de Books ? Complétez votre collection grâce à notre boutique en ligne.

Mayer-Schönberger & Cukier : « “Big data” change notre rapport au monde »

Votre livre expédié avant même que vous ne l’ayez commandé, le cheminement d’une pandémie décrit à l’avance, le sentiment amoureux révélé dès la première rencontre par des algorithmes… Voilà le monde que nous promet l’exploitation généralisée de l’énorme gisement de données numériques aujourd’hui disponible. Notre perception du réel en sera bouleversée à jamais.

 

Viktor Mayer-Schönberger est professeur de gouvernance et de régulation de l’Internet à Oxford. Auteur de The Virtue of Forgetting in the Digital Age, il est membre des comités consultatifs de Microsoft et du Forum économique mondial.

Kenneth Cukier est journaliste, chargé du suivi de la révolution des données au magazine The Economist.

 

Amazon s’est vu accorder un brevet pour l’« expédition anticipée » de colis, avant même que le client passe commande. C’est un nouvel indice de l’explosion du « big data », cette « mise en données » de tous les aspects de la vie. Comment est-ce possible ?

K. C. C’est une évolution naturelle. Amazon cherche à tirer de la masse des données recueillies des informations qui lui permettent d’améliorer son efficacité. L’entreprise possède une mine de renseignements sur ce que les gens ont tendance à acheter. Elle s’offre donc là un moyen d’exploiter ces éléments mieux que ses concurrents. Le client adore lire : « Commandez maintenant et recevez tout de suite. » Aucune firme n’avait jusqu’à présent la capacité opérationnelle de faire cela, avec un volume de transactions suffisant pour en assurer la rentabilité. Mais pour Amazon, qui ne peut offrir ce plaisir immédiat que l’on trouve dans les librairies – avoir le produit au moment où on l’achète –, c’est très important. La seule chose surprenante, c’est l’obtention d’un brevet. Cela va créer un malaise dans le secteur : est-ce le type d’innovation qui justifie d’être protégé pendant vingt ans ?

 

Peut-on imaginer que la prochaine pandémie soit prédite par Google ?

K. C. Probablement, et j’emploie ce mot dans son sens le plus sophistiqué. Je m’explique. Le système Google Flu Trend est probabiliste (1). Il ne dit pas avec certitude que les cas de grippe augmentent ou diminuent, ni à quel point. Il exprime uniquement la probabilité pour que certaines recherches soient corrélées avec des cas de mala­die. Par ailleurs, le système a été rodé sur une épidémie passée. Rien ne dit que les recherches faites par les internautes lors d’une nouvelle pandémie auront la même configuration. Il suffit que les symptômes (et donc les mots clés) soient différents. Cela dit, le mécanisme peut être adapté rapidement et déployé presque en temps réel. Ce ne seront encore que des corrélations, mais utiles pour comprendre les voies de propagation de la pandémie.

 

Pensez-vous que le « big data » permettra de prédire les cours des marchés financiers ?

K. C. Sans aucun doute. Il y a quelques années, les ingénieurs de Google se sont rendu compte, pendant une réunion, qu’ils pourraient utiliser leurs données pour prédire les évolutions du marché, mais que ce serait pro­bablement illégal et qu’il valait donc mieux s’abstenir. La firme pourrait par exemple regarder quelles recherches (en volume ou en fréquence) sont corrélées à une hausse à la clôture. Hausse d’une Bourse, d’un indice, voire de valeurs individuelles. Les sociétés financières n’ont pas accès à une quantité de données suffisante pour établir ce type de corrélation. Celles qui ont cherché à exploiter les informations de Twitter n’ont pas obtenu de bons résultats. Ce n’est donc pas si facile. Ce sera sans doute possible pour certains types de mouvements. Mais sans garantie : ne pariez pas votre maison !

C'est gratuit !

Recevez chaque jour la Booksletter, l’actualité par les livres.

 

Vous dites que le contenu de sites d’information comme le Huffington Post doit davantage à l’analyse des données qu’au jugement de la rédaction en chef. Jusqu’à quel point ?

K. C. Nous écrivons que le contenu est « régulièrement déterminé par les données, pas seulement le jugement des responsables humains ». Je ne pense pas que les médias soient prêts à abandonner leur autorité et à laisser les algorithmes devenir les arbitres de l’information. La technologie n’est pas prête et, même si elle l’était, les rédacteurs en chef ne sont pas encore assez humbles pour abdiquer leur responsabilité. Ils ne le seront peut-être jamais, et c’est très bien ainsi. Les humains peuvent se tromper lourdement, mais leur jugement peut être surprenant, provocant, stimulant. Nous prenons des risques que le système « big data » ne prendra pas. Nous tentons d’être inventifs, d’innover, alors que les décisions fondées sur des algorithmes exploitant des données passées peinent à mettre en évidence ce qui est unique.

Cependant, le « big data » peut être à bien des égards plus performant que les journalistes, ou les assister efficacement. Les algorithmes sont plus doués pour recommander la lecture d’articles. Les sites de médias suivent le nombre de visites : si un sujet ne retient pas l’attention, il sera remplacé par un autre qui fait mieux. Une entreprise du secteur a constaté que le moment optimal pour qu’un tweet soit lu était le dimanche à 18 heures. Elle a donc adapté son système pour que le tweet annonçant sa newsletter arrive à 18 heures pour tout lecteur, où qu’il se trouve dans le monde.

 

Beaucoup de gens pensent que le téléphone portable est cancérigène. Or « big data » a permis de démontrer que c’est faux. Peut-on espérer d’autres résultats de ce type ?

V. M.-S. L’analyse d’un très grand nombre de données a en effet permis de montrer l’absence de corrélation entre un usage intensif du portable et le cancer. Et il est vraisemblable que la collecte et l’analyse des « big data » contribueront à démonter des croyances, des superstitions et des mythes solidement implantés dans les esprits, qui ne perdurent qu’en raison du volume insuffisant de données exploitables.

 

Le phénomène « big data » est-il autre chose qu’une simple extension des méthodes statistiques, appliquées à une énorme quantité de données ?

V. M.-S. Oui, il est bien davantage que cela. De même que le cinéma est autre chose qu’une simple extension de la photographie. Si vous prenez une photo d’un cheval au galop toutes les dix secondes et les montrez en séquence rapide, ce sont toujours les photos d’un cheval. Mais si vous prenez quinze photos par seconde et les montrez en séquence rapide, vous voyez un film. Le surcroît de quantité (ici de photos) crée une qualité nouvelle (ici de perception), et nous voyons les mouvements du cheval imperceptibles autrement. Il en va de même avec le « big data » : une explosion de la quantité d’informations crée une nouvelle qualité d’appréhension du réel.

 

Dans votre livre, vous analysez surtout l’effet du « big data » sur le monde des affaires. Mais vous écrivez que son impact sera plus fort sur les individus. Que voulez-vous dire ?

V. M.-S. Son effet majeur portera sur la façon dont nous autres humains donnons du sens au réel, au monde qui nous entoure. Dans le passé, nous l’avons fait en procédant par essais et erreurs, de manière très fastidieuse. Désormais nous pouvons exploiter les analyses du « big data » non seulement pour mieux tester telle ou telle hypothèse, mais aussi pour en formuler de nouvelles. Cela nous donnera une vision beaucoup plus précise de la réalité.

 

Vous écrivez : « Bientôt “big data” nous permettra peut-être de dire si nous sommes en train de tomber amoureux. » Vraiment ?

V. M.-S. Peut-être. De bien des façons, les individus ont découvert récemment qu’ils n’étaient pas aussi uniques qu’ils le pensaient sur le plan des valeurs et des préférences. Ainsi Amazon peut offrir des recommandations d’achat étonnamment justes – pas toujours, mais souvent. L’entreprise le fait en comparant les choix passés de ses clients. À partir du moment où l’ampleur des données le permet, nos comportements sont donc plus fa­cilement analysables et donc prévisibles que nous le pensions. Cela vaut aussi pour le fait de tomber amoureux (après tout, les sites de rencontres en ligne connaissent un beau succès).

K. C. J’aime bien votre question parce qu’elle souligne votre scepticisme, ce qui est sain. Or la chose est peut-être plus facile que vous l’imaginez. D’abord, une analogie. On peut prédire que quelqu’un va être malade s’il a de la fièvre. Mais, avant l’invention du thermomètre, on ne pouvait pas le mesurer. Quels sont donc les nouveaux outils permettant de mesurer la naissance du sentiment amoureux ? Probablement le téléphone portable et des bracelets comme Fitbit ou Nike Fuel (2). Imaginez : après avoir collecté des données sur des millions de gens pendant des années, nous pourrions être capables d’identifier les changements du corps et du comportement les plus corrélés au fait de tomber amoureux (peut-être une accélération du pouls ; la sécrétion d’une hormone ; les deux personnes se tiennent un peu plus proches l’une de l’autre et interagissent un peu plus longtemps, alors qu’elles viennent de se rencontrer ; tout cela est détecté par les portables et les bracelets).

Est-ce de la science-fiction ? Non. En 2010, des chercheurs du MIT, en analysant les profils de mobilité et d’appels, ont été capables de prédire qui allait contracter la grippe avant même que les personnes ne le sachent. Encore au stade de la recherche, cette technologie est amenée à être commercialisée. Nous ne serons pas sûrs à 100 % que nous sommes en train de tomber amoureux. Mais nous serons en mesure d’appréhender un faisceau d’indices convergents, aussi sûrement que le désir éprouvé pour une personne lors d’une soirée.

 

Que pensez-vous de l’affirmation de Chris Anderson : « Le déluge des données va rendre la méthode scientifique obsolète (3) » ?

V. M.-S. Il a tort, et l’a d’ailleurs reconnu peu après l’avoir écrit. La méthode scientifique n’est pas rendue obsolète mais transformée par le déluge de données. Au lieu de se servir de théories pour formuler des hypothèses concrètes, nous pouvons générer par algorithmes des centaines de millions d’hypothèses légèrement différentes afin de trouver la plus pertinente. Bien exploitée, cette méthode permettra d’accélérer le processus de découverte scientifique et d’étendre son champ d’application aux sciences sociales et même aux humanités.

 

Vous prédisez que « l’expert d’un domaine, le spécialiste, perdra de son lustre face au statisticien et à l’analyste des données ». Cela signifie-t-il la « mort de l’expert » ?

V. M.-S. Cela signifie que l’expert autoproclamé qui pontifie sans disposer des éléments empiriques lui permettant d’étayer son point de vue va sans doute se heurter à une opposition de plus en plus coriace. Nous nous sommes trop souvent dans le passé reposés sur les conceptions de « savants » plus éloquents que rigoureux. Ce sera la mort des experts arrogants à l’ancienne.

 

Pensez-vous que le « big data » va révolutionner les sciences sociales ?

V. M.-S. Oui. Nous étudions depuis plus d’un siècle les dynamiques à l’œuvre dans la société avec des méthodes empiriques. Mais la collecte de données était difficile et coûteuse, parfois même impossible. Les chercheurs en sont venus à exploiter des enquêtes sur échantillons et des expériences menées avec un nombre limité de participants, pour ensuite extrapoler ces maigres informations à l’ensemble de la population. Le raccourci fonctionne, dans une certaine mesure, mais ses limites sont sévères. Le « big data », nous permettra de « voir » les dynamiques sociales à la bonne échelle, et peut-être en temps réel.

 

Vous décrivez, en somme, une refonte totale de notre manière de penser ?

V. M.-S. Oui. Les humains voient le monde comme une articulation de causes et d’effets. Cela les réconforte, leur donne l’impression de comprendre. Mais, comme le prix Nobel Daniel Kahneman l’a montré, les relations de causalité que nous percevons d’emblée sont parfois fausses. Plutôt que de croire à des explications non démontrées, le système « big data » incite à porter un regard plus humble sur la réalité, pour appréhender le « quoi » sans aller tout de suite au « pourquoi ». En acquérant un meilleur sens du « quoi », nous pouvons aussi mieux sélectionner le petit nombre de relations causales qui valent la peine d’être explorées plus avant, au lieu de nous contenter de supposer qu’elles existent en attendant de les voir réfutées.

 

À la fin de votre livre, vous mettez en garde contre certains dangers. L’un d’eux est ce que vous appelez la « police prédictive ». Un danger réel ?

V. M.-S. Il existe un risque certain de voir les analyses du « big data » faire l’objet d’abus, que ce qu’elles nous apprennent du « quoi » soit interprété à tort comme indiquant le « pourquoi ». Le résultat serait la production de prédictions probabilistes sur les individus, aboutissant à les rendre responsables non de ce qu’ils ont fait, mais de ce qu’ils pourraient faire (4). Ce serait un déni du libre arbitre, et il nous faut être très attentifs à mettre en place rapidement les garde-fous nécessaires, pour empêcher un avenir aussi sombre.

 

L’un de vous a écrit un livre sur « la vertu de l’oubli dans le monde numérique ». Aujourd’hui, vous exaltez les vertus de la conservation des données. Comment conciliez-vous ces deux positions ?

V. M.-S. L’oubli est essentiel à l’être humain. Il purge notre mémoire des informations non pertinentes. Sans l’oubli, nous encombrons notre esprit et entravons notre faculté de généraliser et d’abstraire, de voir la forêt et non seulement les arbres. Mais cela concerne les données non pertinentes, le risque étant que les outils numériques viennent sans cesse nous confronter avec des souvenirs anciens. Pensez à Google Search (5) ! « Big data » doit se concentrer sur les données pertinentes et éviter de nous confronter avec les détails de notre passé. Bien conduite, l’analyse par le « big data » doit précisément produire les résultats que notre faculté d’abstraction nous conduit à rechercher.

 

Propos recueillis par Olivier Postel-Vinay.

Notes

1| En analysant les recherches faites par les internautes, Google est parvenu à prendre de vitesse les autorités de santé pour suivre la propagation de l’épidémie de grippe H1N1 en 2009.

2| Fitbit et Nike Fuel sont des bracelets qui enregistrent en temps réel diverses fonctions de l’activité corporelle.

3| Dans un article publié dans Wired en 2008.

4| Cette technique est déjà mise en pratique par l’armée américaine pour les frappes de drones (lire « Obama, le président des drones »).

5| Google Search permet de retracer l’historique des recherches faites par chacun sur le site.

LE LIVRE
LE LIVRE

Big data de Kenneth Cukier, Robert Laffont, 2014

SUR LE MÊME THÈME

Entretien Bart Van Loo : « Les Plats-Pays, une invention bourguignonne »
Entretien Vladimir Malakhov : « L’Antarctique est le garde-manger de l’humanité »
Entretien Joseph Henrich : « C’est la culture qui nous rend intelligents »

Aussi dans
ce numéro de Books

Booksletter,
c'est gratuit !

Retrouvez gratuitement la Booksletter
chaque samedi matin dans votre boîte email.