Soutenez la presse indépendante ! Abonnez-vous à Books, à partir de 8€/mois.

Nous sommes les pantins du Web

Tout – nos recherches sur le Web, nos déplacements, nos achats, nos goûts, nos préférences politiques – est dûment enregistré et exploité. Les boutiques peuvent savoir que vous êtes dans les parages, les assureurs connaître votre état de santé, et les États profiler des suspects. Cela, nous l’avons laissé faire, nous l’avons choisi, tant est puissante notre aspiration à la servitude volontaire.


Début 2013, le Bureau américain de la recherche navale a lancé une évaluation des programmes informatiques de la Darpa [l’agence de recherche militaire] chargés de passer au crible les masses d’informations archivées, monnayées et colportées sur l’Internet. Une fois rapprochées, ces données doivent permettre de prévenir des troubles sociaux, des attentats et autres événements dignes d’intérêt aux yeux de l’armée. Les posts de blogs, les courriels, les tweets, les prévisions météorologiques, les tendances agricoles, les photos, les statistiques économiques, les bulletins d’information, la démographie – toutes ces données peuvent contribuer à l’émergence d’un tableau cohérent, pour peu qu’existe un algorithme capable de les relier.

La Darpa est, on le sait, le lieu où Internet a vu le jour à la fin des années 1960 ; elle s’appelait alors l’Arpa, d’où le nom d’Arpanet donné à la technologie nouvelle permettant aux ordinateurs d’échanger d’énormes quantités d’informations. Quand Arpanet fut conçu en 1967, les ordinateurs étaient gigantesques, chers et lents comparés à ceux d’aujourd’hui, et ils équipaient essentiellement les universités et les centres de recherche. La loi de Moore – qui postule le doublement de la capacité de traitement des données tous les deux ans – et le microprocesseur, alors en cours de développement, n’avaient pas encore permis l’entrée du PC dans les foyers, les écoles ou les bureaux.

Deux décennies plus tard, Tim Berners-Lee, jeune informaticien britannique du Centre européen pour la recherche nucléaire (CERN), cherchait le moyen de permettre aux scientifiques du monde entier travaillant pour le Centre de partager des documents et d’établir des liens entre eux. Lorsqu’il conçut le World Wide Web en 1988, environ 86 millions de foyers possédaient un ordinateur, mais très peu étaient connectés. Utilisant l’architecture ouverte d’Arpanet, qui permettait à des réseaux séparés de communiquer, le Web devint très vite pour des étrangers au CERN, ou même au monde universitaire, un moyen d’échanger des données. Ce sont eux qui ont étendu la Toile, en la complexifiant toujours plus, avec un nombre sans cesse croissant de liens et de points nodaux. En 1994, il s’échangeait entre les dix millions d’utilisateurs du Web « l’équivalent des œuvres complètes de Shakespeare à chaque seconde ».

L’année 1994 fut décisive. D’une certaine manière, ce fut la véritable date de naissance d’Internet, grâce à l’adoption généralisée du premier navigateur graphique, Mosaic. Avant son arrivée – suivie par celle d’Internet Explorer, Safari, Firefox et Chrome, pour n’en citer que quelques-uns –, les informations échangées se présentaient généralement sous la forme d’un texte statique, d’aspect insipide et ennuyeux. Mosaic rendit toutes ces lignes de texte plus accessibles, en ajoutant des graphiques intégrés et des liens cliquables, ouvrant ainsi Internet à l’utilisateur lambda, et non plus au seul passionné d’informatique. « La dimension conviviale de Mosaic encourage les utilisateurs à mettre en ligne sur le Net leurs propres documents, y compris leurs photos, leurs enregistrements sonores, leurs vidéos, ainsi que des “liens” hypertextes vers d’autres documents, écrivait cette même année Gary Wolfe dans Wired. Au cours des dix-huit mois écoulés depuis son lancement, Mosaic a suscité un engouement et libéré une énergie commerciale sans précédent dans l’histoire du Net. »

Mais en 1994, à l’heure où Wolfe exaltait l’énergie commerciale d’Internet, il s’y concluait encore très peu de transactions. Certes, les grands fournisseurs d’accès comme America on Line (AOL) et Compuserve tiraient profit de ce qui était en train de devenir un désir avide de connexion ; mais, en gros, le commerce commençait et s’arrêtait là. Peu d’entreprises avaient encore imaginé le moyen de gagner de l’argent en ligne – Amazon, qui s’était créé très tôt, en 1995, n’a pas fait un centime de bénéfice pendant six ans –, si bien que l’on considérait volontiers Internet comme un terrain de jeu parfait pour que jeunesse s’amuse, mais certainement pas comme un champ d’action pour adultes sérieux, surtout pas les adultes sérieux aux ambitions d’entrepreneurs. « La croissance d’Internet ralentira de façon drastique [lorsqu’il] sera clair [que] la plupart des gens n’ont rien à se dire, écrivait l’économiste Paul Krugman en 1998. D’ici 2005 à peu près, il sera devenu évident que l’impact d’Internet sur l’économie n’aura pas été plus important que celui du fax… Dans dix ans, l’expression “économie de l’information” paraîtra stupide. »

Krugman avait tout faux. Au cours des cinq premières années du nouveau millénaire, le nombre d’utilisateurs d’Internet augmenta de 160 % ; en 2005, près d’un milliard de personnes y étaient connectées. À cette même date, le site d’enchères eBay était opérationnel, Amazon était devenu bénéficiaire, le e-commerce entre entreprises atteignait le chiffre de 1 500 milliards de dollars, et l’on estimait que les achats effectués en ligne par les particuliers représentaient 142 à 772 milliards de dollars ; le client faisant ses courses sur le Web ressemblait de plus en plus au client ordinaire.

 

Deus ex machina

Dans le même temps, des bibliothèques entières étaient numérisées et mises à la disposition du grand public ; on partageait de la musique, pas toujours de façon légale ; des vidéos, souvent tournées par des amateurs, étaient postées sur un nouveau site (lancé en 2005) du nom de YouTube ; l’encyclopédie libre Wikipédia commençait à exploiter le savoir collectif ; la recherche médicale utilisait le Net pour mener des essais cliniques ; et les gens semblaient avoir énormément de choses à se dire – ou du moins à dire. En juillet 2005, on recensait 14,5 millions de blogs contenant 1,3 milliard de liens, deux fois plus qu’en mars de la même année (1). D’abord réservé aux étudiants des plus prestigieuses universités de Nouvelle-Angleterre lors de son apparition en 2004, le réseau social Facebook fut ouvert en 2006 à toute personne de plus de 13 ans. Il compte aujourd’hui plus d’un milliard d’utilisateurs et sa valorisation boursière dépasse les 160 milliards de dollars.

La chose étrange, quand on récapitule ainsi, même brièvement, les événements qui ont jalonné la naissance d’Internet, c’est qu’ils sont si récents que la plupart d’entre nous les ont connus et vécus. Tout en étant familiers – qui ne se souvient de son premier PC ? Comment oublier le timbre rauque du modem analogique ? –, ces événements sont aussi suffisamment proches pour nous permettre de nous souvenir encore de l’époque qui précéda la généralisation d’Internet à l’échelle de la planète, avant l’explosion de créativité provoquée par la Toile. Même si nous savons que ce n’est pas le cas, nous semblons penser qu’Internet est littéralement advenu, tel un deus ex machina, et qu’il est désormais à la fois un trait intangible de la civilisation et une composante nécessaire du progrès humain.

La présence d’Internet, l’envergure prise par le réseau, se fait aujourd’hui sentir d’une manière inimaginable il y a vingt-cinq, dix ou même cinq ans de cela : dans le domaine de l’éducation, avec les MOOC (cours en ligne ouverts et accessibles) ; dans l’édition avec les livres électroniques ; dans le journalisme avec le passage du papier au numérique ; en médecine, avec le dossier électronique individuel ; en matière d’organisation ou de contestation politiques ; dans les transports, la musique, l’immobilier, la pornographie ; en matière de diffusion des idées ou de critique littéraire ; dans les histoires d’amour et d’amitié ; et dans bien d’autres domaines encore… Avec des conséquences incalculables. En décidant en 2006 que « to google » serait désormais un verbe reconnu, le dictionnaire Merriam-Webster traduisait clairement l’emprise de la Toile sur la vie quotidienne.

Neuf années plus tôt, dans la brève histoire du Net rédigée par Vint Cerf et quelques autres pionniers, les auteurs expliquaient que le réseau, « au départ créé par un petit groupe de chercheurs enthousiastes, s’est développé jusqu’à devenir une réussite commerciale engendrant chaque année des milliards de dollars d’investissements ». Google, chez qui Cerf exerce désormais la fonction d’« évangéliste en chef d’Internet », n’existait pas encore. Lancé en 1998, ce moteur de recherche a révolutionné tout ce qui touche à la collecte et à la diffusion de l’information, et sans doute à bien d’autres choses. D’une façon peut-être encore plus radicale, il a changé ce qui faisait la valeur de l’information. Fini le temps où seule comptait la réponse à une requête ; la valeur tenait désormais à la recherche elle-même, indépendamment de la réponse. Aussi anodines soient-elles, les requêtes effectuées sur Google permettaient désormais aux spécialistes du marketing d’adapter leur stratégie : quiconque recherchait des informations sur les atolls hawaiiens avait des chances de voir apparaître des publicités pour des vacances à Hawaii. (Et quiconque fait aujourd’hui des recherches sur des sacs à dos et des cocottes-minute risque de recevoir la visite d’un agent du FBI). Même si cela n’allait pas de soi durant les premières années, le chemin qui mène du commerce à la surveillance s’est révélé aussi court que direct.

C'est gratuit !

Recevez chaque jour la Booksletter, l’actualité par les livres.

Si l’architecture ouverte du Net garantissait qu’il évoluerait, nul ne savait comment il le ferait. Succédant à la Toile des débuts, avec ses pages d’accueil statiques et ses documents surchargés de liens hypertextes, le Web 2.0 offrit aux utilisateurs dépourvus de bagage technique la possibilité de partager facilement leurs informations et transforma le Web en agora mondiale grâce à des sites comme Facebook, Twitter, Foursquare, ou encore Instagram.

Dès lors, on se mit à rendre publics certains aspects de sa vie privée, en faisant par exemple savoir, au gré d’une virée shopping chez H&M ou d’un dîner dans un restaurant de la chaîne Olive Garden, ce qu’on pense de la collection présentée dans ce magasin ou des serveurs de ce restaurant, avant de passer son nouveau jean pour le montrer en ligne à tout le monde ou de partager ses photos d’antipasti et de raviolis au homard – sans même parler des photos de sa petite amie, de son bébé, de ses anciens camarades de classe fin saouls –, de raconter sa vie de call-girl rémunérée à prix d’or ou ses inquiétudes au moindre problème de peau, de rechercher un remède contre l’insomnie ou de noter publiquement ses professeurs.

Le Web social commença d’exalter, valoriser et normaliser cette manière de vivre à voix haute, en anesthésiant au passage bon nombre des participants au réseau. Même s’ils étaient probablement conscients que ces révélations finançaient la nouvelle économie, ils ne s’en souciaient pas particulièrement. John Naughton le souligne dans son bref récit historique « De Gutenberg à Zuckerberg : ce que vous avez vraiment besoin de savoir à propos d’Internet (2) » : « Tout ce que vous faites dans le cyberespace laisse une trace, à commencer par le parcours de navigation inventoriant les sites visités, et quiconque a accès à cette trace en saura énormément sur vous. Il pourra par exemple se faire une idée assez juste de vos amis, de vos centres d’intérêt (y compris de vos opinions politiques si vous les exprimez en ligne), de ce que vous téléchargez, lisez, achetez et vendez, bref de tout ce que vous faites une fois connecté. »

Autrement dit, vous n’êtes pas seulement ce que vous mangez, vous êtes ce que vous envisagez de manger, le lieu où vous avez mangé, ce que vous pensez de ce que vous avez mangé et avec qui vous l’avez mangé, ce que vous avez fait avant et après le dîner ; et si vous allez retourner dans ce restaurant, ou utiliser de nouveau cette recette, si vous êtes au régime, et si vous envisagez d’acheter un pèse-personne connecté au wifi ou de recourir à la chirurgie bariatrique – vous êtes tout cela non seulement pour vous-même, mais aussi pour tout un tas d’autres personnes, parmi lesquelles vos voisins, vos collègues, vos amis, les spécialistes marketing et les sous-traitants de la NSA, entre autres. Comme l’ont récemment écrit dans Big Data Viktor Mayer-Schönberger et Kenneth Cukier: « Google traite chaque jour plus de 24 petabytes de données, soit un volume équivalant à plusieurs milliers de fois la totalité des documents de la bibliothèque du Congrès… Les membres de Facebook cliquent sur le bouton “j’aime” ou laissent un commentaire à peu près trois milliards de fois par jour, créant ainsi une trace électronique que l’entreprise peut exploiter pour connaître les préférences des utilisateurs. »

 

Un Web social infatigable

La valeur monétaire de toutes ces actions de partage est incalculable, parce que le Web social est infatigable et que nous ne cessons de lui fournir de nouvelles données personnelles, qui viennent renseigner les autres. Dans son livre « Analyse prédictive », Eric Siegel relève que « les informations relatives à un utilisateur s’achètent au prix d’environ 0,5  cent ; mais la valeur moyenne d’un utilisateur pour l’écosystème publicitaire d’Internet est estimée à 1 200 dollars par an ». Reste qu’il est souvent difficile de savoir comment cela se transforme en résultat net, bien que l’équipementier de réseaux Cisco ait récemment estimé qu’Internet vaudrait plus de 14 000 milliards de dollars en 2022.

Pour le moment, toutefois, le principal moteur financier n’est pas la valeur future du Net mais l’écart entre le prix (relativement bas) à payer pour acheter des données personnelles et ce qu’elles peuvent rapporter. Quand Wall Street estime Facebook, Google et les autres maîtres de l’univers Internet, la Bourse ne se fonde pas sur les services qu’ils fournissent, mais sur les données qu’ils collectent et leur valeur, pour les publicitaires notamment. Aux yeux de ces firmes, permettre d’envoyer un courrier électronique, de poster les photos d’une fête entre anciens copains de lycée, ou de trouver un vendeur de papillotes n’a d’autre but que d’appâter les utilisateurs pour les inciter à dévoiler des pans de leur vie privée, souvent sans se douter que ces renseignements vont ensuite circuler, et sans savoir de quelle manière et entre quelles mains ils finiront leur voyage.

Une enquête du Wall Street Journal a révélé que « cinquante des sites les plus populaires (représentant 40 % des pages Web consultées par les Américains) ont installé au total 3 180 cookies dans un ordinateur test du Journal. En général à l’insu de l’utilisateur ». Facebook a récemment annoncé à ses usagers son intention d’appliquer de nouvelles règles de confidentialité : « Vous nous autorisez à utiliser vos nom, photo de profil, contenu et informations dans le cadre d’un contenu commercial, sponsorisé ou associé (par exemple une marque que vous aimez) que nous diffusons ou améliorons. » En d’autres termes, Facebook se réserve le droit d’utiliser une photo de vous ou de vos amis à des fins publicitaires au bénéfice d’un de ses clients sans avoir à vous en demander la permission. (Au moment où Facebook annonçait son projet, il a dû présenter des excuses aux parents d’une adolescente victime de harcèlement qui s’est suicidée quand sa photo est apparue dans une publicité pour un site de rencontres (3).) Facebook fait preuve d’un goût du paradoxe et d’un cynisme avérés en intitulant « politique de confidentialité » l’abandon du droit de regard de l’utilisateur sur sa propre image ; mais la notion de confidentialité est mise au défi non seulement par l’exhibition de soi qu’encourage le Net, mais aussi par la culture d’adhésion aux réseaux sociaux. Ethnologue très perspicace de la Silicon Valley, Alice Marwick le souligne dans son nouveau livre, « Statut mis à jour (4) » : « Les réseaux sociaux ont fait pénétrer l’économie de l’attention dans la vie quotidienne et la vie relationnelle de millions de personnes à travers le monde, et ils ont popularisé les techniques de captation de l’attention liées au marketing de soi (self-branding, lifestreaming) » (5).

Les gens font le choix d’utiliser un service tel que Facebook en dépit de sa politique d’intrusion, ou encore Google tout en sachant que son service de courrier électronique, Gmail, recherche certains mots clés dans les communications privées en vue d’optimiser ses publicités. Ils font le choix de se transformer en « microcélébrités » en communiquant sur Twitter. Et ils choisissent d’avoir sur eux un téléphone mobile, bien que son logiciel de géolocalisation en fasse un excellent outil de surveillance. Vraiment excellent, a-t-on appris, quand le Spiegel a révélé que « la NSA a la capacité de récupérer les données les plus sensibles contenues dans les smartphones, y compris les listes de contacts, les échanges de SMS, les notes et les informations relatives aux lieux où s’est rendu l’utilisateur ». Mais oublions la NSA : Gap sait que vous êtes dans les parages quand il vous propose un rabais de 20 % sur les pulls en cachemire.

Même si nous ignorions jusqu’à très récemment à quel point la NSA peut s’introduire dans notre vie numérique, le Patriot Act est en vigueur aux États-Unis depuis 2001, et chacun sait qu’il autorise les autorités à avoir accès à l’ensemble des activités en ligne de chacun, qui ont connu une croissance exponentielle depuis 2001. Il existe certes des moyens de protection, mais ils supposent que les utilisateurs décident de modifier les paramètres de confidentialité, ce que peu d’entre eux sont prêts à faire ; et, de toute façon, la sécurité qu’ils offrent est extrêmement limitée. Des chercheurs de l’université Stanford ont montré que la moitié des firmes publicitaires opérant sur le Net continuent de pister les utilisateurs même quand ils ont activé les paramètres de confidentialité. L’anonymat n’offre d’ailleurs qu’une protection partielle, pour ne pas dire nulle. Latanya Sweeney et ses collègues de Harvard ont récemment prouvé à quel point il était facile de « redonner leur identité » aux participants anonymes du projet « Génome humain ». En exploitant les informations relatives aux médicaments utilisés, aux procédures médicales, en y ajoutant la date de naissance, les renseignements concernant le sexe et le code postal, « et en faisant le lien, écrit-elle, entre ces données démographiques et certains documents publics tels que les listes électorales, ainsi qu’en recherchant les noms enfouis dans les annexes documentaires, nous avons réussi à confirmer l’identité de 84 à 97 % des profils sur lesquels nous avions mis un nom ».

L’anonymat n’est, bien sûr, pas nécessairement une vertu. Sur la Toile, c’est souvent le refuge des « trolls » et des harceleurs. Mais la transparence engendre aussi des problèmes spécifiques. Quand une équipe de programmeurs astucieux lança le site Eightmaps qui faisait apparaître les nom et adresse de tous ceux qui avaient donné plus de cent dollars pour la campagne contre le mariage entre personnes de même sexe en Californie, les donateurs (et leurs employeurs, au premier rang desquels l’université de Californie) furent très vite submergés d’e-mails et de coups de téléphone. Aux yeux de leurs adversaires, ce n’était peut-être qu’un juste retour des choses, mais, quelles que soient les opinions que l’on professe, force est de reconnaître que cela a créé un précédent. La prochaine fois, rien ne dit que ce ne sont pas les partisans du mariage pour tous, du contrôle des armes à feu ou de l’avortement qui seront pris pour cibles.

Les informations sur les donateurs étaient certes déjà publiques auparavant ; mais Internet, en les rendant plus faciles d’accès et en leur donnant une tout autre portée, a un effet amplificateur. (D’un autre côté, c’est sur ce même effet que comptent ceux qui collectent des signatures pour une pétition en ligne ou organisent des manifestations.) Auteur de « L’illusionnisme du Net » et plus récemment de « Pour tout résoudre, cliquez ici ! » [lire l’article de Michael Saler « La grande dépossession »], Evgeny Morozov n’est pas un chaud partisan de la transparence. Et il nous met en garde contre un autre piège : la volonté affichée par tout le monde ou presque de tout partager risque de jeter une lumière assez désagréable sur ceux qui décident de ne rien partager. Que va penser votre assureur si, à l’inverse de beaucoup d’autres, vous choisissez de ne pas communiquer d’informations sur votre poids, votre tension artérielle et vos exercices physiques quotidiens ? Ce genre de transparence, fait observer Morozov, favorise les gens riches et bien portants, « car l’autocontrôle ne fera que leur faciliter la vie. Mais si vous n’êtes rien de tout cela, ces renseignements personnels risquent de beaucoup vous la compliquer, avec des primes d’assurance plus élevées, de moindres rabais et de moins bonnes perspectives d’emploi ».

 

Une vie coupée en tranches

Se surveiller de près et rendre publiques les données relatives à sa propre santé s’inscrit dans une tendance croissante du mouvement pour le « moi quantifié » (quantified self), qui a pour devise « la connaissance de soi par les chiffres ». Même s’il n’est pas né du Web, ce mouvement est une conséquence de la culture Internet, augmentée de la technologie sans fil, du Web, des applications pour smartphones, et de la conviction que la vie examinée est une vie coupée en tranches et faite de données numérisées. Si le recueil des informations concernant sa tension artérielle, son rythme cardiaque, son alimentation et ses heures de sommeil n’apporte pas une connaissance de soi suffisante, les partisans du « moi quantifié » peuvent aussi télécharger l’application « Poop Diary » (« journal du caca ») pour « enregistrer aisément chacun de leurs mouvements intestinaux – avec l’heure, la couleur, la quantité et la consistance ». Même si ce genre de chose peut paraître un peu extrême aujourd’hui, il est vraisemblable que ça ne le paraîtra pas bien longtemps. Nous vivons, dit-on, à l’heure du « Big Data », et si l’on en croit Mayer-Schönberger et Cukier (mais aussi Wall Street, la Darpa et beaucoup d’autres), cela va « bouleverser notre manière de vivre, de travailler et de penser ».

Les activités pratiquées sur le Net, comme la banque en ligne, les réseaux sociaux, les achats, les envois d’e-mails, l’écoute de musique et le visionnage de films en streaming, génèrent une quantité considérable de données au moment où, grâce à la numérisation et à l’informatique dématérialisée (cloud computing), le réseau lui-même permet le stockage et la manipulation d’ensembles considérables d’informations complexes. Les données – en particulier les données personnelles, du type de celles que l’on partage sur Facebook ou qui ont été vendues par l’État de Floride à partir du fichier de son Service des cartes grises (6), ou encore celles générées par le commerce en ligne et les compagnies de cartes de crédit – sont parfois qualifiées de « nouveau pétrole », non parce que la valeur vient de l’extraction, mais parce qu’elles s’annoncent lucratives et promettent de transformer l’économie.

Dans un rapport paru en 2011, le Forum économique mondial préconisait de considérer les données personnelles comme une « nouvelle catégorie d’actifs », déclarant qu’il s’agit là d’un « nouveau type de matière première équivalent au capital ou au travail ». Morozov cite un cadre dirigeant de Bain & Company, coauteur du rapport de Davos, qui explique : « Nous essayons de déplacer l’attention de la seule vie privée vers ce que nous appelons les droits de propriété. » Il n’est pas nécessaire de se livrer à un gros effort d’imagination pour comprendre à qui profiteront ces « droits ».

 

Deviner la couleur de peau d’un client

Prises individuellement, les données numériques ont une valeur limitée et dérisoire, et c’est pourquoi, jour après jour, la plupart des gens sont heureux de les céder sans même y réfléchir. Ces éléments ne deviennent intéressants qu’une fois agrégés et combinés d’une manière qui ne viendrait sans doute jamais à l’esprit de leur « propriétaire ». C’est ainsi que les informations concernant les téléchargements de musique et les abonnements à des magazines peuvent permettre à des institutions financières de deviner la couleur de peau d’un client et de lui refuser un crédit immobilier. De même, la recherche de certains mots clés associée à l’achat de tels livres et de tels médicaments peut permettre de savoir si une femme est enceinte – manœuvre à laquelle se sont déjà livrés les hypermarchés Target.

« L’étalonnage des données est l’équivalent moderne du microscope », a écrit Steve Lohr dans le New York Times. Cofondateur d’une entreprise baptisée Quid, Sean Gourley qualifie pour sa part ce nouveau type d’analyse de « macroscope ». (Quid « collecte des informations en libre accès en s’alimentant à de milliers de sources, les organise et les structure pour en extraire des entités et des événements permettant de bâtir des modèles qui aident les êtres humains à comprendre la complexité du monde qui les entoure ».) Les cartes très exactes de la propagation de la grippe proposées par le site Google Flu Trends, lequel trie et agrège les termes de recherche liés à cette maladie pour suivre sa progression à travers le monde, montrent qu’il est possible de tirer un schéma pertinent d’une masse de données aussi énorme que disparate. Ces informations n’existaient pas avant la naissance de l’Internet.

On compare souvent les ordinateurs au cerveau humain, mais pour ce qui est de la collecte et de l’exploitation des données, ce dernier manque cruellement de puissance. Watson, l’ordinateur IBM utilisé par le Memorial Sloan-Kettering Cancer Center de New York pour le dépistage du cancer – ce qu’il parvient à faire bien plus précisément que n’importe quel médecin –, a été alimenté par 600 000 informations médicales et plus de 2 millions de pages de littérature scientifique, et il a accès au dossier de 1,5 million de patients environ, ce qui constitue son avantage décisif.

Voilà qui nous ramène à la Darpa et à sa quête de l’algorithme qui permettra de passer au crible toutes sortes de données apparemment sans rapport entre elles afin d’anticiper de futurs troubles politiques ou un projet d’attentat. Faire un diagnostic est une chose, établir des corrélations en est une autre ; mais la prévision relève encore d’une autre dimension. Or, pour le meilleur et pour le pire, c’est vers cela qu’Internet s’achemine. Partout aux États-Unis, les services de police utilisent les cartes Google, associées aux statistiques de la criminalité et aux informations des réseaux sociaux pour définir l’itinéraire des patrouilles ; et la moitié des États fait appel à divers modèles d’analyse prédictive de données pour les décisions de mise en liberté conditionnelle. Cela va même encore plus loin, constatent les auteurs de Big Data : « À l’avenir – et plus vite que nous le pensons –, un grand nombre de décisions relevant aujourd’hui du seul jugement humain seront assistées ou rendues par des systèmes informatisés… Au point peut-être d’identifier les “criminels” avant même qu’ils n’aient commis un crime. »

L’idée que les décisions prises par des machines, après avoir analysé des tonnes de données puisées dans le monde réel, sont plus justes que celles prises par des êtres humains, avec leurs faiblesses et leurs préjugés, peut être exacte en général, et fausse dans certains cas particuliers. Quant aux pauvres bougres qui n’auraient peut-être jamais commis de nouveau crime même si l’algorithme affirme le contraire, ils n’auront guère de recours. Dans tous les cas, les ordinateurs ne sont pas « neutres ». Les algorithmes reflètent les préjugés de leurs concepteurs, et cela signifie que la prédiction confère énormément de pouvoir auxdits concepteurs, qui sont humains, après tout. Il arrive aussi que les algorithmes propriétaires, à l’instar de ceux utilisés par Google, Twitter et Facebook, soient volontairement biaisés pour produire des résultats qui favorisent la firme plutôt que l’utilisateur, voire carrément manipulés. (Il existe une industrie vouée à l’« optimisation » des recherches sur Google.)

Toutefois, le véritable biais inhérent à tout algorithme est son caractère réducteur. Il a pour vocation de passer au crible des informations complexes et apparemment sans rapport entre elles pour en tirer une analyse qui fasse sens, ce qui correspond à la définition même de « réducteur ». Mais cela va au-delà : la pénétration des algorithmes dans la vie de tous les jours nous a conduits dans un royaume où règne la mesure. C’est vrai dans les domaines de l’éducation, de la médecine, de la finance, du commerce, de l’emploi et même de la création artistique. Il existe des sites qui analysent les nouvelles chansons pour savoir si elles possèdent les qualités requises pour devenir des succès, ces qualités étant le type de « riffs » et de « ponts » présents dans les tubes précédents.

 

Créativité formatée

Amazon, qui accumule les données sur l’usage que font les lecteurs de leurs e-books – les passages qu’ils surlignent ou repèrent, le fait de finir ou non les livres, et, le cas échéant, la page à laquelle ils ont abandonné leur lecture –, ne sait pas seulement avec la plus extrême précision ce que ses clients aiment, mais aussi ce qu’ils n’aiment pas. Cela a sans doute son importance au moment où l’entreprise se lance dans l’édition [lire « L’effet Amazon », Books, octobre 2013]. Amazon a d’ailleurs constaté que son algorithme de recommandation d’ouvrages génère davantage de ventes que les recommandations élaborées par ses éditeurs humains, et a par conséquent décidé de se passer d’eux.

Parallèlement, la firme Narrative Science a conçu un algorithme capable de produire des articles destinés aux journaux et aux sites Web, en traitant les sujets d’actualité grâce à des tropes journalistiques éprouvés – sans avoir à ferrailler avec les syndicats et sans qu’il soit question d’avantages acquis ou de congés de maladie. Au risque de paraître vieux jeu, dans chacun de ces cas, c’est l’originalité, l’expérimentation, l’innovation et la réflexion – en somme, tout ce qui fait de nous des êtres humains – qui sont perdues. Une société qui valorise uniquement ce qui a déjà marché, où tout succès doit pouvoir être « mesuré » ou compté, n’est pas une société qui encouragera les alternatives à la « créativité » formatée par et pour le marché.

Il ne fait aucun doute qu’Internet – ce système complexe mais quelconque de fils et de commutateurs – a changé la manière dont nous pensons, ce à quoi nous accordons de la valeur et nos rapports avec les autres. La possibilité de se connecter s’est étendue à la planète entière, en rapetissant le monde, et en nous promettant dès lors, sinon d’aplanir le terrain de jeu entre riches et pauvres ou entre firmes et individus, du moins de faire en sorte de l’égaliser un peu. Au demeurant, l’évolution du Web a apporté tant de choses positives – c’est-à-dire utiles, divertissantes, stimulantes, informatives, lucratives, amusantes – que les questions d’équité et d’inégalité peuvent sembler hors de propos.

Mais, pendant que nous nous amusions, nous avons allègrement et volontairement contribué à créer le plus vaste système de surveillance jamais imaginé, un filet dont les mailles donnent aux États et aux entreprises d’innombrables fils à tirer, faisant de nous… des pantins. La libre circulation de l’information sur la Toile (sauf là où ce flux est bloqué), qui nous est tellement utile, est plus utile encore à d’autres. Quant à savoir si ce distinguo se révélera important, c’est là peut-être la seule information qu’Internet ne puisse fournir.

 

Cet article est paru dans la New York Review of Books le 7 novembre 2013. Il a été traduit par Michel Cordillot.

Notes

1| On comptait plus de 180 millions de blogs dans le monde en 2012.

2| From Gutenberg to Zuckerberg: What You Really Need to Know About the Internet, Quercus, 2012.

3| Après quelques escarmouches et malgré des protestations diverses et des menaces de poursuites judiciaires, Facebook considère désormais que la règle annoncée est entrée en application.

4| Status Update: Celebrity, Publicity and Branding in the Social Media Age, Yale University Press, 2013.

5| L’économie de l’attention met en avant les ressources consacrées par les entreprises à capter l’attention des consommateurs ou usagers. Le self-branding est l’art de faire le marketing de soi-même ; le lifestreaming consiste à afficher une sorte de journal électronique de sa vie, en agrégeant les documents qu’on a mis sur sa page au fil du temps.

6| L’État de Floride a vendu à des entreprises en 2011, pour 63 millions de dollars, les données figurant sur son fichier de cartes grises. Cette opération a été jugée légale.

Pour aller plus loin

En français

• Pierre Bellanger, La souveraineté numérique, Stock, 2014. Par le fondateur et patron de Skyrock. « Internet et ses services sont contrôlés par les Américains. Internet siphonne nos emplois, nos données, nos vies privées, notre propriété intellectuelle, notre prospérité, notre fiscalité, notre souveraineté. Nous avons à rendre les gens propriétaires de leurs données, propriétaires de leurs traces numériques sur le réseau. »

En anglais

• Matthew Hindman, The Myth of Digital Democracy (« Le mythe de la démocratie numérique »), Princeton University Press, 2008. L’un des tous premiers livres à avoir attiré l’attention sur les risques associés au Web ; il reste l’un des meilleurs.

• Douglas Ruschkoff, Present Shock: When Everything Happens Now (« Le choc du présent : quand tout se produit dans l’instant »), Current Hardcover, 2013. Un théoricien des médias part en guerre contre la « numériphrénie » et la « fractalnoïa ».

• Clive Thompson, Smarter than you Think: How Technology is Changing Our Minds for the Better (« Plus intelligent que vous le croyez. Comment la technologie nous change, pour notre bien »), Penguin Press, 2013. Par un journaliste spécialisé en technologies, un livre à contre courant : les nouvelles machines numériques et le Web en particulier développent notre intelligence et notre créativité.

LE LIVRE
LE LIVRE

Predictive Analytics de Eric Siegel, John Wiley & Sons, 2013

SUR LE MÊME THÈME

Dossier Qu'est-ce qui nous rend heureux ?
Dossier Bien régler son thermostat hédonique
Dossier Bonheur : une quête de plaisir et de sens

Aussi dans
ce numéro de Books

Booksletter,
c'est gratuit !

Retrouvez gratuitement la Booksletter
chaque samedi matin dans votre boîte email.