Dans Le Monde (02 sept. 2017)

Non, Google ne dit pas tout de nous

Nos requêtes sur le moteur de recherche révèleraient nos secrets les mieux cachés, écrit un économiste américain. Pas si sûr, répondent des sociologues, qui mettent en garde contre un « fantasme de vérité ».

LE MONDE | | Par Luc Vinogradoff

Sur Internet, tout le monde ment, ne serait-ce que par omission. Mécanisme bien connu des sociologues et des sondeurs, le « biais de désirabilité sociale » pousse chacun à se montrer sous son meilleur jour, et donc à mentir.

« Sérum de vérité numérique »

Pourtant, selon l’économiste américain Seth Stephens-Davidowitz, il existe un espace où chacun de nous se montre honnête : la fenêtre des recherches Google dans laquelle l’humanité envoie 40 000 requêtes par seconde. « Les gens ont tendance à révéler à Google des choses qu’ils ne diraient jamais sur les réseaux, ni à quiconque dans la vraie vie » , assure l’auteur de Everybody Lies. Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are (Dey Street Books, 358 p., non traduit).

Selon l’ouvrage, Google agit comme un « sérum de vérité numérique » , une page blanche à laquelle nous pouvons « révéler nos craintes les plus profondes, nos secrets, nos questions embarrassantes ». Sous couvert d’anonymat, l’utilisateur confie au moteur de recherche, au travers de ses requêtes, ce qu’il ne dirait jamais en public : discriminations enfouies, préjugés cachés, préférences sexuelles inavouées. Pour M. Stephens-Davidowitz, il s’agit là de « la plus importante base de données jamais collectée sur la psyché humaine ».

Voir en Google un « sérum de vérité », et prendre pour argent comptant toutes ces données, s’avère pourtant une approche sinon simpliste, du moins faillible. Antonio Casilli, sociologue spécialisé dans les cultures numériques, met en garde contre ce qu’il appelle un « fantasme de vérité » . Ces informations ne révèlent pas une vérité cachée sur les utilisateurs, explique-t-il, parce que « la vérité ne réside pas forcément dans ce que les gens disent, ou dans ce que l’on en extrait » . Ce qui déclenche une recherche Google est bien plus composite.

Ce que l’on cherche et ce que l’on fait

« C’est le discours actuel des promoteurs du big data, abonde Dominique Cardon, professeur au Médialab de Sciences Po. Mais il ne faut pas faire confiance à ce que les gens recherchent, il faut regarder ce qu’ils font. » Ainsi, ce n’est pas parce que quelqu’un cherche le nom d’un candidat sur Google qu’il votera pour lui, ou parce qu’il lance une requête sur une pratique sexuelle qu’il l’exerce. Dominique Cardon considère que les données des requêtes Google font certes émerger un « signal » , mais il est impossible d’en mesurer « la fréquence et la force ». Un chercheur qui se pencherait sur ce matériau peinerait à en tirer une interprétation fiable. « Ce serait compliqué », souligne Dominique Cardon, car il faudrait « comparer les requêtes à la réalité du comportement » .

C’est le danger de s’appuyer uniquement sur le déclaratif . Ce que disent les individus, même quand ils pensent exprimer la vérité, ajoute Antonio Casilli, « doit être traité avec beaucoup de finesse » pour en tirer un enseignement. « Seules des méthodes complexes et croisées permettraient d’extraire de ces données des analyses valables. » Or, pour comprendre et exploiter ces masses d’informations, il faut aussi savoir qui les récolte et pourquoi. La multinationale qui les possède et les utilise pour vendre de la publicité ne consacrera ni temps ni budget à des recherches qui ne lui rapporteraient rien.

L’idée que les serveurs de Google recèlent un trésor d’information pure et inexploitée doit être « abordée avec précaution et méfiance » , conclut le chercheur. Cette confiance en un « sérum de vérité » lui rappelle un autre « grand fantasme des scientifiques sociaux américains du XXe siècle » : le « polygraphe », ou détecteur de mensonge, ce système de mesure des réactions physiologiques censé révéler si une personne dit ou non la vérité, dont la communauté scientifique est revenue.