tribune

L’automate et le tâcheron (AOC, 15 janv. 2019)

Le site d’information AOC (Analyse Opinion Critique) accueille mon texte.

L’automate et le tâcheron

Par Antonio CasilliE

En 2018, Amazon aurait détruit trois millions de produits vient-on d’apprendre. Rien de surprenant pour le sociologue Antonio A. Casilli qui, à l’issue d’une longue enquête, montre pourquoi lesdits produits ne sont en réalité qu’un prétexte pour ce type de plateforme – Amazon, mais aussi Facebook ou Uber – dont l’activité principale s’avère l’accumulation et la préparation de données qui serviront à développer des intelligences artificielles.

En 2006, les publicités de l’agence d’intérim Jobsintown.de envahissent les lieux publics berlinois. Des images, placardées sur des automates, donnent l’impression que des individus travaillent à l’intérieur de ceux-là. Niché dans un guichet automatique, un guichetier compte des billets. Un lavomatique cache une femme frottant vos vêtements sur une planche à laver. Dans le scanner à rayons X d’un aéroport, un douanier inspecte vos bagages à l’aide d’une lampe de poche. Par-delà son message affiché (« n’acceptez pas des emplois pénibles qui vous réduisent à des machines »), cette campagne publicitaire est avant tout un clin l’œil à un phénomène qui apparaît de façon concomitante : la servicialisation de l’humain vis-à-vis des machines.

C’est Jeff Bezos, le patron d’Amazon, qui exprime cette nouvelle philosophie du travail cette même année, lors d’une intervention au MIT de Boston. D’après lui, les technologies intelligentes à base de données et d’algorithmes apprenants ne sont pas là pour « servir les humains ». Au contraire, insiste-t-il, nous assistons à l’inversion « des rôles respectifs des ordinateurs et des êtres vivants » puisqu’il est aujourd’hui possible coder et inscrire « de l’intelligence humaine au sein d’un logiciel ». Et l’entrepreneur de préciser que cette « inscription » ne relève pas du génie et du savoir-faire de ses informaticiens, mais au contraire d’une stratégie consistant à transformer des usagers non spécialisés en fournisseurs de services numériques pour sa plateforme.

L’un des piliers de la stratégie big data du géant américain, est la création d’un marché du travail en appui à l’automation.

Amazon est certes plus connue pour son catalogue d’achats en ligne, mais son modèle d’affaires tourne depuis longtemps autour de la vente de solutions informatiques sous forme de « logiciel-en-tant-que-service » (software-as-a-service). Selon cette logique commerciale, les applications ne sont pas installées sur les ordinateurs de ceux qui les achètent, mais sur une plateforme propriétaire de ceux qui les produisent. L’un des piliers de la stratégie big data du géant américain, est la création d’un marché du travail en appui à l’automation. Il s’agit de la clé de voûte du programme scientifique et industriel du machine learning : pour que les machines apprennent à reproduire le comportement humain, il faut bien que des humains les instruisent à reconnaître des images, à lire des textes ou à interpréter des commandes vocales. Ces humains ne sont plus installés au sein des entreprises qui les emploient, mais sur une plateforme qui les met à disposition de ces mêmes entreprises. « Grosso modo », concluait Jeff Bezos, « c’est de l’humain-en-tant-que-service »[1].

Sur Internet, ces effectifs sont recrutés sur des plateformes de « micro-travail ». Ce terme décrit une forme de travail datafié (à savoir, orienté vers la production de données) et tâcheronnisé (c’est-à-dire réduit à des tâches fragmentées et déqualifiées).

La plus célèbre de ces plateformes, est Mechanical Turk, un service créé justement par Amazon. Longtemps, le problème d’Amazon avait consisté à éliminer les doublons de son vaste catalogue d’articles commerciaux. Au début des années 2000, ayant constaté l’inefficacité des solutions logicielles pour résoudre ce problème, les ingénieurs de la société de Seattle ont envisagé un système consistant à recruter un grand nombre de personnes payées à la pièce pour regarder quelques pages chacune et signaler les répétitions. De là à en faire profiter d’autres sociétés, en retirant au passage une commission pour leur rôle de courtier, il n’y a qu’un pas[2].

Ce portail doit son nom à un célèbre joueur d’échecs mécanique du 18ème siècle, un robot anthropomorphe affublé d’un costume ottoman. Le Turc, censé simuler les processus cognitifs de ses adversaires, se présentait de fait comme la première intelligence artificielle. Mais il était surtout une complète mystification. Les pièces n’étaient pas déplacées par le joueur d’échecs mécanique, mais par un opérateur humain caché à l’intérieur du mécanisme.

La métaphore du robot avec un être humain à l’intérieur est utile aujourd’hui pour décrire ce que vend Amazon. Quand il s’agit de séduire les actionnaires, les drones qui effectuent les livraisons ou les algorithmes qui suggèrent les produits les plus adaptés sont au-devant de la scène. Mais en coulisses, ce sont des centaines de milliers de « Turkers » qui trient à la main les adresses ou classent en fonction de leur pertinence tous les produits du catalogue. Ce travail en amont (calibrer les logiciels pour qu’il classent bien) et en aval (vérifier que les résultats de classement automatique soient corrects) est essentiel pour la réussite commerciale d’Amazon et des sociétés de son écosystème. Il s’agit, dans le jargon de la plateforme, d’une démarche d’« intelligence artificielle artificielle ».

La possibilité même pour les micro-travailleurs d’arriver à cumuler un montant équivalent à un salaire minimum à la fin du mois est contrainte par plusieurs aléas : assiduité, rapidité, compétences,  disponibilité des tâches ou leur réalisabilité…

Si une entreprise veut numériser un processus (par exemple, départager des images pour développer un moteur de recherche visuel ou transcrire des tickets de caisse pour commercialiser une app de comptabilité personnelle), au lieu de perdre du temps et de l’argent pour créer un logiciel propriétaire elle peut recruter sur Amazon Mechanical Turk des micro-travailleurs qui réaliseront des tâches simples avec ou à la place de la solution automatique. Il n’est plus question d’employer un ou dix salariés, ni de mettre au travail cent stagiaires : elle peut désormais « requérir » cent mille « tâcherons du clic » et les charger de transcrire une facture ou de labéliser une image chacun.

Les centaines de plateformes comme Mechanical Turk sur lesquelles ces micro-tâches sont allouées constituent un véritable marché du travail. Chacune des tâches reçoit une compensation dérisoire : un ou deux centimes et, dans certains cas, encore moins. En 2017 le salaire horaire médian d’un micro-travailleur ne dépassait pas les 2 dollars[3]. De surcroit, penser en termes d’heures de travail pose des problèmes sur une plateforme qui rémunère à la pièce. La possibilité même pour les micro-travailleurs d’arriver à cumuler un montant équivalent à un salaire minimum à la fin du mois est contrainte par plusieurs aléas : leur assiduité, leur rapidité, leurs compétences, mais aussi la disponibilité des tâches ou leur réalisabilité à des heures déterminées.

Quand sonnent les 18h à San Francisco, généralement les Turkers américains terminent leur journée. C’est à ce moment-là qu’à Hyderabad se mettent au travail les tâcherons du clic indiens. Pour les travailleurs du Nord, les micro-tâches représentent un revenu complémentaire, qui revêt un intérêt certain pour les couches les plus fragilisées de nos sociétés : des femmes travaillant à temps partiel, avec enfants, nécessitant un complément de revenu. En revanche pour ceux qui micro-travaillent depuis des pays émergents ou en voie de développement, où le salaire moyen peut parfois ne pas dépasser les 40 euros par mois, travailler à distance à la mise en place d’intelligences artificielles devient une source de revenu primaire tout à fait convenable. Il s’agit toutefois d’une occupation précaire et non couverte par toute une série de garanties salariales et syndicales, pour la simple raison que les plateformes de micro-travail ne reconnaissent pas leurs usagers comme des salariés, ni même comme des fournisseurs. Ils sont des simples usagers[4].

Un certain nombre de structures de dépendance économique à l’échelle mondiale sont héritées de notre passé colonial et réapparaissent à travers ces micro-marchés du travail.

Selon des études récentes menées par des chercheurs de l’Oxford Internet Institute, les pays qui achètent des micro-tâches sont les États-Unis, le Canada, l’Australie, la France et le Royaume-Uni, alors que ceux où ils résident effectivement, les travailleurs du clic sont l’Inde, les Philippines, le Pakistan, le Népal, la Chine, le Bangladesh[5]. Cela suffit à dire qu’un certain nombre de structures de dépendance économique à l’échelle mondiale sont héritées de notre passé colonial et réapparaissent à travers ces micro-marchés du travail.

Malgré cette polarisation Nord/Sud, il ne faut pas entièrement se rabattre sur la reproduction des logiques colonialistes pour interpréter le marché du travail du clic nécessaire pour entretenir nos intelligences artificielles. Les micro-travailleurs du Sud global ne sont pas relégués dans la passivité par les plateformes plus que les ceux du Nord. Bien que les principales valorisations boursières reviennent aujourd’hui aux multinationales étasuniennes du numérique, les pays du Nord ne sont pas les seuls moteurs de ce secteur crucial pour la mise en place des IA. Les pays à revenu intermédiaire et faible les concurrencent activement avec leurs propres plateformes de micro-travail[6].

La Chine est sans doute l’un des plus grands acteurs sur le marché international des tâches numériques. Ses plus importantes plateformes, comme Zhubajie, surpassent Amazon en termes d’ambition, de revenus et de base d’utilisateurs. Malgré sa popularité, Mechanical Turk ne compte que 500 000 utilisateurs ; les plateformes chinoises, elles, comptent aujourd’hui dix, douze, quinze millions de micro-travailleurs chacune. Si nous réunissons toutes les plateformes de micro-travail et de travail à la demande mondiale, nous dépassons largement les cent millions d’effectifs répertoriés.

Au niveau international, l’attractivité du recours à ces places de marchés du micro-travail est conditionnée par le recentrage actuel des plateformes numériques sur une philosophie de l’innovation « disruptive » reposant largement sur l’intelligence artificielle. Amazon n’est donc pas le seul géant de la tech qui dispose d’un service de micro-travail pour former ses intelligences artificielles. Ainsi, en 2004, Microsoft s’est doté d’Universal Human Relevance System (UHRS) et Google a lancé EWOQ (ensuite devenu Rater Hub) en 2008. Sur ces deux plateformes le micro-travail humain sert avant tout à rendre possible le fonctionnement d’un type particulier d’algorithmes, à savoir ceux qui régissent les moteurs de recherche Bing et Google Search.

Pour calibrer sa célèbre intelligence artificielle Watson, IBM a à son tour utilisé une plateforme appelée Mighty AI. Quel genre de microtravail réalisaient-ils, les tâcherons œuvrant pour cette « puissante intelligence artificielle » ? Ils doivent, par exemple, identifier la langue d’une conversation, après en avoir écouté un fragment. En regardant la photo d’une station touristique, ils doivent détectent des éléments tels un nuage, une montagne, un lac, un chemin, etc. Dans une courte vidéo d’une webcam d’autoroute, ils doivent départager les plaques d’immatriculation des véhicules. Ces simples tâches sont utilisées respectivement pour « alimenter » des traducteurs automatiques, des systèmes de reconnaissance d’images, des véhicules autonomes…

Les tâches réalisées chaque jour par l’armée industrielle de l’ombre que les plateformes de micro-travail recrutent sont les ingrédients secrets des IA d’aujourd’hui.

La mythologie et, si j’ose le dire, l’idéologie de l’intelligence artificielle voudrait que les solutions de machine learning naissent déjà formées. Elles seraient – comme Athéna jaillissant de la tête de Zeus – tout prêtes au combat. Au contraire, elles doivent apprendre à partir de données structurées, triées, qualifiées pour pouvoir fonctionner. Les tâches réalisées chaque jour par l’armée industrielle de l’ombre que les plateformes de micro-travail recrutent sont les ingrédients secrets des IA d’aujourd’hui, pour peu qu’elles permettent d’introduire dans nos systèmes automatiques une suffisamment grande variété d’exemples.

L’apprentissage automatique exige alors beaucoup de travail « non automatique », c’est-à-dire réalisé par des humains. Non pas (ou non seulement) une poignée d’ingénieurs et de codeurs, mais avant et surtout des multitudes d’ouvriers du clic qui dessinent les contours d’un futur du travail voué à une véritable tâcheronnisation numérique. L’effet inattendu de l’intelligence artificielle sur le travail n’est donc pas le « grand remplacement » des travailleurs par des intelligences artificielles, souvent présenté comme une perspective dystopique dans la presse et dans le débat universitaire. Au contraire, c’est le remplacement du travail formel par du micro-travail précaire, invisibilisé et en fin de compte asservi à la fabrication des machines, qui doit inquiéter la société civile, les corps intermédiaires et les décideurs publics. La centralité du geste productif humain est irréductible. Ce dernier représente, même lorsqu’il est réduit à un clic, le carburant des grandes plateformes numériques. De ce point de vue, il convient de parler non pas de substitution mais de symbiose entre le geste humain et le fonctionnement automatique.

Ce qui semble vraiment être mis en péril n’est donc pas le travail lui-même, mais son encadrement institutionnel au sein de l’emploi formel. Les formes atypiques de travail précaire, sous-payé et (nous l’avons vu) micro-payé se multiplient. Parallèlement, nous assistons à la constante remise en discussion des catégories héritées de la civilisation salariale du siècle dernier, et notamment du binôme constitué par une subordination formellement délimitée et une protection sociale généralisée. Pour contribuer à résorber ce déséquilibre économique et culturel, une régulation collective est également nécessaire, fondée sur la reconnaissance du changement radical des activités humaines de production à l’heure de technologies—parfois intelligentes mais jamais entièrement « artificielles ».

NDLR Antonio A. Casilli a publié le 3 janvier En attendant les robots : Enquête sur le travail du clic, Seuil.


[1] “This is basically people-as-a-service” Jeff Bezos, “Opening Keynote and Keynote Interview”, MIT World – special events and lectures, 2006.

[2] Birgitta Bergvall-Kåreborn et Debra Howcroft, “Amazon Mechanical Turk and the commodification of labour”, New Technology, Work and Employment, vol. 29, no. 3, 2014, pp. 213-223.

[3] Kotaro Hara, Abi Adams, Kristy Milland, Saiph Savage, Chris Callison-Burch et Jeffrey Bigham, “A Data-Driven Analysis of Workers’ Earnings on Amazon Mechanical Turk”, arXiv, 2017.

[4] Amazon stipule avec ses Turkers un « Accord de Participation » dont les termes sont clairement conçus pour échapper à l’identification d’un lien de subordination des micro-travailleurs envers la plateforme ou envers les requérants. « Participation Agreement »Amazon Mechanical Turk, 17 oct. 2017.

[5] Graham, M., Hjorth, I., Lehdonvirta, V. (2017), Digital labour and development: impacts of global digital labour platforms and the gig economy on worker livelihoods, Transfer: European Review of Labour and Research, Vol. 23, n. 2, pp. 135-162.

[6] Casilli, Antonio A. (2017). Digital Labor Studies Go Global: Toward a Digital Decolonial Turn. International Journal of Communication, 11, Special Section “Global Digital Culture”, pp. 3934–3954.

Antonio Casilli

Sociologue, Maître de conférence à Telecom ParisTech et chercheur à L’institut Interdisciplinaire de l’Innovation (CNRS) et au LACI-IIAC de l’EHESS.

100 milioni di microlavoratori e… 4 miliardi di operai del click (Il Manifesto, Italia, 27 genn. 2018)

Nell’edizione del 27 gennaio 2018 de Il Manifesto, l’inserto settimanale Alias ospita una dossier assai completo su lavoro, piattaforme e nuove prospettive dell’azione politica in cui compare un mio lungo articolo intitolato Sulle piattaforme digitali siamo tutti operai del click. Fra le altre firme presenti in occasione dell’uscita di “Forza Lavoro”, il nuovo libro di Roberto Ciccarelli, ritroviamo Ippolita, Toni Negri, Valerio De Stefano, Tiziana Terranova.

La vie privée et les travailleurs de la donnée (Le Monde, 22 janv. 2018)

Dans Le Monde du 22 janvier 2018, je publie avec Paola Tubaro une tribune à l’occasion des 40 ans de la CNIL.

Attention : La tribune a été traduite en portugais et publié sur le site brésilien Outras Palavras.

 

Notre vie privée, un concept négociable

Antonio Casilli (Télécom ParisTech/EHESS) et Paola Tubaro (CNRS)

La défense de nos informations personnelles ne doit pas exclure celle des droits des travailleurs de la donnée

L’idée que nous nous faisons de la vie privée a profondément changé ces dernières années. Lorsque, en 1890, les juristes américains Samuel Warren et Louis Brandeis définissaient the right to privacy comme ” le droit d’être laissé en paix “, ils ignoraient qu’un siècle plus tard, cette définition n’aurait pas de sens pour 4 milliards d’êtres humains connectés. Nous n’assistons pas à sa fin, mais à la transformation de la -notion héritée de la tradition étasunienne. Pour ceux d’entre nous qui sont activement en quête de correspondants, d’amis, de partenaires sur un réseau numérique, le souci de défendre nos informations personnelles d’ingérences extérieures se révèle accessoire par rapport au droit de savoir combien de personnes exactement les possèdent et quel usage en est fait.

Nos informations ne sont plus ” chez nous “. Elles sont disséminées sur les profils Facebook de nos amis, dans les bases de données des commerçants qui tracent nos transactions, dans les boîtes noires algorithmiques qui captent le trafic Internet pour les services de renseignement. Il n’y a rien de plus collectif qu’une donnée personnelle. La question est donc moins de la protéger de l’action d’intrus qui cherchent à en pénétrer la profondeur que d’harmoniser une pluralité d’acteurs sociaux qui veulent y avoir accès.

Exit la notion de privacy comme pénétration qui était à la base de la loi Informatique et libertés de 1978, place à celle de privacy comme négociation. Communiquer des informations personnelles ou même sensibles à des tiers divers et variés fait désormais partie de l’expérience quotidienne de tout individu, que ce soit pour accéder à des biens commerciaux ou à des services publics. Il s’agit par exemple de consulter son compte Ameli, de vérifier un itinéraire sur son GPS, parfois d’organiser une rencontre sur Tinder ou de mesurer sa performance sportive par un bracelet connecté. Auparavant, le consentement à la captation, au traitement et à la conservation des données était nécessaire pour qu’une -pénétration de l’intimité ne soit pas une violation. Maintenant, sa fonction a changé. On donne son consentement contre un service.

C’est là le premier sens de l’idée de négociation de la vie privée : un échange, marchand ou pas, où les données personnelles font fonction de monnaie. S’arrêter à cette seule interprétation serait pourtant fourvoyant et politiquement myope. La vie privée est aujourd’hui surtout une négociation collective, une -concertation entre plusieurs parties afin de définir des obligations réciproques et d’organiser une relation. Cette relation peut être conflictuelle. De la campagne indienne contre l’usage des données par l’application Free -Basics à la plainte de l’ONG Europe-v-Facebook invalidant l’accord Safe Harbor, qui autorisait la plate-forme à transférer les informations des citoyens européens vers les Etats-Unis, les usagers de médias sociaux s’insurgent régulièrement contre des conditions perçues comme abusives.

Notre privacy cesse aujourd’hui d’être un droit individuel et se rapproche de l’idée d’un faisceau de droits et de prérogatives à allouer entre les citoyens, l’Etat et les entreprises du numérique. La négociation n’est pas simple et se complique d’autant plus que, par leurs -algorithmes, de puissantes plates-formes -tentent d’infléchir nos comportements. Un contact créé par deux usagers de leur propre initiative et un contact créé sous le conseil d’un système de recommandation automatisé sont-ils équivalents? Qui détient un droit sur les informations que cette relation engendre?

Il faut alors s’interroger non seulement sur les conditions d’usage, mais aussi sur les -modes de production des données, lesquels sont profondément influencés par les modèles d’affaires et les architectures logicielles -imposées par les plates-formes.

En effet, au-delà de la production de données brutes, des problèmes d’ordre nouveau apparaissent lorsqu’on étend son regard à leurs enrichissement, codage, étiquetage, mise en forme – opérations nécessaires pour rendre les données exploitables par des techniques de machine learning, soit l’apprentissage automatique. Les photos des vacances mises en ligne par les usagers d’une plate-forme sociale peuvent, par exemple, être labélisées par des tags qui identifient les lieux. Ces informations ont une valeur économique : -elles peuvent être vendues à des régies publicitaires ou, mieux, être utilisées pour calibrer des intelligences artificielles qui proposent automatiquement de prochains séjours aux vacanciers. Parfois, ce sont les usagers eux-mêmes qui ajoutent ces informations; parfois, les entreprises ont recours à du ” microtravail ” payé à la pièce. Moyennant quelques centimes, des services comme Amazon -Mechanical Turk leur permettent de demander à des myriades d’ouvriers du clic, souvent situées dans des pays en voie de développement, de trier ou d’améliorer photos, textes ou vidéos. Ces services recrutent des prestataires majoritairement précaires et peu rémunérés, remettant en question d’anciens acquis en termes de conditions de travail et d’appropriation de son produit. Ces nouvelles formes de digital labor s’imposent comme une -urgence pour le régulateur.

Pour corriger les distorsions et les abus provoqués par cette situation, la solution -consiste à élargir le domaine d’action des autorités de régulation des données comme la CNIL. Il s’agit non seulement de s’intéresser aux architectures techniques des plates-formes qui permettent l’extraction et la circulation des données personnelles, mais aussi de créer les conditions pour que le travail de production et d’enrichissement des données (autant de la part des services de microtravail que des usagers de plates-formes généralistes comme Instagram ou Google) reste respectueux des droits des personnes et du droit du travail. Le défi qui attend la CNIL est de devenir non pas un gardien de la propriété sur les données, mais un défenseur des droits des travailleurs de la donnée.

Antonio Casilli et Paola Tubaro