amazon mechanical turk

[Séminaire #ecnEHESS] Mary L. Gray “Amazon MTurk: les coulisses de l’intelligence artificielle” (10 avril 2017, 17h)

Enseignement ouvert aux auditeurs libres. Pour s’inscrire, merci de renseigner le formulaire.

Pour la séance du 10 avril 2017 EHESS Etudier les cultures du numérique, nous avons l’honneur d’accueillir Mary L. Gray, chercheuse chez Microsoft Research et membre du Berkman Center for Internet and Society de l’Université Harvard. Mary Gray a été l’une des pionnières des études sur Amazon Mechanical Turk et sur les liens entre micro-travail et intelligence artificielle.

Pour suivre le séminaire sur Twitter : hashtag #ecnEHESS.

ATTENTION : Le siège habituel étant fermé pour les vacances universitaires, cette  séance se déroulera le lundi 10 avril 2017, de 17h à 20h, amphi Opale, Télécom ParisTech, 46 rue Barrault, 13e arr. Paris.

Title: What is Going On Behind the API? Artificial Intelligence, Digital Labor and the Paradox of Automation’s “Last Mile.”

Speaker: Mary L. Gray

Abstract: On-demand digital labor has become the core “operating system” for a range of on-demand services. It is also vital to the advancement of artificial intelligence (AI) systems built to supplement or replace humans in industries ranging from tax preparation, like LegalZoom, to digital personal assistants, like Alexa. This presentation shares research that starts from the position that on-demand “crowdwork”—intelligent systems that blend AI and humans-in-the-loop to deliver paid services through an application programming interface (API)—will dominate the future of work by both buttressing the operations of future enterprises and advancing automation. For 2 years Mary L Gray and computer scientist Siddharth Suri have combined ethnographic fieldwork and computational analysis to understand the demographics, motivations, resources, skills and strategies workers drawn on to optimize their participation in this nascent but growing form of employment.  Crowdwork systems are not, simply, technologies. They are sites of labor with complicated social dynamics that, ultimately, hold value and require recognition to be sustainable forms of work.

La présentation et les débats se dérouleront en anglais.


Séminaire organisé en collaboration avec ENDL (European Network on Digital Labour).

Qui entraîne les IA et les drones ? Les internautes (Le Figaro, 22 mars 2017)

Dans Le Figaro no. 22586, en kiosque le mercredi 22 mars 2017, un article sur les liens entre digital labor et l’intelligence artificielle.  L’enquête est née des échanges entre la journaliste Elisa Braün, Mark Graham (Oxford Internet Institute) et moi-même.

 

Les internautes travaillent aussi pour les géants du Web
Braun, Elisa

Chez Google, il n’y a pas de petites économies. Un internaute veut changer son mot de passe ? Alors qu’il pense simplement prouver qu’il n’est pas un robot en cliquant sur un panneau de signalisation dans une série d’images, il entraîne les intelligences artificielles développées par l’entreprise et améliore sans le savoir des logiciels de conduite autonome à comprendre le Code de la route.

L’intelligence artificielle a beau promettre un futur rempli de machines entièrement autonomes, elle a encore besoin en coulisses de millions de petites actions humaines. « La plupart des services en ligne ont besoin de beaucoup d’êtres humains pour fonctionner » , explique au Figaro Mark Graham, géographe d’Internet à l’université d’Oxford et spécialiste de ces formes de travail invisibles de l’économie numérique. Cette activité, qui mobilise l’internaute moyen comme plusieurs centaines de millions de travailleurs insoupçonnés, a même un nom : le digital labor.

La ruée vers l’intelligence artificielle a amplifié ce phénomène. Google, Facebook, Microsoft et IBM ont chacun leurs propres laboratoires de recherche dans le domaine. Ces entreprises misent particulièrement sur cette technologie pour assurer leur avenir et ont recruté les meilleurs chercheurs pour réaliser leurs ambitions. Mais pour fonctionner correctement et réaliser leurs prouesses, les intelligences artificielles ont besoin de beaucoup d’attention humaine. Pour qu’un ordinateur reconnaisse un chaton parmi des milliards d’images, un humain doit d’abord lui montrer des milliers de photos de chatons. Cette phase d’entraînement ne revient pas aux grands savants mais à des internautes, qui se chargent de cliquer sur de nombreuses images de chatons jusqu’à ce que l’intelligence artificielle ait compris les traits distinctifs des félins et puisse prendre le relais.

Pour trouver cette main-d’oeuvre, les grandes entreprises adoptent différentes stratégies. Certaines font faire une partie de ce travail à leurs utilisateurs, sans même que ceux-ci en aient conscience. Lorsqu’un utilisateur de Facebook signale une image violente sur son flux d’actualités, il aide par exemple les algorithmes de modération du réseau social à repérer plus finement les contenus choquants postés chaque jour par milliers. Du côté de Google, la reconnaissance de caractères sur des « Captcha » (ces dispositifs qui apparaissent pour vérifier qu’un utilisateur n’est pas un robot) a longtemps permis d’aider les robots de l’entreprise à lire les pages de livres abîmées sur Google Books et à les indexer sur le moteur de recherche.

Les grandes entreprises adoptent une autre stratégie pour les sujets plus sensibles (comme la recherche militaire) ou laborieux (comme la reconnaissance de milliers d’images). Elles font appel à des internautes faiblement rémunérés sur des plateformes spécifiques de digital labor. Certaines ont même lancé leur propre système, de façon plus ou moins assumée. Google passe par EWOK, Amazon détient le service Mechanical Turk, Microsoft se sert de l’UHRS, et la technologie Watson, d’IBM, s’appuie sur la plateforme Spare5 (récemment rebaptisée Mighty AI). Sans connaître le commanditaire de leur travail, les internautes qui fréquentent ces sites doivent parfois reconnaître des pistes d’atterrissage sur des vues aériennes. « Je suis assez certain que certains travaux que nous observons servent pour entraîner les drones » , explique Mark Graham, qui a dirigé une importante étude auprès de centaines de « tâcherons du clic » en Afrique subsaharienne et en Asie du Sud-Est. Google, qui demande parfois à ses utilisateurs de repérer des pales d’hélicoptère sur des images pour recouvrer son mot de passe, est aussi propriétaire de Boston Dynamics, une entreprise investie dans la fabrication de robots militaires.

« Face à ce genre de cas, il faut se demander quel type d’intelligence artificielle nous aidons à développer » , note Antonio Casilli, sociologue à Télécom ParisTech et spécialiste du digital labor. Outre les finalités de ce type de travail, ses conditions posent aussi problème aux experts car elles perpétuent des inégalités. D’ici à 2019, 213 millions de travailleurs devraient pourtant intégrer le marché du digital labor, selon les chiffres de l’International Labour Organisation. L’utilisation des plateformes qui mettent en relation les entreprises et ces millions de travailleurs augmente de 25 % chaque année, selon les chiffres cités par l’étude de Mark Graham. Or, la rémunération de ces micro-tâches ou de ce travail n’est absolument pas régulée. Beaucoup de ces microtravailleurs passent 18 heures par semaine en moyenne à rechercher un travail précaire et épuisant. En France, le Conseil national du numérique a récemment lancé une grande consultation sur le digital labor. Les chercheurs européens se sont déjà fédérés en un réseau, European Network on Digital Labour (ENDL). –

Le micro-travail : des corvées peu gratifiantes et mal rémunérées (01net, 22 mars 2017)

Dans le magazine 01net du 22 mars 2017, une longue enquête sur les marchés du micro-travail du Sud Global, avec des extraîts d’un entretien que j’ai accordé au journaliste Gabriel Simeon.

Le Calvaire Des Forçats Du Net

Gabriel Simeon

Pour arrondir leurs fins de mois diffciles ou simplement gagner leur croûte, les besogneux du Web acceptent des corvées peu gratifiantes et très mal rémunérées.

Si internet était un iceberg, la partie émergée serait peuplée de Youtubers et de blogueurs, de patrons de géants du net et de startup… Bref, de tous ceux qui ont décroché le pactole en surfant sur ce nouvel eldorado. Le dessous de l’iceberg, l’invisible et l’essentiel, serait composé de ces petites mains payées au clic ou à la tâche, et pour qui net rime d’abord avec cacahuètes. Ces microtâcherons, comme les nomme le sociologue Antonio Casilli, professeur à télécom Paristech et auteur de Qu’est-ce que le digital labor ? (2015), seraient plus d’une centaine de millions dans le monde. Leur point commun ? ils se sont un jour inscrits sur une plateforme Web de microtravail comme il en existe des dizaines : zhubajie (15millions de travailleurs), Upwork (12 millions), CrowdSource (8 millions)… autant de places de marché qui font miroiter des jobs faciles, réalisables depuis un ordinateur, bien au chaud, chez soi. Le paradis des laborieux ? On finirait presque par le croire, si les missions ne se révélaient pas aussi courtes, répétitives et payées au lance-pierre.

Comme sur mechanical turk, mturk pour les habitués. Cette place de marché pionnière, lancée en 2005 par amazon, tire son nom d’un canular fomenté par un ingénieur hongrois du XViisiècle. Le farceur prétendait avoir développé un automate capable de battre n’importe qui aux échecs. C’était bidon. Sous sa machine, se dissimulait un humain en chair et en os qui, lui, était réellement imbattable.

Des souris et des hommes. Ce clin d’oeil à ce subterfuge, censé annoncer la domination des machines sur l’homme, est désormais une des vitrines du géant du commerce en ligne. Sur son site, amazon qualifie très ironiquement son mechanical turk, d’artificial artificial intelligence, autrement dit “d’artificielle intelligence artificielle”. Une façon cynique de rappeler que les robots ne nous ont pas encore tout à fait remplacés. Le site mturk.com met donc en relation employeurs et stakhanovistes du mulot pour confier à ces derniers des travaux que les ordinateurs ne parviennent pas encore bien à réaliser. Par exemple, analyser une image, effectuer une présentation PowerPoint, donner de la visibilité à un site Web, traduire un texte… Signe des temps, beaucoup sont prêts à s’acquitter de ce genre de corvées, en échange d’une (petite) poignée de dollars ou de coupons de réduction.

Gains sans effort. au passage, l’entremetteur capte sa commission (20 % environ du budget consenti par l’employeur), ce qui ne freine en rien son succès. La plateforme compte quelque 500 000 inscrits et 15 000 travailleurs actifs par mois, dont un quart y consacrerait plus de vingt et une heures par semaine. La réussite est telle que d’autres ténors du net, et pas des moindres, se sont lancés sur ce créneau, tels microsoft avec UHRS ou iBm avec Spare. Cette idée de faire appel aux internautes pour exécuter des boulots fastidieux n’est pas tout à fait nouvelle. au début des années 2000, des universitaires avaient déjà eu l’idée de solliciter des amateurs de sciences pour découvrir d’autres étoiles sur des images prises au télescope, dans l’espace. “Depuis, Internet a poussé à l’extrême ce phénomène dit de crowdsourcing” , constate Antonio Casilli. Le système a également été favorisé par l’émergence des emplois à la pige ou en free-lance, ainsi que par le boom de la sous-traitance. Pour autant, les plateformes comme mturk ne sont pas totalement dénuées d’intérêt. grâce à elles, certains disposent maintenant d’un moyen d’arrondir leurs fins de mois, sans même avoir à sortir de chez eux, tout en contribuant aussi à faire progresser la recherche. Plus d’un tiers des activités proposées alimentent des études scientifiques. enfin, le site d’amazon soulage les entreprises en leur donnant accès à une main-d’oeuvre variée, taillable et corvéable à merci… et surtout, très low-cost.

Selon l’institut américain Pew Research Center, près de deux tiers des boulots offerts sur mturk sont rémunérés moins de 10 centimes (on parle de dollar, mais c’est à peu près la même chose en euro). il suffit de s’inscrire sur le site pour le vérifier. Une certaine Shery gould offre une récompense de 0,04 dollar pour qui récupérera les adresses mails des dirigeants d’une entreprise. Plus bas, on propose de convertir des prix américains en euros (0,07 dollar) ou de lister des ingrédients présents sur des photos de produits alimentaires (0,50 dollar, waouh !). À ce rythme, on vous laisse imaginer le nombre d’actions à enchaîner pour gagner sa croûte. Laura, une mère au foyer américaine, a fait le calcul et l’a publié sur un site de turkers (travailleurs mturker) mécontents : “La triste réalité, déplore-t-elle, c’est que j’ai gagné 0,75 dollar de l’heure ces deux dernières semaines, qui seront encore amputés de 15 % après impôts . ” Dix fois moins que le salaire minimum en vigueur dans tout le pays ! Pour les autres turkers, ce n’est guère mieux. La moitié engrange moins de 5 dollars de l’heure, et cela à raison de quarante heures par semaine sans avoir de vacances, soit 10 379 dollars (9 800 euros) à l’année ! tout ça, sans contrat à la clé. Leurs “patrons” ne cotisent ni pour leur santé ni pour leur retraite… et s’ils ne sont pas satisfaits du boulot, les turkers ne sont pas payés !

À la rigueur, le cyberesclave peut se faire une vague idée de la probité de son employeur en consultant son “taux d’approbation”, calculé en fonction des avis d’anciens employés, et mentionné sur son profil. S’il n’est pas content, il n’a qu’à aller trimer ailleurs. Ce ne sont pas les sites qui manquent.

Dix centimes le couple. Peut-être avez-vous déjà entendu parler de la nouvelle application de rencontres Once. Ses concepteurs promettent à chacun de leurs membres de les mettre en relation chaque jour avec une potentielle âme soeur, d’après l’analyse des profils des tourtereaux. alors que, jusqu’ici, la plupart de ces sites avaient recours à des algorithmes automatisés pour dégoter la perle rare, Once innove en faisant appel à des “matchmakers”. Selon le magazine Challenges , ces grouillots de l’amour chargés de trier les profils seraient au moins 150 à opérer en France. ils seraient payés 10 centimes par paire de profils établis. À raison d’un “match” réalisé toutes les trente secondes, sans prendre la moindre pause, ces travailleurs peuvent espérer empocher 12 euros de l’heure. mais attention, ils ne touchent l’argent que si les candidats accouplés ont vraiment le coup de foudre… Ce qui n’arrive qu’une fois sur deux. C’est déjà moins alléchant.

Bon, on fait la fine bouche. Pourtant, dans des pays émergents comme on les nomme à présent, beaucoup sauteraient sur l’occase pour pouvoir manger. L’indonésie fournirait ainsi l’essentiel des micro-tâcherons du net, d’après Antonio Casilli. Là-bas, ces esclaves de la souris offcient carrément dans des fermes à clics, dans le but de partager et Liker des contenus publiés sur Facebook. tandis qu’en inde ou aux Philippines, les crève-la-faim s’échinent à apprendre l’allemand ou le russe pour, ensuite, proposer leur service de traduction contre des clopinettes.

Travailler à l’oeil. encore peuvent-ils s’estimer contents d’être payés. Car aujourd’hui, rémunérer les besogneux en espèces sonnantes et trébuchantes, c’est déjà dépassé. ainsi, les Local guides de google doivent-ils se contenter d’une gratification pour les bonnes adresses de restaurants, les photos qu’ils publient ou les avis qu’ils partagent dans le but d’enrichir la toile déployée par le colosse du Web. en échange, ces gentils Saint-Bernard gagnent un peu d’espace disque sur google Drive ou ont l’honneur de tester en avant-première des appareils promus par la marque. merci, c’est trop, vraiment, vous n’auriez pas dû…

De toute façon, plébéiens du réseau que nous sommes, nous ne réalisons même pas que nous bossons gracieusement pour les mastodontes du Web. n’avez-vous jamais coché la case Je ne suis pas un robot, avant de valider un téléchargement ? Ce système, qui nécessite parfois d’analyser une photo pour prouver qu’on est bien un humain, sert en fait à entraîner les programmes de reconnaissance d’images de google. Dur, dur d’être considéré comme un cyberprolo, quand on se prend pour un champion du mulot. n

Illustration(s) :
Des plateformes comme mTurc font florès sur le Net en offrant aux entreprises des cybertâcherons payés au lance-pierre : moins de 0,10 $ la tâche !
Afflux de Like sur les réseaux sociaux ? Les fermes à clics, comme celle-ci en Chine, sont entrées en action !
Des plateformes comme mTurc font florès sur le Net en offrant aux entreprises des cybertâcherons payés au lance-pierre : moins de 0,10 $ la tâche !
Afflux de Like sur les réseaux sociaux ? Les fermes à clics, comme celle-ci en Chine, sont entrées en action !

Facebook
Facebook est spécialisé dans les prestations de services de réseautage social en ligne. L’activité de la société s’organise autour de 3 pôles : – prestations de mise en réseau : notamment prestations
Facebook
Facebook specializes in online social networking services. The group’s activity is organized around 3 areas: – networking services: primarily information exchanging and photography sharing for the individuals (1.9 billion monthly

© 2017 01 net. Tous droits réservés. Le présent document est protégé par les lois et conventions internationales sur le droit d’auteur et son utilisation est régie par ces lois et conventions.
Certificat émis le 22 mars 2017 à TELECOM-PARISTECH à des fins de visualisation personnelle et temporaire.

news·20170322·UK·20170322×c0049
© CEDROM-SNi inc., 2017

Réinitialiser la session
Journaux
Magazines et revues
Presse web
Presse web référencé
Communiqués de presse
Fils de presse
Contenu de presse écrite publié sous une marque reconnue

[Slides séminaire #ecnEHESS] Mechanical Turk et le travail invisible des données (7 mars 2016)

Pour la séance du 7 mars 2016 de mon séminaire EHESS Etudier le cultures du numérique, j’ai eu le plaisir d’accueillir Jérôme Denis (Télécom ParisTech, co-auteur de Petite sociologie de la signalétique, 2010) et Karën Fort (Université Paris-Sorbonne, porteuse du projet ZombiLingo). Une intervention d’Elinor Wahal (Université de Trento) a complété leurs exposés.

Résumé : Les plus fervents avocats et les plus féroces critiques des projets de big data ou d’open data partagent l’idée que les données sont des entités informationnelles solides et puissantes. Qu’elles soient décrites comme un pétrole, comme un déluge, ou comme une technologie de gouvernance, celles-ci semblent toujours appréhendées dans un cadre positiviste, qui fait de leur existence et de leurs propriétés des évidences. Pourtant, celles et ceux qui « produisent, » «  saisissent »  ou « nettoient » des données savent que leur existence et leur circulation passent par des opérations délicates et coûteuses. Je propose d’explorer cet aspect méconnu des données en montrant d’abord que l’histoire de l’émergence des données dans les organisations est étroitement liée à la mécanisation et à l’invisibilisation du travail de l’information. À partir de deux études ethnographiques (dans une banque et dans une start-up), je mettrais ensuite en lumière quelques dimensions de ce travail et des conditions de son invisibilisation. À travers ce parcours, je tâcherai de donner à comprendre l’écologie du visible et de l’invisible qui est en jeu dans le processus fragile et incertain par lequel des choses très différentes, souvent indéfinies, deviennent progressivement et temporairement des données.

Résumé : Dans le cadre des travaux des étudiants du séminaire, une intervention sur les plateformes de micro-travail a été assurée par Elinor Wahal (EHESS/Univ. Trento).

Capture d’écran 2016-03-13 à 11.09.51

Karën Fort – Ce qu’Amazon Mechanical Turk fait à la recherche : l’exemple du Traitement Automatique des Langues

Résumé : La plateforme de myriadisation du travail parcellisé (microworking crowdsourcing) Amazon Mechanical Turk permet aux chercheurs de déposer des micro tâches (Human Intelligence Tasks) pour les faire réaliser par des travailleurs (des Turkers) pour une micro-rémunération. Le traitement automatique des langues (TAL) étant très gourmand en ressources langagières (lexiques, corpus annotés, etc), les chercheurs du domaine se sont rapidement emparés de cette plateforme pour produire des données à bas coût. Nous montrerons que cette évolution n’est pas sans conséquence sur la recherche, en termes de qualité et d’éthique. Enfin, nous présenterons les réactions et les alternatives proposées, notamment par le biais des sciences participatives et nous vous présenterons le projet Zombilingo.