données

Entretien : algorithmes et vie privée (Radio Nova, 16 nov. 2016)

Ce matin à 7h15 j’ai pris le premier café de la journée en compagnie d’Edouard Baer et de sa joyeuse bande de lurons sur Radio Nova, dans l’émission Plus Près De Toi. On a parlé algorithmes de recommandation, traçage sur internet, vie privée et données personnelles. Et on s’est demandé pourquoi Edouard reçois toujours des pubs d’actrices qui ont mal vieilli, alors que moi je ne reçois que des pubs pour baignoires pour séniors…

Bref, voilà le lien du podcast : Plus Près De Toi 16/11 | NOVAPLANET Mon entretien commence à 14′.

Sur France Inter (3 août, 2016)

» Ecouter “Le téléphone sonne – Notre rapport au virtuel” (41 min.)

Pokemon Go, réseaux sociaux… Quel rapport entretenons-nous avec le virtuel dans nos sociétés qui se numérisent ?

Invités :

Antonio A. Casilli – Sociologue, maître de conférences en humanités numériques à Telecom ParisTech et chercheur au Centre Edgar-Morin de l’EHESS

Vanessa Lalo – Psychologue clinicienne, spécialiste des usages numériques

Bernard Stiegler – Philosophe, auteur de « Dans la Disruption, comment ne pas devenir fou ? » [Les Liens qui libèrent / Mai 2016] (par téléphone)

Source: Notre rapport au virtuel du 03 août 2016 – France Inter

[Slides séminaire #ecnEHESS] Mechanical Turk et le travail invisible des données (7 mars 2016)

Pour la séance du 7 mars 2016 de mon séminaire EHESS Etudier le cultures du numérique, j’ai eu le plaisir d’accueillir Jérôme Denis (Télécom ParisTech, co-auteur de Petite sociologie de la signalétique, 2010) et Karën Fort (Université Paris-Sorbonne, porteuse du projet ZombiLingo). Une intervention d’Elinor Wahal (Université de Trento) a complété leurs exposés.

Résumé : Les plus fervents avocats et les plus féroces critiques des projets de big data ou d’open data partagent l’idée que les données sont des entités informationnelles solides et puissantes. Qu’elles soient décrites comme un pétrole, comme un déluge, ou comme une technologie de gouvernance, celles-ci semblent toujours appréhendées dans un cadre positiviste, qui fait de leur existence et de leurs propriétés des évidences. Pourtant, celles et ceux qui « produisent, » «  saisissent »  ou « nettoient » des données savent que leur existence et leur circulation passent par des opérations délicates et coûteuses. Je propose d’explorer cet aspect méconnu des données en montrant d’abord que l’histoire de l’émergence des données dans les organisations est étroitement liée à la mécanisation et à l’invisibilisation du travail de l’information. À partir de deux études ethnographiques (dans une banque et dans une start-up), je mettrais ensuite en lumière quelques dimensions de ce travail et des conditions de son invisibilisation. À travers ce parcours, je tâcherai de donner à comprendre l’écologie du visible et de l’invisible qui est en jeu dans le processus fragile et incertain par lequel des choses très différentes, souvent indéfinies, deviennent progressivement et temporairement des données.

Résumé : Dans le cadre des travaux des étudiants du séminaire, une intervention sur les plateformes de micro-travail a été assurée par Elinor Wahal (EHESS/Univ. Trento).

Capture d’écran 2016-03-13 à 11.09.51

Karën Fort – Ce qu’Amazon Mechanical Turk fait à la recherche : l’exemple du Traitement Automatique des Langues

Résumé : La plateforme de myriadisation du travail parcellisé (microworking crowdsourcing) Amazon Mechanical Turk permet aux chercheurs de déposer des micro tâches (Human Intelligence Tasks) pour les faire réaliser par des travailleurs (des Turkers) pour une micro-rémunération. Le traitement automatique des langues (TAL) étant très gourmand en ressources langagières (lexiques, corpus annotés, etc), les chercheurs du domaine se sont rapidement emparés de cette plateforme pour produire des données à bas coût. Nous montrerons que cette évolution n’est pas sans conséquence sur la recherche, en termes de qualité et d’éthique. Enfin, nous présenterons les réactions et les alternatives proposées, notamment par le biais des sciences participatives et nous vous présenterons le projet Zombilingo.

 

Dans le Cahier IP – CNIL (17 nov. 2015)

Dans le Cahier Innovation CNIL “Les Données, Muses & Frontières de la Création” j’ai le plaisir d’être interviewé avec le collègue Dominique Cardon au sujet d’algorithmes, big data, et digital labor.

CahiersIP_CNILClick to enlarge

Lire, écouter, regarder et jouer en ligne à l’heure de la personnalisation : découvrez le nouveau cahier IP

17 novembre 2015

Nos consommations de contenus culturels dématérialisés deviennent massivement productrices de données. Ce nouveau cahier IP alimente le débat sur la place des algorithmes dans nos choix et sur les manières de redonner du contrôle aux utilisateurs.

Les industries culturelles et créatives ont été les premières à connaître de profondes mutations sous l’impulsion des usages numériques et de la dématérialisation des contenus. Elles constituent ainsi un formidable laboratoire de la mise en données du monde, au-delà de l’image réductrice des données comme « pétrole de l’économie numérique ».

Aujourd’hui, la plus-value des services de distribution de contenus culturels et ludiques dématérialisés se concentre dans leur capacité à analyser les habitudes de consommation des utilisateurs à des fins de personnalisation.

  • 2/3 tiers des utilisateurs de services de streaming musical ou de vidéo à la demande sur abonnement (dite « SVOD ») utilisent et apprécient les recommandations (étude Médiamétrie réalisée pour la CNIL, octobre 2015).

Pour Isabelle Falque-Pierrotin, Présidente de la CNIL :

« la lecture, la musique, les films et les séries mais aussi sans doute les jeux vidéo, bien au-delà du divertissement qu’ils nous procurent, ne sont-ils pas les lieux par excellence où ne cesse de s’élaborer et de se réinventer notre identité ? Les œuvres se situent au carrefour du plus collectif et du plus intime, au cœur de nos destins publics autant que personnels ».

Extrait de la page 23 du cahier IP

La « magie » des algorithmes ?

Indispensables pour naviguer dans l’immensité des catalogues de contenus, les algorithmes peuvent tout autant favoriser la découverte qu’enfermer les individus dans des goûts stéréotypés ou des horizons limités.

  • Près d’un utilisateur sur deux s’est d’ailleurs déjà demandé sur quelle base étaient produites ces recommandations.

Le 3ème cahier IP explore cette utilisation intensive des données personnelles au travers de tendances clefs et émergentes, d’interviews d’experts (Nicolas Curien, Eric Schérer, Olivier Ertzscheid, Dominique Cardon, Antonio Casilli) et de scénarios exploratoires.

Il analyse en particulier:

  • la diversité des modèles économiques  et le rôle croissant que les données y tiennent
    • Partie 1 INDUSTRIES CRÉATIVES, CONTENUS NUMÉRIQUES ET DONNÉES
  • la nature des données utilisées dans les usages actuels et émergents pour chacun des secteurs
    • Partie 2 LES CONTENUS CULTURELS VUS AU TRAVERS DU PRISME DES DONNÉES
  • les mythes et réalités de la recommandation et « fact-check » sur la « magie » des algorithmes
    • Partie 3 LE GRAAL DE LA RECOMMANDATION ET DE LA PERSONNALISATION
  • 4 scénarios explorant les futurs possibles du couple « données + culture » => Partie 4 DEMAIN, QUELLES CRÉATIONS ET QUELS USAGES DATA-DRIVEN ?

Outiller l’individu pour innover dans l’expérience utilisateur

Ce cahier se veut aussi un appel à l’innovation des acteurs économiques.

Pour ces entreprises qui misent tout sur l’expérience utilisateur, relever le défi de l’éthique et de la confiance passe aussi par des informations plus claires et la mise à disposition d’outils innovants (portabilité, tableaux de bord, politiques de confidentialité lisibles et illustrées).

Pour créer des expériences d’usage « sans frictions » les plateformes doivent renforcer leurs efforts de transparence et de loyauté, en particulier en ce qui concerne les algorithmes.

La blogosphère à propos de “Qu’est-ce que le digital labor?” (sept.-oct. 2015)

Sur son blog chez Rue89, Antonin Benoit analyse les liens entre micro-travail sur Amazon Mechanical Turk et son ancêtre médiéval, le Verlaagssystem (11 sept. 2015) : Internet réinvente l’ouvrier du textile du Moyen Age | Déjà-vu | Rue89 Les blogs

Le blogueur italien Luca De Biase pose la question : “digital labor,  métaphore ou bien nouvel outil de réflexion ?” (22 sept. 2015) : Antonio Casilli e i lavoratori del web – Luca De Biase

Serge Coosemans, blogueurs pour le magazine belge Le Vif, pointe les risques du “digital tipping” (micro-rémunération du “travail numérique à la pièce”) (28 sept. 2015) : Cacahouètes pour tous: sur Internet aussi, tout travail mérite salaire – Multimédia – FocusVif.be