« Les travailleurs invisibilisés de l’Intelligence Artificielle - Antonio Casilli » : différence entre les versions

De April MediaWiki
Aller à la navigationAller à la recherche
(Page créée avec « Catégorie:Transcriptions '''Titre :''' Les travailleurs invisibilisés de l’Intelligence Artificielle - Antonio Casilli '''Intervenants :''' Antonio Casilli -... »)
 
Ligne 52 : Ligne 52 :
Comme ChatGPT et OpenAI ne communiquent pas sur l’existence même de ces personnes-là, ce sont d'abord des journalistes et, après, des chercheurs qui ont fait l'effort d'aller les chercher. Quelques mois après la mise en ligne de ChatGPT le magazine <em>Times</em> avait publié une enquête dans laquelle il dévoilait que plusieurs centaines de personnes se trouvaient au Kenya, à Nairobi, en train d’annoter des données de ChatGPT.
Comme ChatGPT et OpenAI ne communiquent pas sur l’existence même de ces personnes-là, ce sont d'abord des journalistes et, après, des chercheurs qui ont fait l'effort d'aller les chercher. Quelques mois après la mise en ligne de ChatGPT le magazine <em>Times</em> avait publié une enquête dans laquelle il dévoilait que plusieurs centaines de personnes se trouvaient au Kenya, à Nairobi, en train d’annoter des données de ChatGPT.


==16’ 20§==
==16’ 20==


<b>Gérald Holubowicz : </b>Donc toi,
<b>Gérald Holubowicz : </b>Donc, toi, tu as fait un travail un peu équivalent avec tes étudiants, tu es aussi allé chercher un peu ces données-là qui étaient réellement derrière ce travail un peu invisibilisé on va dire ?
 
<b>Antonio Casilli : </b>C'est le travail qu'on fait systématiquement depuis 2018 en réalité, on le faisait bien avant ChatGPT et GPT en général, parce que c'est une question, c'est une problématique qui concerne les solutions d'intelligence artificielle.<br/>
Si tu considères, par exemple, les assistants vocaux qui se trouvent dans ton smartphone ou d'un ton ordi, ce sont des intelligences artificielles qui ont besoin d'énormément de contribution humaine. Nous avons commencé à travailler sur des applications du type agendas intelligents, des assistants vocaux ou des <em>chatbots</em> et après, évidemment, des caméras de surveillance intelligentes, des systèmes de reconnaissance faciale. On a donc tout un tas de technologies et, pour chacune de ces technologies, on va chercher les travailleurs qui sont dans le <em>back-office</em>. Ces travailleurs dans le <em>back-office</em> font tout un tas d'activités : parfois, ce sont des activités de pré-entraînement, ils se situent dans le passé et, parfois, ce sont des activités d’entraînement/vérification en temps réel, c'est-à-dire que, parfois, il faut s'assurer que l'application d'intelligence artificielle fonctionne comme elle promet de fonctionner, par exemple que l'assistant vocal interprète correctement ce que l'usager dit. Il faut donc des personnes qui, parfois à la main, parfois sur un échantillon et parfois sur toutes les conversations qu'on a avec un assistant vocal, s'occupent de vérifier que les transcriptions et l'interprétation faites par l'assistant vocal soient correctes. C'est donc une deuxième activité, ce n'est pas de l'entraînement, c'est de la vérification.<br/>
Après, parce qu'on a cité de la vérification en temps réel, parfois cette vérification en temps réel est tellement en temps réel que, pour être un peu provocateur, il n'y a pas d'intelligence artificielle à proprement parler, c'est-à-dire que, parfois, l'effet d'intelligence artificielle ou plutôt la performance d'intelligence artificielle est assurée par des personnes qui, en temps réel, font ce que le modèle d'intelligence artificielle est censé faire mais n'arrive pas à faire, parce que, parfois, il dysfonctionne et parfois il n'existe même pas ; parfois ce sont carrément des situations de fraude.
 
<b>Gérald Holubowicz : </b>Du coup, il y a vraiment toute une brique de ce système-là qui repose sur des travailleurs qui, en temps réel, ou pas, avant même l'utilisation du logiciel, commencent à former un travail pour pouvoir soit raffiner les données soit ajuster en direct ces données. De qui s'agit-il ? Est-ce que ce sont des Occidentaux, des gens venant d'autres pays ? Comment se répartit un peu cette masse de travailleurs-là qui agit dans l'ombre ?
 
<b>Antonio Casilli : </b>C'est une vaste question, je cherche à apporter quelques éléments un peu concrets.<br/>
Il y a, en réalité, trois équipes au monde qui font ce type de travail : nous à l'Institut Polytechnique de Paris, nos collègues d’Oxford et nos collègues de l’OIT, l'Organisation internationale du travail. Ces enquêtes-là, qui durent depuis plusieurs années, nous donnent une cartographie dans laquelle on a une très forte séparation, un très fort clivage entre le Nord et le Sud global.<br/>
C'est clair que des pays comme les États-Unis ou plusieurs pays européens sont encore des lieux dans lesquels un nombre important de micro-travailleurs ou travailleurs du clic sont recrutés. Notre propre estimation, qui remonte quand même à 2019, donc pré-Covid, faisait état, approximativement, de 260 000 personnes en France qui font occasionnellement ce type de travail du clic. Mais, comme il s'agit de personnes qui, pour des questions légales et pour des questions économiques, doivent être payées certes à la pièce et très faiblement, mais faiblement par rapport aux standards des pays du Nord, ce n'est pas toujours intéressant du point de vue de l'efficacité, par rapport aux coûts, pour les entreprises qui produisent de l'intelligence artificielle. Si tu dois recruter un million de personnes parce que d'ici sept jours tu as besoin d’annoter, que sais-je, quatre millions de vidéos, ce n'est pas une masse de travailleurs que tu peux recruter tranquillement dans les pays du Nord, c'est donc plutôt dans les pays du Sud qu'on va chercher. Ces pays sont Madagascar pour le contexte francophone, le Venezuela pour l’Amérique du Sud, les Philippines et l’Inde, plus récemment le Bangladesh et, après, d'autres pays. Nous, c'est-à-dire, encore une fois, mon équipe de recherche et moi, nous nous sommes spécialisés surtout sur l’Afrique et l’Amérique latine, d'autres se spécialisent plutôt sur l’Asie, mais c'est quand même un phénomène qui affiche une forte forme de dépendance politique et économique de ces pays et des marchés du travail dans ces pays vis-à-vis des entreprises du Nord : les entreprises qui produisent et qui vendent de l'intelligence artificielle sont dans les pays du Nord, plus récemment dans les pays dits émergents mais largement émergés comme la Chine, l'Inde et la Russie aussi. Dans ce contexte-là, ces formes de dépendance politique et économique ressemblent effectivement beaucoup à des formes néocoloniales.
 
<b>Gérald Holubowicz : </b>Ça veut donc dire, grosso modo, qu’on maintient ces pays sous influence pour pouvoir bénéficier d'une main-d'œuvre relativement bon marché, voire extrêmement très bas marché, pour pouvoir justifier un business modèle qui, autrement, ne pourraient pas survivre. C'est ça ?
 
<b>Antonio Casilli : </b>D'abord, il faut comprendre que ce n'est pas une nouveauté dans l'absolu parce que ces pays étaient déjà dans une forme de dépendance économique à cause des chaînes de sous-traitance d'autres secteurs, par exemple le secteur du textile, le secteur de l'énergie ou le secteur de l’agriculture plus traditionnellement. Plus récemment – quand je dis récemment c'est entre la fin du siècle passé et le début du 21e siècle –, on a commencé à voir apparaître, dans ces mêmes pays, des centres de spécialisation sur des services de traitement de l'information. Au début c'était plutôt les <em>call centers</em>, c'était le téléservice, c'étaient les SS2I. Après, progressivement, on s'est rendu compte qu'on n'avait pas besoin exclusivement de personnes qui répondent au téléphone, mais de personnes qui réalisent aussi des tâches non voix, <em>non-voice tasks</em>. Les tâches non vocales consistent, grosso modo, à annoter une data, regarder une vidéo, lire et résumer rapidement, en une phrase, un texte. Toutes ces tâches-là ont été, progressivement, de plus en plus fragmentées, simplifiées, standardisées pour les rendre effectivement disponibles à une population plus vaste et « moins spécialisée » ; quand je dis moins spécialisée, il faudrait mettre ça entre beaucoup de guillemets. En réalité, la spécialisation est là, elle n'est pas reconnue, mais c'est certain que ces tâches ont moins de barrières à l’entrée, demandent moins de temps d'apprentissage pour pouvoir être réalisées tout de suite ; normalement, il n'y a pas un entraînement important avant la réalisation de ces tâches.
 
<b>Gérald Holubowicz : </b>D’accord. On a eu, à travers certains articles de presse, des remontées, notamment de ce type de travaux. On parle notamment de curation, en fait de modération de contenus qui pourraient être éventuellement problématiques sur la santé de ces travailleurs-là. Est-ce que tu as un regard là-dessus ? Est-ce que c'est quelque chose que tu observes en particulier ? Est-ce que tu peux nous décrire un peu les problématiques que ces travailleurs-là rencontrent ?
 
<b>Antonio Casilli : </b>Les modérateurs c'est un cas particulier. Ils rentrent dans ce travail du clic même s’ils sont présentés comme des modérateurs de contenu. Eux aussi sont des entraîneurs de données : pour les plateformes même une vidéo ou une photo c’est de la data, même si c'est de la data sous forme de contenu produit par les utilisateurs mêmes de ces plateformes et ces contenus ont besoin d'être filtrés ou placés. Les modérateurs sont normalement des travailleurs du clic qui font ce travail de filtrage ou, plutôt, notamment sur des contenus problématiques, c'est-à-dire si on doit départager, par exemple, les contenus généralistes versus les contenus pour adultes, c'est un travail de modération par exemple de ce qu'on pourrait définir comme de contenus pornographiques. Ou alors, s'il s'agit de faire respecter certaines règles qui sont parfois de simples règles de civilité et parfois des lois de l'État dans lequel la plateforme se trouve, là il s'agirait, par exemple, de modérer un certain type de discours politique, de discours de haine et ainsi de suite. C'est donc un cas particulier, mais c'est encore de l’annotation de données, c'est encore de l'entraînement d'intelligence artificielle.<br/>
Ces personnes, qui modèrent surtout les contenus les plus problématiques, sont reconnues depuis longtemps et de plus en plus par des cours de justice, carrément, comme atteintes par des risques sociaux-professionnels spécifiques, qui relèvent effectivement du traumatisme ou du syndrome post-traumatique. L'esprit humain, surtout, en plus, si c'est structuré d'une manière systématique – c'est-à-dire, à longueur de journée, voir des images violentes –, oui, on peut bien imaginer qu’à certains moments cela déclenche un traumatisme et ceci est attesté.<br/>
Au-delà cela que je comprends, que je justifie, je trouve même très correct de faire reconnaître les droits des travailleurs du clic en passant effectivement par les risques sociaux-professionnels et les risques pour la santé, on retrouve d'autres risques un peu différents, un peu dans toute la population qu'on a étudiée. Je te donne un autre exemple parce que c'est tout récent. Avec des collègues d’un laboratoire de recherche au Brésil, qui s'appelle ??? [28 min 13], on a réalisé et on vient de publier un rapport sur le travail du clic au Brésil, dans lequel il y a toute une partie sur les risques psychosociaux associés à ce type de travail.<br/>
Encore une fois, certains modèrent, certains sont là pour entraîner des robots genre les Roomba, les aspirateurs robots qu’il faut entraîner aussi. D'autres personnes, au Brésil, font un travail carrément de fermes à clics, fermes à clics veut dire tout simplement qu’elles sont payées par exemple pour <em>follower</em> un profil sur Instagram ou pour regarder une vidéo sur YouTube.<br/>
Elles ne sont pas toutes exposées à des situations problématiques, pourtant toutes ont un problème ou des problèmes qui sont liés principalement à des formes d’atomisation de leur activité, de perte de sens de leur activité, et de désocialisation autour du travail. Historiquement, tel qu'il est conçu dans les sociétés modernes, le travail est une activité collective qui inscrit le travailleur et la travailleuse dans un collectif de travail, dans un collectif professionnel, ça peut être le bureau, ça peut être un lieu, ça peut être une communauté professionnelle, mais ces personnes-là ne voient pas la communauté professionnelle.<br/>
Après, il faut mettre des bémols parce qu’on ne trouve pas la même situation qu'au Brésil partout dans le monde. Par exemple dans notre enquête sur la France oui, on remarque que les mêmes risques sociaux-professionnels et psychosociaux sont présents chez les travailleuses et travailleurs français, parce que, eux et elles aussi, avaient, par exemple, des problèmes d’isolement et ça, encore une fois, même avant le Covid. Le fait de se dire « je suis en train de travailler pour une entreprise dont je ne rencontre jamais les représentants, de laquelle je ne reçois pas, à proprement parler, ma fiche de paye parce que je ne suis pas payé comme un salarié, mais je suis payé comme une personne qui est un usager d'une plateforme dans laquelle il y a une cagnotte et je cumule des points, ces points peuvent être transformés en argent », tout cela implique, effectivement, des effets de désocialisation qui, au fil des mois et des années, ont effectivement un impact important et très grave sur ces populations.<br/>
Après, il y a des différences. Je peux te donner deux pays dans lesquels la situation est largement différente : le Venezuela, par exemple, dans lequel les travailleurs du clic travaillent depuis chez eux et chez elles, mais, souvent, travaillent en communauté qui peut être leur communauté familiale. On a souvent rencontré des personnes où tout le monde, au sein du foyer, s'alternait pour réaliser les mêmes tâches : quand l'enfant était à l'école, c'était la maman, après c'était l'enfant et, le soir, peut-être même la grand-mère ou le grand-père. C'est une situation complètement différente.<br/>
On a rencontré une situation encore complètement différente, parce que très variée, par exemple à Madagascar : quand j'étais à Tananarive, j'ai rencontré des personnes qui travaillaient dans des véritables bureaux, dans des <em>openspaces</em>, chacune avec son poste ; des personnes qui travaillaient dans des entreprises informelles, plus ou moins cachées dans une maison complètement banale mais, dans chaque pièce de cette maison, dans le grenier, dans le garage, tu avais 20/30 personnes en train de cliquer et de se faire payer pour cliquer et parfois, il y avait des personnes qui travaillaient dans des cybercafés, il y avait des personnes qui travaillaient chez elles. Après, il y a aussi des questions de connectivité, d'électricité. Autant au Venezuela qu’à Madagascar le courant électrique ne passe pas toujours, ça peut donc introduire des fragmentations et des ruptures de continuité dans ces processus de travail qui ont besoin, par contre, que tout le monde s'y mette un peu. Parfois on a même rencontré, à Madagascar comme au Venezuela, des familles, des frères et sœurs, qui, à longueur de journée et parfois même la nuit, réalisaient des micro-tâches et, de cette manière-là, créaient leur propre mini-collectif de travail pour contrer la désocialisation qui aurait eu lieu si elles n’avaient pas mis en place ces structures informelles.
 
==33’ 04==
 
<b>Gérald Holubowicz : </b>C’est intéressant

Version du 9 décembre 2023 à 09:02


Titre : Les travailleurs invisibilisés de l’Intelligence Artificielle - Antonio Casilli

Intervenants : Antonio Casilli - Gérald Holubowicz

Lieu : En ligne - Podcast Imaginaires

Durée : 1 h 02 min 16

Date : 11 septembre 2023

Podcast

Présentation du podcast

Licence de la transcription : Verbatim

Illustration : À prévoir

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Transcription

Gérald Holubowicz : Bienvenue. Je suis Gérald Holubowicz et vous écoutez Imaginaires.
Un petit mot avant de commencer. Merci à vous, qui prenez le temps de cette écoute, à vous qui tentez l'expérience et donnez une chance à ce podcast.
Imaginaires part à la rencontre de chercheuses et de chercheurs, de journalistes et d'intellectuels qui observent l'effet de l'intelligence artificielle sur nos vies et son influence sur nos imaginaires.
Avant d'aller plus loin, je vous recommande de vous inscrire à Synth, la newsletter qui accompagne ce podcast, en vous rendant directement sur journalism.design, un site de ressources et de réflexions sur l'avenir de l'information et du journalisme.

Dans cet épisode, nous allons parler de travail et pas n'importe lequel, celui des petites mains du numérique, des petites mains qui aident chaque jour à collecter, trier, classer ou sélectionner les informations vitales pour les modèles d'intelligence artificielle qui nous accompagnent au quotidien. Arthur C. Clarke, l'auteur de 2001, l'Odyssée de l'espace, qui met en scène une des plus célèbres intelligences artificielles du cinéma américain, le fameux HAL 9000, écrivait que toute technologie suffisamment avancée ne peut être distinguée de la magie. Dans le cas des IA génératives, le tour de magie n'est pas là où on croit. Le truc des entreprises leaders en matière d'intelligence artificielle, c'est de faire disparaître de la conscience collective plusieurs millions de travailleurs.
Alors comprenez-moi bien. Quand je parle de disparition je ne fais pas allusion aux prévisions du cabinet McKinsey qui annonce que, d'ici à 2030, entre 400 et 800 millions d'emplois seraient amenés à disparaître ou très affectés par l'essor des IA génératives. Ces prévisions catastrophistes que la presse relaie depuis quelques mois et qui alimentent les peurs à propos des systèmes d'intelligence artificielle semblent être la conséquence inévitable de l'innovation. Or, si elles devaient se concrétiser, ces prophéties ne seraient le résultat que d'une chose : la volonté de certains entrepreneurs de profiter des gains de productivité offerts par les systèmes d'intelligence artificielle pour remplacer des emplois par des dispositifs automatisés plus rentables.
Il s'agit avant tout d'un choix économique, un choix de management, une décision opportune en somme, mais pas du tout une conséquence imposée par la nature même de la technologie.
L'idée que pour faire une bonne omelette numérique il faut casser des emplois a réussi à s'imposer dans l'imaginaire collectif, au point qu'aujourd'hui et l'invisibilité presque totalement la question des travailleurs précaires du numérique, ce qu'on connaît mieux sous le nom de travailleurs du clic.

Antonio Casilli est professeur de sociologie à Télécom Paris grande école composante de l'institut Polytechnique Paris. II a écrit un livre, en 2019, intitulé En attendant les robots. Enquête sur le travail du clic et, justement, son travail l'a récemment conduit, avec quelques-uns de ses étudiants, à Madagascar sur les traces des travailleurs de l'intelligence artificielle auxquels font appel certaines entreprises françaises.
Cette étude publiée sur The Conversation fait écho à l'enquête de Time Magazine, publiée un peu plus tôt, qui révèle qu’OpenAI, le créateur de ChatGPT, emploie des travailleurs kényans pour deux dollars par jour pour effectuer les tâches ingrates et difficiles dont personne ne veut en Occident. Ces travailleurs qu'on retrouve au Venezuela, au Brésil et parfois même en France, dont on peut bien se demander ce qui les distingue parfois de travailleurs plus classiques.

Antonio Casilli : Les premiers travailleurs du clic ce sont les usagers comme toi et moi. N'importe qui est un entraîneur de données, une personne qui participe, finalement, à une infrastructure technologique, qui a besoin de travail humain et de contribution humaine pour pouvoir fonctionner.
Les données ont besoin d'être annotées et améliorées, les algorithmes ont besoin d'être entraînés, donc, à la limite les premiers entraîneurs et les premiers qui mettent en doute ou remettent en question la structure métro-boulot-dodo ce sont les utilisateurs, comme toi et moi, qui se réveillent le matin, se servent de leur smartphone pour faire un tour sur les sites des médias sociaux, ou alors se servent de Siri ou Google tout de suite, qui, donc, sont déjà en train de produire de la data, de produire de la valeur, alors que, littéralement, ils viennent de sortir de la phase REM de leur sommeil. C'est une idée que d'autres ont déjà développée, moi-même dans le passé, l'idée qu’on ne vit plus dans le 3 X 8 mais dans le 8/8/8 finalement, dans une situation dans laquelle on est constamment en train de produire.
Après, la question, le débat et même, à la limite, je dirais la controverse qui m'a accompagnée tout au long de la deuxième partie des années 2010, dans ma carrière universitaire, était que, dans le contexte français, c'est vachement difficile de faire comprendre que la production, même bénévole, de données non encadrées par un contrat de travail constitue quand même du travail. Dans d'autres traditions politiques dans l’Europe du Sud et même aux États-Unis, c'est beaucoup plus simple de faire comprendre que la formalité du marché du travail est telle qu’on se passe souvent d'un contrat de travail et c'est exactement ce que ce qui se passe lorsque l’on va à la rencontre de ceux qui sont, par contre, reconnus comme les travailleurs du clic à proprement parler. Les travailleurs du clic à proprement parler ce sont des nouvelles professionnalités en tant que telles, il faut le reconnaître, mais qui, en même temps, sont constamment dévaluées et considérées comme des professionnalités à faible contribution en termes de valeur ajoutée, à faible spécialisation et à faibles compétences. Pourquoi ? Parce que ces travailleurs du clic sont des personnes qui sont recrutées, souvent de manière informelle, pour annoter des données, trier des données, retranscrire des extraits audio, regarder des vidéos pour laisser des tags ou pour identifier des objets dans ces vidéos et tout cela est nécessaire aujourd'hui pour entraîner les grands modèles linguistiques, mais aussi les grands modèles d’autre nature, par exemple des modèles qui produisent des images, des vidéos ou de la musique. On a besoin de travail humain pour entraîner ces modèles et pour faire davantage, parfois c'est même pour vérifier que l'intelligence artificielle fonctionne comme elle promet de fonctionner.
Ces personnes existent, sont encadrées d'un point de vue contractuel de manières très variées et souvent très floues. Certaines d'entre elles ont des contrats plus ou moins instables, ça peut être à la semaine, au mois ; d'autres ont des non-contrats, c'est-à-dire qu’elles sont plutôt recrutées comme des usagers lambda de plateformes, ça peut être une plateforme comme Amazon Mechanical Turk, ça peut être une plateforme un peu plus structurée comme une entreprise comme Apple qui est une énorme plateforme australienne. Ces personnes, grosso modo, n'ont qu'à s'inscrire sur ces plateformes, créer un profil et, après, ces plateformes agissent comme des marchés du travail, comme des marketplaces du travail.
Les travailleurs du clic peuvent donc chercher des tâches à réaliser, on les appelle des micro-tâches, qui durent très peu, normalement c'est quelques minutes, et qui sont très faiblement payées, normalement c'est quelques centimes, voire moins, selon les pays. Une première caractéristique, c’est le fait que c'est un retour du travail à la tâche, du travail à la pièce.
La deuxième question est que c'est un marché du travail à la pièce dans lequel la compétition est globale. Dans ce marché, les personnes qui travaillent depuis l’Europe ou le Nord du monde, le monde minoritaire comme on aime dire, sont en compétition avec le monde majoritaire, c'est-à-dire les pays dans lesquels se trouve la majorité de la population humaine et la majorité de la population mondiale se trouve dans des pays à moyens et faibles revenus. Dans ces pays, l'encadrement du travail est, disons, moins protecteur que chez nous, les salaires sont plus faibles et l'accès au marché du travail formel est beaucoup plus difficile pour tout un tas de catégories de personnes. Ces personnes sont déjà, le plus souvent, les plus marginalisées ou les plus fragilisées et se retrouvent à accepter de réaliser ce travail à la tâche qui est quand même un marché mondial qui implique plusieurs millions de personnes et, selon certaines estimations, dépasserait largement les 100 millions de personnes au niveau mondial.
Après, c'est clair que sur une population de huit milliards de personnes, ce n'est qu'une partie, voire une petite partie du marché mondial des effectifs du marché mondial du travail, mais c'est un phénomène qui semble être très répandu et que mon équipe de recherche et moi-même trouvons pratiquement dans plusieurs pays. On a déjà fait 19 enquêtes dans 19 pays différents et, dans tous ces pays, on re trouve des travailleurs du clic qui réalisent ce travail de préparation et de production de l'intelligence artificielle à force de produire à la main des données.

Gérald Holubowicz : Tu travailles sur cette population qui est, comme tu dis, relativement restreinte, mais qui recouvre quand même une réalité économique relativement importante. Au début on disait « nous faisons tous partie de ces travailleurs-là, d'une certaine manière ». Au niveau de la tech, au niveau des acteurs principaux de la tech, qu'est-ce que ça représente d'avoir cette masse de travailleurs pour ceux qui ont une activité, qui sont, on va dire, rémunérés ? Qu'est-ce que ça représente comme valeur ajoutée ? On a l'impression que la tech se développe sur des algorithmes, sur des choses un peu éthérées. Est-ce que tu peux nous décrire un peu ce paysage des grands acteurs tech qui utilisent cette manne de gens qui existent dehors.

Antonio Casilli : Je pourrais passer par un exemple qui est sous les yeux de tout le monde, qui est ChatGPT, parce que c'est effectivement le phénomène culturel des derniers mois. Dans ce cas-là, en effet, on a un double discours : un discours officiel et un discours de back-office.
Le discours officiel c’est celui des ingénieurs, celui qui parle aux investisseurs, qui parle au grand public, qui parle aux décideurs politiques et qui dit : « ChatGPT est basé sur une intelligence artificielle qui s'appelle GPT-3 et après 4, qui est basée sur des centaines de milliards de paramètres, qui est un truc énorme ». Des centaines de milliards de paramètres, lors de la dernière mise à jour de ChatGPT-4, même si OpenAI n'a pas communiqué exactement sur cela, les estimations disent qu’on a affaire à un modèle qui a un trillion de paramètres, le trillion est même une unité de grandeur qui n'existe pas en français, c'est un truc genre Oncle Picsou, c'est lui qui aurait pu parler d'un trillion de dollars, etc. C'est donc quelque chose de vraiment faramineux, mais ce n'est qu'une partie de l'histoire. Ce sont évidemment des modèles hypertrophiques, énormes, par contre, ces modèles hypertrophiques ont besoin d'être entraînés. Et le nom même GPT, donc l'acronyme, le « P » de GPT signifie Pre-trained, donc pré-entraîné. Pré-entraîné signifie que des personnes, des êtres humains, ont entraîné ces données et ces modèles d'intelligence artificielle pour, par exemple sélectionner les textes qui devaient être prises en compte, ou normaliser les textes, ou traduire les textes, ou les annoter pour dire que tel texte est une entrée de Wikipédia et parle de géologie, plutôt que ce texte est un commentaire de blog ou de Reddit et c’est un truc qui parle de sport.
Ces annotations sont faites à la main par des personnes qui sont micro-payées, sous-payés en général, à partir de masses de données énormes sur lesquelles, par contre, ChatGPT et OpenAI communiquent beaucoup moins. C'est donc grâce au fait que d'autres personnes ont étudié cela qu'on sait que ChatGPT est entraîné à partir de données qui ont été collectées sur Internet à partir de 2012. Donc avant la création même de OpenAI, ils avaient déjà commencé à collecter des térabytes de données via une plateforme qui s'appelle Common Crawl et, si l'on veut, ces données-là étaient des « données brutes » ; il faut mettre cela entre beaucoup de guillemets : les données brutes, en tant que telles, n'existent pas, les données sont toujours produites d'un certain point de vue, il n'y a pas de données à l'état pur, mais ces données ont besoin d'être retravaillées encore par des personnes qui sont recrutées pour faire ce travail de filtrage.
Comme ChatGPT et OpenAI ne communiquent pas sur l’existence même de ces personnes-là, ce sont d'abord des journalistes et, après, des chercheurs qui ont fait l'effort d'aller les chercher. Quelques mois après la mise en ligne de ChatGPT le magazine Times avait publié une enquête dans laquelle il dévoilait que plusieurs centaines de personnes se trouvaient au Kenya, à Nairobi, en train d’annoter des données de ChatGPT.

16’ 20

Gérald Holubowicz : Donc, toi, tu as fait un travail un peu équivalent avec tes étudiants, tu es aussi allé chercher un peu ces données-là qui étaient réellement derrière ce travail un peu invisibilisé on va dire ?

Antonio Casilli : C'est le travail qu'on fait systématiquement depuis 2018 en réalité, on le faisait bien avant ChatGPT et GPT en général, parce que c'est une question, c'est une problématique qui concerne les solutions d'intelligence artificielle.
Si tu considères, par exemple, les assistants vocaux qui se trouvent dans ton smartphone ou d'un ton ordi, ce sont des intelligences artificielles qui ont besoin d'énormément de contribution humaine. Nous avons commencé à travailler sur des applications du type agendas intelligents, des assistants vocaux ou des chatbots et après, évidemment, des caméras de surveillance intelligentes, des systèmes de reconnaissance faciale. On a donc tout un tas de technologies et, pour chacune de ces technologies, on va chercher les travailleurs qui sont dans le back-office. Ces travailleurs dans le back-office font tout un tas d'activités : parfois, ce sont des activités de pré-entraînement, ils se situent dans le passé et, parfois, ce sont des activités d’entraînement/vérification en temps réel, c'est-à-dire que, parfois, il faut s'assurer que l'application d'intelligence artificielle fonctionne comme elle promet de fonctionner, par exemple que l'assistant vocal interprète correctement ce que l'usager dit. Il faut donc des personnes qui, parfois à la main, parfois sur un échantillon et parfois sur toutes les conversations qu'on a avec un assistant vocal, s'occupent de vérifier que les transcriptions et l'interprétation faites par l'assistant vocal soient correctes. C'est donc une deuxième activité, ce n'est pas de l'entraînement, c'est de la vérification.
Après, parce qu'on a cité de la vérification en temps réel, parfois cette vérification en temps réel est tellement en temps réel que, pour être un peu provocateur, il n'y a pas d'intelligence artificielle à proprement parler, c'est-à-dire que, parfois, l'effet d'intelligence artificielle ou plutôt la performance d'intelligence artificielle est assurée par des personnes qui, en temps réel, font ce que le modèle d'intelligence artificielle est censé faire mais n'arrive pas à faire, parce que, parfois, il dysfonctionne et parfois il n'existe même pas ; parfois ce sont carrément des situations de fraude.

Gérald Holubowicz : Du coup, il y a vraiment toute une brique de ce système-là qui repose sur des travailleurs qui, en temps réel, ou pas, avant même l'utilisation du logiciel, commencent à former un travail pour pouvoir soit raffiner les données soit ajuster en direct ces données. De qui s'agit-il ? Est-ce que ce sont des Occidentaux, des gens venant d'autres pays ? Comment se répartit un peu cette masse de travailleurs-là qui agit dans l'ombre ?

Antonio Casilli : C'est une vaste question, je cherche à apporter quelques éléments un peu concrets.
Il y a, en réalité, trois équipes au monde qui font ce type de travail : nous à l'Institut Polytechnique de Paris, nos collègues d’Oxford et nos collègues de l’OIT, l'Organisation internationale du travail. Ces enquêtes-là, qui durent depuis plusieurs années, nous donnent une cartographie dans laquelle on a une très forte séparation, un très fort clivage entre le Nord et le Sud global.
C'est clair que des pays comme les États-Unis ou plusieurs pays européens sont encore des lieux dans lesquels un nombre important de micro-travailleurs ou travailleurs du clic sont recrutés. Notre propre estimation, qui remonte quand même à 2019, donc pré-Covid, faisait état, approximativement, de 260 000 personnes en France qui font occasionnellement ce type de travail du clic. Mais, comme il s'agit de personnes qui, pour des questions légales et pour des questions économiques, doivent être payées certes à la pièce et très faiblement, mais faiblement par rapport aux standards des pays du Nord, ce n'est pas toujours intéressant du point de vue de l'efficacité, par rapport aux coûts, pour les entreprises qui produisent de l'intelligence artificielle. Si tu dois recruter un million de personnes parce que d'ici sept jours tu as besoin d’annoter, que sais-je, quatre millions de vidéos, ce n'est pas une masse de travailleurs que tu peux recruter tranquillement dans les pays du Nord, c'est donc plutôt dans les pays du Sud qu'on va chercher. Ces pays sont Madagascar pour le contexte francophone, le Venezuela pour l’Amérique du Sud, les Philippines et l’Inde, plus récemment le Bangladesh et, après, d'autres pays. Nous, c'est-à-dire, encore une fois, mon équipe de recherche et moi, nous nous sommes spécialisés surtout sur l’Afrique et l’Amérique latine, d'autres se spécialisent plutôt sur l’Asie, mais c'est quand même un phénomène qui affiche une forte forme de dépendance politique et économique de ces pays et des marchés du travail dans ces pays vis-à-vis des entreprises du Nord : les entreprises qui produisent et qui vendent de l'intelligence artificielle sont dans les pays du Nord, plus récemment dans les pays dits émergents mais largement émergés comme la Chine, l'Inde et la Russie aussi. Dans ce contexte-là, ces formes de dépendance politique et économique ressemblent effectivement beaucoup à des formes néocoloniales.

Gérald Holubowicz : Ça veut donc dire, grosso modo, qu’on maintient ces pays sous influence pour pouvoir bénéficier d'une main-d'œuvre relativement bon marché, voire extrêmement très bas marché, pour pouvoir justifier un business modèle qui, autrement, ne pourraient pas survivre. C'est ça ?

Antonio Casilli : D'abord, il faut comprendre que ce n'est pas une nouveauté dans l'absolu parce que ces pays étaient déjà dans une forme de dépendance économique à cause des chaînes de sous-traitance d'autres secteurs, par exemple le secteur du textile, le secteur de l'énergie ou le secteur de l’agriculture plus traditionnellement. Plus récemment – quand je dis récemment c'est entre la fin du siècle passé et le début du 21e siècle –, on a commencé à voir apparaître, dans ces mêmes pays, des centres de spécialisation sur des services de traitement de l'information. Au début c'était plutôt les call centers, c'était le téléservice, c'étaient les SS2I. Après, progressivement, on s'est rendu compte qu'on n'avait pas besoin exclusivement de personnes qui répondent au téléphone, mais de personnes qui réalisent aussi des tâches non voix, non-voice tasks. Les tâches non vocales consistent, grosso modo, à annoter une data, regarder une vidéo, lire et résumer rapidement, en une phrase, un texte. Toutes ces tâches-là ont été, progressivement, de plus en plus fragmentées, simplifiées, standardisées pour les rendre effectivement disponibles à une population plus vaste et « moins spécialisée » ; quand je dis moins spécialisée, il faudrait mettre ça entre beaucoup de guillemets. En réalité, la spécialisation est là, elle n'est pas reconnue, mais c'est certain que ces tâches ont moins de barrières à l’entrée, demandent moins de temps d'apprentissage pour pouvoir être réalisées tout de suite ; normalement, il n'y a pas un entraînement important avant la réalisation de ces tâches.

Gérald Holubowicz : D’accord. On a eu, à travers certains articles de presse, des remontées, notamment de ce type de travaux. On parle notamment de curation, en fait de modération de contenus qui pourraient être éventuellement problématiques sur la santé de ces travailleurs-là. Est-ce que tu as un regard là-dessus ? Est-ce que c'est quelque chose que tu observes en particulier ? Est-ce que tu peux nous décrire un peu les problématiques que ces travailleurs-là rencontrent ?

Antonio Casilli : Les modérateurs c'est un cas particulier. Ils rentrent dans ce travail du clic même s’ils sont présentés comme des modérateurs de contenu. Eux aussi sont des entraîneurs de données : pour les plateformes même une vidéo ou une photo c’est de la data, même si c'est de la data sous forme de contenu produit par les utilisateurs mêmes de ces plateformes et ces contenus ont besoin d'être filtrés ou placés. Les modérateurs sont normalement des travailleurs du clic qui font ce travail de filtrage ou, plutôt, notamment sur des contenus problématiques, c'est-à-dire si on doit départager, par exemple, les contenus généralistes versus les contenus pour adultes, c'est un travail de modération par exemple de ce qu'on pourrait définir comme de contenus pornographiques. Ou alors, s'il s'agit de faire respecter certaines règles qui sont parfois de simples règles de civilité et parfois des lois de l'État dans lequel la plateforme se trouve, là il s'agirait, par exemple, de modérer un certain type de discours politique, de discours de haine et ainsi de suite. C'est donc un cas particulier, mais c'est encore de l’annotation de données, c'est encore de l'entraînement d'intelligence artificielle.
Ces personnes, qui modèrent surtout les contenus les plus problématiques, sont reconnues depuis longtemps et de plus en plus par des cours de justice, carrément, comme atteintes par des risques sociaux-professionnels spécifiques, qui relèvent effectivement du traumatisme ou du syndrome post-traumatique. L'esprit humain, surtout, en plus, si c'est structuré d'une manière systématique – c'est-à-dire, à longueur de journée, voir des images violentes –, oui, on peut bien imaginer qu’à certains moments cela déclenche un traumatisme et ceci est attesté.
Au-delà cela que je comprends, que je justifie, je trouve même très correct de faire reconnaître les droits des travailleurs du clic en passant effectivement par les risques sociaux-professionnels et les risques pour la santé, on retrouve d'autres risques un peu différents, un peu dans toute la population qu'on a étudiée. Je te donne un autre exemple parce que c'est tout récent. Avec des collègues d’un laboratoire de recherche au Brésil, qui s'appelle ??? [28 min 13], on a réalisé et on vient de publier un rapport sur le travail du clic au Brésil, dans lequel il y a toute une partie sur les risques psychosociaux associés à ce type de travail.
Encore une fois, certains modèrent, certains sont là pour entraîner des robots genre les Roomba, les aspirateurs robots qu’il faut entraîner aussi. D'autres personnes, au Brésil, font un travail carrément de fermes à clics, fermes à clics veut dire tout simplement qu’elles sont payées par exemple pour follower un profil sur Instagram ou pour regarder une vidéo sur YouTube.
Elles ne sont pas toutes exposées à des situations problématiques, pourtant toutes ont un problème ou des problèmes qui sont liés principalement à des formes d’atomisation de leur activité, de perte de sens de leur activité, et de désocialisation autour du travail. Historiquement, tel qu'il est conçu dans les sociétés modernes, le travail est une activité collective qui inscrit le travailleur et la travailleuse dans un collectif de travail, dans un collectif professionnel, ça peut être le bureau, ça peut être un lieu, ça peut être une communauté professionnelle, mais ces personnes-là ne voient pas la communauté professionnelle.
Après, il faut mettre des bémols parce qu’on ne trouve pas la même situation qu'au Brésil partout dans le monde. Par exemple dans notre enquête sur la France oui, on remarque que les mêmes risques sociaux-professionnels et psychosociaux sont présents chez les travailleuses et travailleurs français, parce que, eux et elles aussi, avaient, par exemple, des problèmes d’isolement et ça, encore une fois, même avant le Covid. Le fait de se dire « je suis en train de travailler pour une entreprise dont je ne rencontre jamais les représentants, de laquelle je ne reçois pas, à proprement parler, ma fiche de paye parce que je ne suis pas payé comme un salarié, mais je suis payé comme une personne qui est un usager d'une plateforme dans laquelle il y a une cagnotte et je cumule des points, ces points peuvent être transformés en argent », tout cela implique, effectivement, des effets de désocialisation qui, au fil des mois et des années, ont effectivement un impact important et très grave sur ces populations.
Après, il y a des différences. Je peux te donner deux pays dans lesquels la situation est largement différente : le Venezuela, par exemple, dans lequel les travailleurs du clic travaillent depuis chez eux et chez elles, mais, souvent, travaillent en communauté qui peut être leur communauté familiale. On a souvent rencontré des personnes où tout le monde, au sein du foyer, s'alternait pour réaliser les mêmes tâches : quand l'enfant était à l'école, c'était la maman, après c'était l'enfant et, le soir, peut-être même la grand-mère ou le grand-père. C'est une situation complètement différente.
On a rencontré une situation encore complètement différente, parce que très variée, par exemple à Madagascar : quand j'étais à Tananarive, j'ai rencontré des personnes qui travaillaient dans des véritables bureaux, dans des openspaces, chacune avec son poste ; des personnes qui travaillaient dans des entreprises informelles, plus ou moins cachées dans une maison complètement banale mais, dans chaque pièce de cette maison, dans le grenier, dans le garage, tu avais 20/30 personnes en train de cliquer et de se faire payer pour cliquer et parfois, il y avait des personnes qui travaillaient dans des cybercafés, il y avait des personnes qui travaillaient chez elles. Après, il y a aussi des questions de connectivité, d'électricité. Autant au Venezuela qu’à Madagascar le courant électrique ne passe pas toujours, ça peut donc introduire des fragmentations et des ruptures de continuité dans ces processus de travail qui ont besoin, par contre, que tout le monde s'y mette un peu. Parfois on a même rencontré, à Madagascar comme au Venezuela, des familles, des frères et sœurs, qui, à longueur de journée et parfois même la nuit, réalisaient des micro-tâches et, de cette manière-là, créaient leur propre mini-collectif de travail pour contrer la désocialisation qui aurait eu lieu si elles n’avaient pas mis en place ces structures informelles.

33’ 04

Gérald Holubowicz : C’est intéressant