Différences entre les versions de « Open Data : les données au secours de la démocratie »

De April MediaWiki
Aller à la navigationAller à la recherche
Ligne 242 : Ligne 242 :
 
==Le Patch Tech de Fabienne Billat 34’32==
 
==Le Patch Tech de Fabienne Billat 34’32==
  
<b>Cyrille Chaudoit : </b>Le 14 février 2024
+
 
 +
<b>Cyrille Chaudoit : </b>Le 14 février 2024, c’était la Saint-Valentin, comme chaque année, mais c’était aussi OpenAI qui donnait naissance à une révolution dans le domaine de la création vidéo avec le lancement de Sora. Aller Fabienne, dis-nous tout.
 +
 
 +
<b>Fabienne Billat : </b>Oui, tout à fait. Déjà, Sora c’est un nom japonais qui a été choisi et qui évoque le ciel ou le paradis, car il ouvre la voie à des possibilités inédites dans la production de vidéos. Cette production, limitée pour le moment à 60 secondes, est initiée par des <em>prompts</em>, c’est-à-dire une instruction écrite. Voilà un bond technologique, comparable à celui que nous avons connu avec la génération d’images il y a plus d’un an et tu t’en souviens.<br/>
 +
Sora utilise une architecture de transformateur et se distingue par sa capacité à créer des scènes riches et réalistes avec plusieurs personnages, des mouvements complexes de caméra et une multitude de détails précis, tout cela dans une grande cohérence. Néanmoins, tu as pu observer, vous avez pu observer que le modèle présente des faiblesses au niveau des doigts, des bras ou des jambes, et peut ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut croquer dans un biscuit, mais le biscuit reste entier !
 +
 
 +
<b>Cyrille Chaudoit : </b>OK. Encore plus de créativité au bout des doigts ou du biscuit, mais est-ce que ça va vraiment plaire à tout le monde ?
 +
 
 +
<b>Fabienne Billat : </b>On peut déjà imaginer à quel point cela bouleversera les processus créatifs et de conception vidéo traditionnels, mais également raviver les inquiétudes des syndicats d’acteurs américains, déjà en grève en novembre 2023. Selon les prévisions de Forrester, d’ici à 2030, 90 % des blockbusters américains seront produits à l’aide de l’IA générative. Hormis la production cinématographique, artistique, culturelle, publicitaire, ces vidéos immersives offriront la possibilité de produire rapidement du contenu, que ce soit, par exemple, dans la formation, l’éducation, le marketing, etc.
 +
 
 +
<b>Cyrille Chaudoit : </b>Je donne quand même rendez-vous en 2030 à Forrester qui cherche, avant tout, à vendre des études. Mais question sécurité, authenticité, copyright, qu’en est-il ?
 +
 
 +
<b>Fabienne Billat : </b>Justement OpenAI a donc mis en place une <em>Red Team</em> de personnalités triées sur le volet, des réalisateurs, des artistes experts dans le domaine de l’IA, afin d’y déceler des dangers ou des risques en matière de <em>deepfakes</em>, d’usurpation d’identité.<br/>
 +
Autre promesse, celle de garantir la fiabilité des contenus générés, en envisageant l’intégration de métadonnées, des filigranes appelés <em>watermarks</em> pour faciliter leurs vérifications. À ce sujet, la CNIL italienne, le GPDP [<em>Garante per la protezione dei dati personali</em>] a ouvert une enquête, début mars, sur différentes modalités comme les données, l’entraînement des algorithmes, et donne un délai de 20 jours à OpenAI pour y répondre.<br/>
 +
Pour autant, la concurrence reste vive et Google, Meta et d’autres sont lancés dans la course. Mais, ce qui pourrait faire toute la différence pour Sora, c’est la combinaison d’un bon timing et d’importantes capacités d’investissement.<br/>
 +
À l’instar de ma conviction sur les contenus informationnels, le photojournaliste Niels Ackermann soulève une réflexion stimulante : selon lui, plus il est facile de produire du faux, plus le vrai aura de la valeur.<br/>
 +
Avec cette profusion d’images créées depuis un an, lisses, égales, pouvons-nous anticiper une revalorisation du vrai où les œuvres réelles, vécues, parfois moins parfaites offriraient une alternative à l’abondance de ces contenus si synthétiques.
 +
 
 +
<b>Voix off : </b><em>Trench Tech</em>. Esprits Critiques pour Tech Éthique.
 +
 
 +
==Données libres pour société plus éclairée 37’ 55==
 +
 
 +
<b>Cyrille Chaudoit : </b>En voilà des grandes questions, Fabienne !<br/>

Version du 4 mai 2024 à 16:17


Titre : Les coulisses de Cause Commune

Intervenant·e·s : Laure Luchesi - Virginie Matins de Nobrega - Fabienne Billat - Cyrille Chaudoit - Mick Levy - Thibaut le Masne

Lieu : Trench Tech

Date : 17 avril 2024

Durée : 1 h 04 min 46

Podcast

Présentation du podcast

Licence de la transcription : Verbatim

Illustration : À prévoir

NB : Transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.


Description

Et si l’Open Data nous permettait de réinventer le pouvoir politique face aux géants de la tech ?

Transcription

Diverses voix off : Punaise, j’ai trop hâte de ce nouvel épisode.
Encore une bière. C’est open bar !
Thibaut, tu bois encore une bière ? C’est open bar. On y va.
Les gars, aujourd’hui c’est open data et ça, c’est vraiment d’utilité publique.
open data d’accord, open data.

Diverses voix off, série Silicon Valley : On pourrait construire une version absolument décentralisée de notre Internet actuel. Ça veut dire pas de firewalls, ni de restrictions, ni de mainmise par des gouvernements. Aucune limite, que de l’information, totalement libre et gratuite dans tous les sens du terme.
Tu veux construire un nouvel Internet ?

Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.

Cyrille Chaudoit : Hello. Cyrille Chaudoit au micro. Oui, vous êtes bien dans Trench Techavec bien sûr, à mes côtés, Thibaut le Masne.

Thibaut le Masne : Hello ! Hello !

Cyrille Chaudoit : Et Mick Levy.

Mick Levy : Yo ! Yo !

Cyrille Chaudoit : D’abord un petit mot pour toi qui nous écoutes. Merci. Vous êtes de plus en plus nombreuses et nombreux à nous écouter, alors continue, toi, toi et toi aussi, de partager nos épisodes pour partager l’esprit critique pour une tech éthique.
Messieurs, qui a reconnu l’extrait qu’on vient d’entendre ?

Thibaut le Masne : La série Silicon Valley.

Cyrille Chaudoit : Bravo Thibaut ! Et pourquoi cet extrait, à votre avis ?

Mick Levy : Parce que notre invitée y a débuté sa carrière, peut-être.

Cyrille Chaudoit : Exact, du coup ça tombe à pic, pas vrai Mick ? Oui je sais !, parce que dans cet épisode on va se demander quelle place pourrait jouer l'open data dans la construction d’un numérique au service de l’émancipation citoyenne et cela en contrepoint, ou pas, de la mainmise des Big Tech sur toutes nos données.
Laure Lucchesi a donc d’abord été envoyé dans la Silicon Valley pour le compte de l’ambassade de France aux USA, avant de mener des projets d’innovation dans les télécoms, les médias et la banque en Afrique et en Inde puis de devenir directrice d’Etalab, pendant sept ans, de 2016 à 2023. Rappelons qu’Etalab est le département du Premier ministre chargé de l’innovation et de la transformation numérique du service et de l’action publique et grâce aux données. Puisque Laure aide désormais les entreprises à accélérer leur transformation data et IA, on peut dire que c’est l’invitée idéale, car elle maîtrise les deux facettes, publique et privée.
C’est vrai après tout l’esprit critique, c’est, d’un côté, questionner cette manie que les géants de la tech ont de privatiser la mise en données de toute chose en ce bas monde, mais aussi de se demander en quoi les données publiques sont un bien commun comme un autre, qu’il faudrait mettre à la disposition de tous, y compris, d’ailleurs, d’acteurs privés, y compris les géants de la tech. Vous me suivez ? Ça va ?

Mick Levy : On va quand même approfondir tout ça !

Cyrille Chaudoit : Bref ! Nous commencerons donc par revenir sur le parcours de Laure pour voir quels liens elle fait entre les stratégies observées dans la Silicon Valley et celles poursuivies par l’État français en matière de données ouvertes. Ensuite, nous tenterons un état des lieux du numérique public, pour enfin nous demander en quoi mettre à disposition la data redonne du pouvoir à la société civile. Mais ce n’est pas tout, deux chroniques que vous adorez viendront compléter le décor : « Débats en Technocratie » de Virginie Matins de Nobrega et le fameux « Patch Tech » de Fabienne Billat.

Mick Levy : Ça fait longtemps qu’on ne l’a pas entendue.

Cyrille Chaudoit : Grand retour, exactement, c’est pour cela qu’on se rejouit. Et dans maintenant moins d’une heure, chers amis, nous débrieferons juste entre vous et nous, cher public, des idées clés partagées avec Laure dans cet épisode. Restez donc jusqu’au bout. Vous êtes prêts ?

Mick Levy : Je suis méga prêt, carrément.

Cyrille Chaudoit : Alors, sans plus tarder, accueillons la dompteuse de données publiques, comme l’a nommée le JDD. Bonjour Laure.

Laure Lucchesi : Bonjour !

Mick Levy : Salut Laure.

Thibaut le Masne : Bonjour Laure.

Cyrille Chaudoit : Laure, nous sommes ravis de t’accueillir. On se tutoie ?

Laure Lucchesi : Avec plaisir.

Cyrille Chaudoit : Alors c’est parti pour notre grand entretien, vous êtes bien dans Trench Tech et ça commence maintenant.

Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.

De la Silicon Valley à l’innovation publique 3’56

Mick Levy : Laure, on l’a dit, tu as expérimenté la culture de l’innovation de la Silicon Salley puis, de retour en France, tu cherches finalement à appliquer ses stratégies innovantes au service public de la France. Laure, finalement, comment la Silicon Valley a-t-elle influencé ta vision de l’innovation ? Grande question.

Laure Lucchesi : Ça a été vraiment marquant pour moi. En fait, je suis sortie d’école en 2001, juste après le 11 septembre, la crise, et j’ai eu l’occasion de travailler pour le département économique de l’ambassade de France en Californie, à San Francisco, où je couvrais le secteur des médias et de l'entertainment comme on dit aux États-unis. C’était juste après l’éclatement de la bulle internet aussi, c’était donc vraiment une phase de transition. J’ai pu prendre la mesure de l’ampleur avec laquelle la technologie disruptait, percutait de plein fouet tout un secteur et toute une industrie, puisque c’était à la fois le moment où il y avait la numérisation des réseaux, on commençait à voir la distribution des contenus sur le câble numérique ou les réseaux satellites, l’arrivée de nouveaux acteurs. À l’époque, un acteur envoyait des DVD par la poste, qui s’appelait Netflix.

Mick Levy : Laurent Guérin nous a fait une jolie chronique, « Un moment d’égarement », il n’y a pas si longtemps avec le fail, qui s’en est suivi sur cette activité. Intéressant que tu le rappelles.

Laure Lucchesi : C’était très compliqué. J’avais rencontré Reed Hastings et on savait déjà que sa vision c’était de devenir une tech company et de faire de la vidéo à la demande sur Internet. C’était aussi les User Generated Contents qui changeaient aussi complètement la façon dont les contenus étaient produits et distribués, percutaient le modèle des studios. Bref, je me suis rendu compte que la technologie disruptait complètement l’économie, la société et les rapports de pouvoir. Ça m’a évidemment profondément marquée. Après deux ans, je suis rentrée en France et là j’ai eu l’occasion de travailler sur des grands projets de transformation dans les médias, dans les télécoms, dans les services financiers aussi, à la fois en France et un peu partout dans le monde. Après avoir eu toute cette expérience, j’ai eu l’occasion de mettre ce savoir-faire et ces compétences au service de la transformation de l’action publique, de l’action de l’État, en entrant par ce qui était ce petit sujet de l'open data.

Mick Levy : Finalement la Silicon Valley, tu l’as dit, cherchait à disrupter tout un tas d’industries, je mets « industries » entre guillemets, et parmi toutes les industries que cherchait à disrupter la Silicon Valley, il y a aussi le service public, l’action publique, il y a plein de fois où ils sont venus un peu en percussion avec la façon dont se faisait l’action publique. Toi, finalement, qu’est-ce que tu as souhaité prendre ? Quelles sont les leçons, finalement, que tu as apprises et que tu as voulu ensuite appliquer pour l’action publique en particulier chez Etalab ?

Laure Lucchesi : Ce sont vraiment beaucoup de choses. Ce qui était fascinant, c’est, évidemment, cette capacité à agir vite, à tester, à itérer, à partir petit et à développer plus largement des services, donc, à la base, ce sont des méthodes agiles qu’on a ensuite appliquées dans l’administration, c’est un premier sujet. Il y avait aussi, qui est né aux États-Unis entre le début des années 2000 et 2010, cette théorie d’agir comme une plateforme et ça a été vraiment fondateur et c’est ce qu’on a amené en entrant par le sujet de l'open data : se dire que les stratégies gagnantes, à l’heure d’Internet, ce sont celles des plateformes qui ont plus de valeur qu’une application puisqu’elles attirent dans un écosystème, dans un environnement qu’elles maîtrisent, la capacité de contribution, la création de valeur selon des règles qu’elles définissent.
Le parallèle a été fait aussi avec ce que peut être l’action publique, l’action d’un gouvernement, qui, lui-même, peut agir comme une plateforme et amener à lui de la contribution, de la capacité d’innovation.

Thibaut le Masne : Je ne peux pas m’empêcher de te poser quand même cette question : quand on parle d’agilité et de scalabilité on va dire des start-ups ou des Big Tech et de l’agilité, de la souplesse d’un État, je ne peux pas m’empêcher de dire que ce n’est pas tout à fait la même chose !

Laure Lucchesi : Bien sûr. Évidemment que l’administration est tenue par des règles, par des obligations aussi qui lui sont propres : la continuité du service public, l’égalité devant le service public, typiquement, elle ne peut pas choisir ses clients comme pourrait le faire, justement, une start-up ou une entreprise. Mais elle est aussi tenue par un troisième principe du service public qui est celui de l’adaptation et de la mutabilité. Elle, doit donc à la fois fournir et produire le service public correspondant, d’un côté, aux attentes de la société, mais aussi au progrès technique. Ça a été vrai pour un certain nombre de révolutions par le passé, et c’est vrai aussi pour l’adaptation de la technologie.
En fait, l’administration a aussi le devoir de mettre à jour son propre logiciel et de saisir les opportunités du numérique pour agir différemment.

Mick Levy : Justement, Laure, j’ai une petite question là-dessus : tu as évoqué la notion de plateforme. Déjà, la notion de plateforme, pour les Big Tech, n’est pas toujours bien comprise, il y a beaucoup d’éléments. Finalement ce sont des services, c’est le fait de fournir des services racines, qui sont racines de plein d’autres services, c’est le fait d’une espèce de coopétition avec beaucoup d’acteurs, c’est le fait de donner des services élémentaires qui peuvent être réutilisés d’une autre manière. Est-ce que tu peux le définir et puis surtout comment on le transcrit dans la notion de l’État plateforme, sur laquelle tu arrives derrière ?

Laure Lucchesi : Justement, tu parles de services, mais, finalement, c’est presque l’inverse, c’est-à-dire que souvent les grandes plateformes, Facebook, Amazon, ont commencé par un service et, petit à petit, elles s’en sont écartées pour fournir une infrastructure, des règles, notamment des modèles économiques, pour attirer l’innovation à l’intérieur d’un écosystème et d’un environnement qui étaient à leurs mains et qu’elles contrôlaient. C’est ça qui fait la différence. Si on transpose ça à ce que ferait un État, et ça a été théorisé en 2010 par Tim O'Reilly dans Government as a Platform, c’est vraiment cette notion de fournir une infrastructure et des règles dans le monde numérique, sur laquelle des services, y compris des services créés par des tiers, qui ne sont pas l’administration, peuvent venir s’installer. Si on fait le parallèle, c’est comme si, à l’échelle d’une ville, on organisait l’infrastructure, on fournissait la route, on définissait les règles du code de la route et, par-dessus ça, vient se créer une infrastructure économique, des bâtiments.
La notion d’état plateforme c’est celle-ci et ça veut dire qu’on considère que toutes les ressources numériques, les données, les API, le code, qui peuvent être, qui sont déjà produites par les systèmes d’information de l’État, tout ce qui peut être ouvert et rendu réutilisable, donc utilisable par d’autres, doit l’être ; ça doit être ouvert et partagé, parce que ça devient capacitaire, ça démultiplie la valeur et même, du coup, ça donne des nouvelles vies à des données qui sont déjà financées par l’impôt et produites par l’administration, sous réserve, bien sûr, des données qui sont confidentielles ou protégées par des secrets, on n’en parle pas, mais il y en a beaucoup qui ne sont absolument pas couvertes par toutes ces restrictions-là et qui créent donc de la capacité dans d’autres administrations mais aussi à l’extérieur de l’administration.

Cyrille Chaudoit : Juste pour qu’on résume, parce ça me semble hyper fondateur pour ceux qui nous écoutent. Objectivement, l'open data ça me parlait, évidemment, mais je pense que je ne connaissais pas un dixième de ce que ça couvre exactement. Donc, là, on touche un point hyper important.
On a reçu, il y a quelques émissions de cela, Henri Verdier qui nous parlait, justement, de l’État plateforme, tu t’en doutes, qui nous expliquait très bien que quand on est chez Facebook on n’est plus sur le Web, on est véritablement chez Facebook avec ses frontières, avec ses lois, etc. Ce que l’on comprend déjà là, en creux, c’est que l'open data, le fait de mettre à disposition les données publiques, c’est finalement un gage de partage et de liberté dans un sens. Maintenant que tu nous as posé la définition, en tout cas la philosophie de l'open data, j’aimerais bien que tu reviennes peut-être deux secondes sur le but, l’enjeu à la fin de tout cela et aussi comment ça marche un petit peu.

Laure Lucchesi : Absolument. On peut le prendre sous plusieurs angles et c’est ça qui est intéressant.
L’open data, encore une fois, et là on parle dans l’univers du service public et des données de l’administration, mais ça s’applique à n’importe quel type d’organisation, c’est une stratégie, ce n’est pas une obligation réglementaire ou légale en France.

Cyrille Chaudoit : Une boîte privée peut mettre à disposition sa data ?, c’est ce que tu veux dire.

Laure Lucchesi : Oui. On voit plein d’acteurs privés qui ouvrent, qui partagent leurs données, celles qu’ils choisissent, qui les rendent justement disponibles à d’autres, là encore pourra attirer un écosystème d’innovations qui vient compléter, augmenter, les services que cette organisation-là propose. C’est un premier angle de l'open data, c’est de dire : en partageant mes données, je vais pouvoir prolonger, amplifier, créer d’autres services qui vont venir compléter ce que je suis en train de faire dans ma stratégie d’écosystème.

Cyrille Chaudoit : Oui. D’autres vont jouer jeu, vont innover, donc, quelque part, j’en retire quelque chose moi aussi.

Laure Lucchesi : Exactement. C’est ce qu’on voit par exemple sous forme de store dans certaines applications. C’est donc un premier angle, c’est celui qui crée de l’innovation et qui crée aussi de la valeur économique dont l’acteur qui met à disposition ses données récupère une partie. C’est un premier angle.
Il y a un autre angle qui est plutôt celui de la transparence ou de rendre compte. On rend disponibles sous forme de données, et ça change quand même un peu la donne, un certain nombre d’informations sur son activité. Là aussi, ça peut être fait par des entreprises qui publient un certain nombre de données sur leur activité et c’est fait aussi par l’État. C’est donc une façon de rendre compte et de donner à voir ce que fait l’administration et le service public. Par exemple, les données qui sont publiées sur les résultats des élections, sur la propagation de l’épidémie qu’on a connue avec le Covid, sur la vaccination. Ce sont aussi toutes les statistiques publiques qui sont un reflet de ce que fait l’État. Il y a donc un autre axe, qui est celui de la transparence, mais cette fois sous forme de ressources numériques ; c’est le fait que ce soient des données et pas seulement comme si on avait accès à un document administratif sur papier. C’est là que l’ère de la donnée change la donne : on peut croiser ces données, les analyser, en faire autre chose, donc ça donne un contre-pouvoir démocratique qui permet, notamment aussi à des journalistes, à des médias, de les vérifier et de réinterroger ce que fait l’État.

Cyrille Chaudoit : Un État qui communiquerait sur son bilan ou sur des chiffres, mais avec un rapport tout fait, on peut le lire. Par contre, filer de la donnée brute, on peut en faire autre chose et vérifier qu’on ne nous raconte pas des carabistouilles.

Laure Lucchesi : Exactement.

Mick Levy : Justement. La France a été parmi les pays pionniers de l'open data et sur le podium des pays les plus avancés en termes de data depuis des années et des années. D’ailleurs cette année, depuis quelques semaines, nous sommes à nouveau le premier pays de l'open data. Pourquoi la France s’est-elle lancée dans une telle course ? Quels en sont les enjeux, les avantages ?

Thibaut le Masne : Sommes-nous nombreux dans la course ?

Laure Lucchesi : Nous sommes assez nombreux dans la course. Beaucoup de pays sont évalués dans ces classements. Ces classements internationaux donnent une image et un reflet. Quand la méthodologie ne change pas, ça peut quand même arriver, ça permet aussi, d’année en année, de voir justement des évolutions, des fermetures parce que tout cela n’est pas immuable, il y a quand même un vrai sujet aussi.
On a effectivement un certain nombre de classements internationaux qui regardent comment les données publiques sont ouvertes par les administrations, donc, à la fois, quels sont les types de données qui sont mises à disposition, qui sont rendues accessibles, sous quelle forme, si ces données-là sont bien documentées, sont bien réutilisables, si elles sont sur un portail ou une plateforme avec une bonne expérience utilisateur, qui a un certain nombre de caractéristiques. Il y a beaucoup de classements qui sont très complets.
La France ne fait pas forcément la course à la pole position même si c’est toujours agréable !

Cyrille Chaudoit : On aime bien être les premiers de temps en temps.

Laure Lucchesi : Exactement. Encore une fois, quand on régresse, on peut aussi se demander pourquoi, ça dit aussi quelque chose de l’état de la démocratie.

Mick Levy : En même temps, une commission sur l’IA a été commandée par le gouvernement. Elle a remis son rapport il y a quelques jours, rappelons que nous sommes mi-mars 2024, qui dit qu’on ne fait pas assez d’efforts et qu’il faut encore accélérer sur ce sujet de l'open data. J’ai trouvé ça assez étonnant puisque nous sommes déjà les premiers.

Cyrille Chaudoit : Maintenant il faut le rester ! C’est ça le truc !

Laure Lucchesi : Il y a toujours plus à faire. Il y a quand même beaucoup de données qu’on considère comme des registres ou des données essentielles qui sont déjà disponibles, c’est à ce titre-là que la France est plutôt bien classée, mais il y a encore d’énormes bases de données, de gisements possibles qui ne sont pas encore ouverts ou qui ne le sont pas justement avec des qualités suffisantes de mise à disposition. Le travail est donc immense et, à fortiori aussi à l’heure de l’IA où il y a des choses nouvelles qui peuvent effectivement s’imaginer.

Mick Levy : Tu nous sers une transition sur un plateau, puisque nous allons retrouver Virginie Matins de Nobrega pour Débats en Technocratie.

Débats en Technocratie – « En ligne comme Hors ligne » 18’50

Mick Levy : Alors, Virginie, le vol des données de santé, les violences en ligne, les deepfakes, l’actualité n’en finit plus de montrer des violations de nos droits. Mais finalement y a-t-il vraiment des droits en ligne ?

Virginie Matins de Nobrega : C’est sûr que présenté comme ça, on peut en douter. L’univers en ligne peut ressembler au Far-West, notamment s’agissant des droits de l’homme, mais je te rassure, oui, les droits existent. Ce qui peut être plus difficile, en revanche, c’est leur mise en œuvre, les sanctions en cas de violation ou d’abus.
Tu as deux niveaux : au niveau national, il y a les infractions pénales, il y a le droit de la propriété intellectuelle que tous les spécialistes de l’APPI [19 min 22] du numérique connaissent bien et, au niveau du droit international et réglementaire, tu as le principe qui a été clairement et constamment répété par le Conseil des droits de l’homme des Nations Unies depuis 2012 : les droits hors-ligne s’appliquent également en ligne ou pour le citer in extenso : « Les droits dont les personnes jouissent hors ligne doivent également être protégés en ligne ». Ça vaut pour le respect de la dignité, la liberté d’expression, le droit à la vie privée, la protection des données, l’interdiction de l’incitation à la haine, la non-discrimination, l’égalité, etc. Les droits hors-ligne s’appliquent également en ligne.

Mick Levy : C’est une bonne nouvelle : donc, quand on est sur Internet, on n’est pas dans un autre monde et le droit existe encore. Mais est-ce qu’on va arriver à faire aussi ça avec les IA, parce que j’ai l’impression que tout est en train de partir à vau-l’eau sur le sujet ?

Virginie Matins de Nobrega : Là encore, je pense qu’il faut faire une distinction très claire entre l’existence des droits, leur mise en œuvre et la sanction en cas de non-respect ou de violation de ces droits. Au niveau international et régional, il y a pas de doute depuis 2007 : le développement et le déploiement de l’IA et de toutes les technologies ne peut pas se faire en violation et au mépris des droits de l’homme. Par exemple, c’est le cas des biais et discriminations algorithmiques qui ont été détectées, qui sont suivies et clairement été considérés comme une violation des droits de l’homme ; c’est également le traçage avec les malwares ou l’utilisation de la reconnaissance faciale lors de manifestations, de démonstrations sur la voie publique qui ont clairement été identifiés comme non respectueux des droits de l’homme, sauf exception de sécurité d’ordre public.
En France, par exemple, tu ne peux pas avoir de reconnaissance faciale sur la voie publique de manière généralisée, sauf pendant les JO suite à une exception qui a été validée pour des caméras intelligentes pendant une période déterminée.

Mick Levy : OK. Là c’est en France, mais comment ça se passe ailleurs dans le monde ?

Virginie Matins de Nobrega : Ce n’est pas forcément le cas partout. En Europe centrale, en Asie centrale mais aussi dans le sud Caucase, ce sont des pratiques qui sont déjà normalisées, même si les citoyens ne savent pas toujours. C’est pourquoi on a toujours des discussions et des débats au niveau multipartite, au niveau institutionnel, qui continuent, sur ce sujet, non pas sur le principe de l’existence de ces droits, mais comment les protéger effectivement, qui doit les contrôler en sus de certaines autorités nationales de régulation sur des sujets particuliers, notamment la CNIL en France pour les données. Est-ce que ça doit être un système d’autorégulation, est-ce qu’on doit avoir une autorité indépendante nationale et européennes ? Ce sont toutes ces questions qui, véritablement, agitent aujourd’hui la sphère internationale : on a des droits, mais comment mieux les protéger et comment faire en sorte qu’ils soient effectifs ?

Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.

Le numérique sauvera-t-il le service public ? 21‘40

Cyrille Chaudoit : On le voit, encore beaucoup de questions. Merci Virginie.
Vingt ans les gars, 20 ans j’accompagne les entreprises dans leur adaptation à la transformation digitale de notre société.

Mick Levy : Ça ne nous rajeunit pas tout ça !

Cyrille Chaudoit : Sensibilisation, vision stratégique puis déploiement ; en gros, c’est le schéma classique et, en 20 ans, chacun sait qu’on a pourtant perdu quelques acteurs, récalcitrants pour certains, retardataires pour d’autres. On comprend que, face à la digitalisation, l’État ne peut prétendre être un acteur à part, mais son bras armé, l’administration française, n’est pas franchement connu pour son agilité, on l’a un peu évoqué.
Au fond, Laure, le service public numérique est-il la promesse d’un avenir meilleur ou un mal nécessaire pour ne pas laisser notre administration s’enliser encore plus dans une lourdeur d’un autre âge ?

Laure Lucchesi : C’est ce que je disais tout à l’heure. Il est évidemment critique que le logiciel de délivrance du service public, de sa production, soit mis à jour, à fortiori quand on voit les attentes qu’ont maintenant les usagers qui sont habitués à de l’expérience utilisateur de qualité, à de l’interaction, justement, et de la réactivité. Le service public ne pas être à la traîne en la matière. On n’a pas attendu. Ces dernières années et depuis toujours, on a une volonté de passer vers de l’administration électronique, du e-government, et ce qu’on a appelé aussi de la transformation digitale.
Ça passe donc par plein de choses différentes. Ça passe par, à la fois, fournir avec, encore une fois, une qualité de service, des services en ligne qui soient vraiment de qualité et qui soit accessibles à tous, ce que je disais. Ce qui fait aussi la différence avec le secteur privé, c’est qu’on ne peut pas choisir ses clients, choisir d’opérer juste un segment de marché qui est favorable. On doit vraiment ne pas avoir de fracture et de rupture d’égalité devant l’accès aux services.

Cyrille Chaudoit : Pourtant, justement sur ce point-là, il y a quand même pas mal de personnes qui sont aussi un peu décontenancés par le tout digital et qui ont du mal à aller vers ces démarches en ligne. Comment cela est-il traité ?

Laure Lucchesi : Absolument. C’est un énorme sujet. On estime, aujourd’hui, que 13 millions de personnes sont éloignées du numérique soit pour des questions d’équipement et de connectivité, mais aussi de familiarité avec les usages numériques. Beaucoup d’actions sont mises en place, notamment au travers des maisons France services, justement pour inclure ces personnes-là, parce que, aujourd’hui, le canal numérique est l’un des premiers canaux d’accès aux services publics, mais ça peut pas être le seul.
On doit donc aussi compléter et avoir des capacités d’accéder aux services publics par d’autres moyens. Il y a effectivement ce gros sujet de l’inclusion numérique, pour lequel d’ailleurs, petite parenthèse – ce n’est pas forcément intuitif –, l’intelligence artificielle peut aussi être une opportunité justement pour inclure plus un certain nombre de personnes dans l’accès aux services publics.

Cyrille Chaudoit : Parce que c’est en langage naturel ? C’est ça ?

Laure Lucchesi : Exactement, le langage naturel, par exemple. On peut citer plusieurs choses. D’abord, effectivement, le langage naturel : on peut traduire en langue française, facile à lire et à comprendre, le langage qui peut, parfois, être un peu jargonnant ou ésotérique.

Thibaut le Masne : Le langage de l’administration française ? C’est ce que tu veux dire ?

Cyrille Chaudoit : Ça peut parfois être aussi pour des personnes qui ne parlent pas français, qu’elles puissent quand même accéder à ces services, notamment à France Travail.

Laure Lucchesi : Absolument. Le sujet de la langue est super important. Ça peut aussi amener des gains de productivité pour les agents qui sont bien des humains, mais qui, en fait, arrivent à mieux préparer leurs rendez-vous et à traiter plus de personnes. On voit souvent l’IA comme un facteur d’exclusion, mais ça peut aussi être une opportunité pour plus inclure.

Thibaut le Masne : Du coup, peut-on rappeler quelles sont les principales initiatives qui ont été menées dans ce cercle-là et surtout quel rôle l'open data peut jouer dans ces nouveaux services d’État et en quoi ça aiderait les différents clients à avancer ?

Laure Lucchesi : L'open data, on l’a dit, c’est la mise à disposition des données publiques, donc toutes les données qui ne sont ni des données à caractère personnel, j’insiste, ni des données qui sont protégées par des secrets, donc pas de secret médical, pas de secret fiscal, pas de secret commercial.

Cyrille Chaudoit : Ce sont les hackers qui font ça, en général ! C’est de l’open data, mais sur le dark web. C’est comme ça que c’est vendu.

Thibaut le Masne : Ce n’est pas exactement pareil, ce n’est pas si open.

Laure Lucchesi : Je vais passer par l’exemple de ce qu’on a fait quand je suis arrivé chez Etalab, où je ne suis plus d’ailleurs, en 2013, on a redéveloppé le portail data.gouv.fr. Quand je suis arrivée à Etalab, cette politique d'open data était en place depuis deux ans, ça a été créé par décret en 2011 et la plateforme, data.gouv.fr, où on a toutes les données mises à disposition par l’administration en open data, existait sous forme de portail dans sa première version. C’était outsourcé à une espèce de SS2I et les administrations étaient plutôt obligées, parce qu’il y avait un décret du Premier ministre, de partager et de mettre à disposition leurs données sur cette plateforme.

Cyrille Chaudoit : Peut-on juste rappeler qu’elles sont les données qui sont mises à disposition sur cette plateforme ?, parce qu’elles sont assez diverses.

Mick Levy : Il y a des centaines de jeux de données ; c’est d’une richesse impressionnante.

Cyrille Chaudoit : Oui, mais juste les grandes thématiques.

Laure Lucchesi : Il y en a dans tous les champs de politique publique et, en gros, dans tous les domaines de tous les ministères. Ce sont donc, évidemment, toutes les statistiques qui sont produites par l’Insee. Dans le domaine de l’Insee aussi, ce sont, par exemple, toutes les données de la base qui s’appelle la base Sirene, sur les informations relatives aux entreprises. Et là, on a un fichier de dix millions d’entrées avec les identifiants uniques des entreprises, l’adresse, le chiffre d’affaires. Vous voyez bien que c’est une donnée qui est utile à tout le monde. Elle est produite par l’Insee pour ses usages de statistiques publiques, mais, finalement, elle sert à d’autres administrations, elle est utilisée aussi par des entreprises, puisqu’on peut avoir accès à énormément d’informations.

Thibaut le Masne : Sur ce point-là, alors je sais que ça fait longtemps, enfin ça fait quelque temps que tu n’y es plus, tu n’as donc pas forcément les chiffres exacts, mais est-ce que tu peux rappeler le nombre de personnes qui arrivent à se connecter ou le nombre d’entreprises ? Est-ce que vous faites des statistiques sur les gens qui utilisent cette plateforme-là ?

Laure Lucchesi : Sur data.gouv.fr toutes les statistiques, en fait c’est plus que des statistiques, ce sont des données d’utilisation en temps réel, sont disponibles puisque ça fait partie aussi des engagements de transparence qu’on a mis en place. Vous avez le nombre de ce qu’on appelle datasets, de jeux de données effectivement disponibles. Là, à cet instant il y en a 47 699.

Cyrille Chaudoit : Je suis sur le site, juste pour que vous compreniez bien ce qu’on trouve, allez sur le site c’est vraiment intéressant, les thématiques, juste pêle-mêle, comme ça : les données sur le Covid-19, sur les élections, sur les énergies, sur les données géographiques, le transport, l’éducation, logement et urbanisme, transport, emploi, santé, l’agriculture et l’alimentation, etc., j’en passe et des meilleurs. Bref, c’est hyper riche.

Mick Levy : Les données en open data sont d’ailleurs devenues un incontournable de tout projet qu’on peut réaliser en data science dans des entreprises. Du coup, ça permet de contextualiser les constats qui sont faits par les données de l’entreprise sur ses propres ventes, sur sa propre performance, de les contextualiser par rapport à un contexte plus large.
Laure, j’ai envie de faire un petit peu poil à gratter aussi. Est-ce que, finalement, il n’y a pas eu un mauvais effet à l'open data : ça a servi à la fois à des entreprises, je viens de l’illustrer, ça sert à la fois à la vie publique, rappelons que l'open data est aussi régi par une loi sur la transparence de la République, mais, finalement, est-ce que ça n’a pas aussi fait le jeu des Big Tech ? Du coup un Google, et tous les autres, ont pu accéder à tout un tas de données et eux ont des compétences, un savoir-faire pour exploiter ces données, peut-être bien plus important que celui qu’on a dans l’administration française ou, même, parfois dans les entreprises. Du coup, finalement, est-ce que ce n’est pas eux, les Big Tech, qui en ont eu les premiers l’avantage, l’usufruit on pourrait dire, à utiliser ces données ?

Laure Lucchesi : Évidemment qu’ils utilisent, comme tous les autres, les données qui sont mises à disposition en open data. Mais un des paris qui a été fait sur l'open data, c’est justement de réduire les barrières et les inégalités entre les acteurs et donner la possibilité à des plus petits acteurs d’avoir aussi accès à ces données-là, parce qu’ils n’auraient pas les moyens soit de les acheter soit, même, en fait, de les reconstituer et de les reproduire.
Si on parle, par exemple, des données sur l’infrastructure de transport qui, pour le coup, est une vraie infrastructure numérique de données. Quand on a tout le réseau de transports en commun qui est disponible, on voit bien que c’est le socle sur lequel des applications de calculateur d’itinéraires vont venir se greffer. On a aussi des données sur les horaires.

Mick Levy : Google Maps en a profité pour donner les horaires des transports et puis indiquer un transport, mais c’est aussi le cas de toutes les villes de France qui peuvent s’appuyer là-dessus pour chacune, proposer leurs applications liées aux transports en commun.

Laure Lucchesi : Et à des plus petits acteurs, justement que Google de venir concurrencer et fournir, eux aussi, ces données-là, par exemple si on reprend les horaires de trains.

Mick Levy : C’est d’ailleurs une belle illustration de ce qu’on disait tout à l’heure, je fais le lien, sur la notion d’État plateforme. L’État ouvre des données qui servent à plein d’autres personnes et ce n’est pas l’État qui a fourni l’application elle-même pour réserver ton transport et savoir à quelle heure il faut que tu prennes ton bus.

Laure Lucchesi : Exactement.

Cyrille Chaudoit : Du coup, ça pose une question. Tu nous as dit toi-même, tout à l’heure, que cette donnée publique a déjà été financée, autrement dit par le contribuable. Cette donnée est donc mise en pâture pour tout le monde, y compris pour des Big Tech qui vont utiliser cette techno pour nous vendre quelque chose derrière et, parfois même, ils ne vont pas nous le vendre, ça sera gratuit, on connaît la suite de l’adage. C’est quand même un petit peu délicat, comme mécanique, sur le fond ?

Laure Lucchesi : Ça a été tout le débat, qui est toujours en cours, sur la monétisation des données publiques. Dans l’histoire, on a eu aussi des mouvements de balancier. À un moment, on disait « c’est le patrimoine de données des administrations, le patrimoine immatériel, donc il faut, administrations, que vous vendiez, que vous créiez des services qui soient pour vous des ressources propres sur lesquelles vous allez vendre des services ». Les administrations se sont mises à vendre des données brutes et, en fait, ce n’est pas leur métier de savoir vendre des données, elles le faisaient mal, elles le faisaient selon des modèles qui ne sont pas les modèles de l’économie numérique. Un rapport a été écrit en 2013 là-dessus et on voyait que les coûts de transaction et les coûts de coordination étaient, finalement, supérieurs à ce que l’administration pouvait récupérer de ses données. C’est surtout qu’un des paris de l'open data c’est de dire que ça va créer de la valeur économique sur laquelle l’administration récupérera une partie par l’impôt. Ça va permettre de créer de nouveaux services, on en récupérera une partie, ça va même, potentiellement, permettre de créer jusqu’à des emplois et on s’y retrouvera avec l’impôt. La vraie question c’est si des acteurs ne jouent pas le jeu de payer leurs impôts. Là, on a effectivement un sujet, mais qui n’est pas le sujet de l'open data et qui se règle certainement à un autre niveau.

Cyrille Chaudoit : On est bien d’accord. C’est systémique et, en matière de système, du rôle de l'open data et de l’action publique par le numérique, c’est précisément ce qu’on va aborder dans la toute prochaine séquence, mais, juste avant, on va retrouver avec grand plaisir, Fabienne Billat et son Patch Tech.

Le Patch Tech de Fabienne Billat 34’32

Cyrille Chaudoit : Le 14 février 2024, c’était la Saint-Valentin, comme chaque année, mais c’était aussi OpenAI qui donnait naissance à une révolution dans le domaine de la création vidéo avec le lancement de Sora. Aller Fabienne, dis-nous tout.

Fabienne Billat : Oui, tout à fait. Déjà, Sora c’est un nom japonais qui a été choisi et qui évoque le ciel ou le paradis, car il ouvre la voie à des possibilités inédites dans la production de vidéos. Cette production, limitée pour le moment à 60 secondes, est initiée par des prompts, c’est-à-dire une instruction écrite. Voilà un bond technologique, comparable à celui que nous avons connu avec la génération d’images il y a plus d’un an et tu t’en souviens.
Sora utilise une architecture de transformateur et se distingue par sa capacité à créer des scènes riches et réalistes avec plusieurs personnages, des mouvements complexes de caméra et une multitude de détails précis, tout cela dans une grande cohérence. Néanmoins, tu as pu observer, vous avez pu observer que le modèle présente des faiblesses au niveau des doigts, des bras ou des jambes, et peut ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut croquer dans un biscuit, mais le biscuit reste entier !

Cyrille Chaudoit : OK. Encore plus de créativité au bout des doigts ou du biscuit, mais est-ce que ça va vraiment plaire à tout le monde ?

Fabienne Billat : On peut déjà imaginer à quel point cela bouleversera les processus créatifs et de conception vidéo traditionnels, mais également raviver les inquiétudes des syndicats d’acteurs américains, déjà en grève en novembre 2023. Selon les prévisions de Forrester, d’ici à 2030, 90 % des blockbusters américains seront produits à l’aide de l’IA générative. Hormis la production cinématographique, artistique, culturelle, publicitaire, ces vidéos immersives offriront la possibilité de produire rapidement du contenu, que ce soit, par exemple, dans la formation, l’éducation, le marketing, etc.

Cyrille Chaudoit : Je donne quand même rendez-vous en 2030 à Forrester qui cherche, avant tout, à vendre des études. Mais question sécurité, authenticité, copyright, qu’en est-il ?

Fabienne Billat : Justement OpenAI a donc mis en place une Red Team de personnalités triées sur le volet, des réalisateurs, des artistes experts dans le domaine de l’IA, afin d’y déceler des dangers ou des risques en matière de deepfakes, d’usurpation d’identité.
Autre promesse, celle de garantir la fiabilité des contenus générés, en envisageant l’intégration de métadonnées, des filigranes appelés watermarks pour faciliter leurs vérifications. À ce sujet, la CNIL italienne, le GPDP [Garante per la protezione dei dati personali] a ouvert une enquête, début mars, sur différentes modalités comme les données, l’entraînement des algorithmes, et donne un délai de 20 jours à OpenAI pour y répondre.
Pour autant, la concurrence reste vive et Google, Meta et d’autres sont lancés dans la course. Mais, ce qui pourrait faire toute la différence pour Sora, c’est la combinaison d’un bon timing et d’importantes capacités d’investissement.
À l’instar de ma conviction sur les contenus informationnels, le photojournaliste Niels Ackermann soulève une réflexion stimulante : selon lui, plus il est facile de produire du faux, plus le vrai aura de la valeur.
Avec cette profusion d’images créées depuis un an, lisses, égales, pouvons-nous anticiper une revalorisation du vrai où les œuvres réelles, vécues, parfois moins parfaites offriraient une alternative à l’abondance de ces contenus si synthétiques.

Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.

Données libres pour société plus éclairée 37’ 55

Cyrille Chaudoit : En voilà des grandes questions, Fabienne !