« Albert, le projet d’IA générative des services publics » : différence entre les versions

De April MediaWiki
Aller à la navigationAller à la recherche
(Contenu remplacé par « Catégorie:Transcriptions Publié [https://www.librealire.org/albert-le-projet-d-ia-generative-des-services-publics ici] - Juin 2024 »)
Balise : Contenu remplacé
 
Ligne 1 : Ligne 1 :
[[Catégorie:Transcriptions]]
[[Catégorie:Transcriptions]]


'''Titre :''' Albert, le projet d’IA générative des services publics avec Pierre-Étienne Devineau
Publié [https://www.librealire.org/albert-le-projet-d-ia-generative-des-services-publics ici] - Juin 2024
 
'''Intervenants :''' Pierre-Étienne Devineau - Jérôme Sorrel - Jean-Philippe Clément
 
'''Lieu :''' Podcast <em>Parlez-moi d’IA</em> - Radio Cause Commune
 
'''Date :''' 4 mai 2024
 
'''Durée :''' 30 min
 
'''[https://cause-commune.fm/podcast-download/17340/parlez-moi-d-ia-30.mp3 Podcast]'''
 
'''[https://cause-commune.fm/podcast/parlez-moi-d-ia-30/ Présentation du podcast]'''
 
'''Licence de la transcription :''' [http://www.gnu.org/licenses/licenses.html#VerbatimCopying Verbatim]
 
'''Illustration :''' À prévoir
 
'''NB :''' <em>Transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.<br/>
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.</em>
 
==Description==
 
Albert, c’est le nom de code d’un projet de modèles d’IA générative spécialement déployés et entrainés pour les services publics français. L’administration française d’État configure ses propres outils IA pour mieux servir les administrés !
 
==Transcription==
 
<b>Voix off : </b><em>Parlez-moi d’IA</em>.
 
<b>Diverses voix off : </b>Mesdames et Messieurs, bonjour.<br/>
Je suis un superordinateur CARL, cerveau analytique de recherche et de liaison.<br/>
C’est une machine qui ressent les choses.<br/>
On nous raconte n’importe quoi sur l’IA !<br/>
Qu’est-ce que tu en dis ?<br/>
Moi, je n’en dis rien du tout.<br/>
La créativité, elle reste du côté humain.
 
<b>Jean-Philippe Clément : </b>Bonjour à toutes et à tous.<br/>
Je suis Jean-Philippe Clément. Bienvenue sur <em>Parlez-moi d’IA</em>. Merci, Jérôme Sorrel, à la réalisation de cette émission.<br/>
Jérôme, cette semaine je vais te présenter Albert. C’est le nom de code d’un projet de modèles d’IA génératives spécialement déployé et entraîné par les services publics. Oui Monsieur, l’administration française configure ses propres outils d’IA pour mieux servir ses administrés !<br/>
Vous êtes bien sur Cause Commune, la radio des possibles, c’est <em>Parlez-moi d’IA</em>. Nous avons 30~minutes pour essayer de mieux comprendre ces nouveaux outils sous leurs aspects sociétaux, culturels, sociaux, éthiques et pourquoi pas politiques.<br/>
Cause Commune que vous pouvez retrouver sur le Web, bien sûr, causecommune.fm et sur son app mobile, sur la bande FM 93.1 et le DAB+ et en podcast sur votre plateforme préférée. N’hésitez pas à poser un petit like, un petit partage, c’est notre seule récompense et, en plus, ça va manipuler les algorithmes et, forcément, c’est cool de manipuler les algorithmes !
 
Aujourd’hui, on va donc faire la connaissance d’Albert, le programme qui cherche à mettre en place l’IA générative au service des services publics. Concrètement, comment l’État va-t-il utiliser l’IA générative ? Comment ces nouveaux outils peuvent-ils aider les agents publics à mieux servir les usagers ? Et tout cela, arrivons-nous à le faire tout en restant indépendants des grands acteurs numériques ? Sommes-nous souverains dans l’usage de l’IA par les services publics ? Avons-nous vraiment les compétences, au sein de l’État, pour réaliser ce type de projet ? Plein de questions sur ce sujet.<br/>
Notre invité du jour est ingénieur, mathématicien spécialiste, en data science, il ne s’appelle pas Albert, il est aujourd’hui responsable scientifique et technique à la Direction interministérielle du Numérique<ref>[https://fr.wikipedia.org/wiki/Direction_interminist%C3%A9rielle_du_Num%C3%A9rique Direction interministérielle du Numérique, DINUM]</ref>, la DINUM, où il s’occupe de développer et de déployer des algorithmes au sein des services publics.<br/>
Bonjour Pierre-Étienne Devineau.
 
<b>Pierre-Étienne Devineau : </b>Bonjour Jean-Philippe.
 
<b>Jean-Philippe Clément : </b>Merci d’être avec nous à distance.<br/>
Pierre-Étienne, parlez-moi d’IA. Si vous deviez expliquer à votre grand-mère ce qu’est Albert et ce sur quoi vous travaillez, comment pourriez-vous le résumer ?
 
<b>Pierre-Étienne Devineau : </b>Je dirais à ma grand-mère que c’est un logiciel qui vient lire des textes, essaye de les analyser et propose soit un résumé du texte soit de répondre à des questions sur le texte.
 
<b>Jean-Philippe Clément : </b>D’accord. C’est quelque chose qui a été développé par la DINUM, c’est un projet DINUM. D’abord une expérimentation ?
 
<b>Pierre-Étienne Devineau : </b>Absolument. C’est une expérimentation qui cherche à repartir de ce qu’on appelle les modèles de fondation<ref>[https://fr.wikipedia.org/wiki/Mod%C3%A8le_de_fondation Modèle de fondation, modèle d'intelligence artificielle de grande taille, entraîné sur une grande quantité de données non étiquetées]</ref>, donc des modèles d’IA grand public et libres d’utilisation, pour les modifier en leur donnant à voir des données de l’administration, des documentations, des fiches techniques, etc., produites par les services publics, de sorte que cette IA va s’en imprégner et être en mesure de répondre à des questions sur cette base.<br/>
On dit que c’est une expérimentation, puisqu’on a commencé à l’utiliser notamment dans ce qu’on appelle les maisons France services qui sont des sortes de guichets où les Françaises/Français peuvent se rendre pour se faire aider dans leurs démarches administratives.
 
<b>Jean-Philippe Clément : </b>Vous avez commencé à le dire : qu’est-ce que permettent de faire ces dispositifs techniques d’IA pour l’administration française ? C’est utile à quoi ? C’est pour quels types de grands cas ? Sans forcément rentrer dans les cas d’usage et dans les clients, mais par grandes catégories, en fait, ça permet de faire quoi ?
 
<b>Pierre-Étienne Devineau : </b>Par grandes catégories, tous ce que ces logiciels ont en commun c’est qu’ils permettent d’analyser des textes. Une fois qu’on est en mesure d’analyser des textes, on peut aussi générer d’autres textes, produire des textes. Les grands usages que nous avons, c’est de pouvoir répondre à des questions sur la base d’une base documentaire de connaissances, sur certaines bases de connaissances. Vous fournissez tout un ensemble de sources d’information et l’algorithme va trouver, dans ces sources, le passage qui répond le mieux à votre question et vous proposer une petite synthèse de la réponse.<br/>
Une autre grande famille de cas d’usage, c’est de proposer des résumés : vous fournissez un document de plusieurs dizaines de pages et l’outil vous propose un résumé en une page, une demi-page, tout cela est paramétrable ; ou encore de prendre plusieurs documents, qui ont chacun leur plan, et proposer une sorte de synthèse qui les combine.
 
<b>Jean-Philippe Clément : </b>Du coup, au niveau des concours de la fonction publique, c’est bon, il n’y a plus besoin de réviser la note de synthèse, c’est désormais Albert qui fait les notes de synthèse de l’administration française ?
 
<b>Pierre-Étienne Devineau : </b>Non, heureusement non ! Dans les deux cas, on parle d’outil d’aide, un outil d’aide à la rédaction et un outil d’aide à la recherche d’informations. Et c’est vraiment rassurant de voir comment un assistant se perfectionne petit à petit, mais n’aura jamais vocation à remplacer le travail de l’agent public, simplement de l’aider.
 
<b>Jean-Philippe Clément : </b>Du coup, vous lui avez quand même montré beaucoup de notes de synthèse, beaucoup de documents administratifs, et il va avoir la capacité de générer du texte sous cette forme-là, cette forme très significative de l’administration qui est très factuelle ? Il va pouvoir le faire dans la forme, il va quand même pouvoir respecter la manière de faire la note de synthèse ?
 
<b>Pierre-Étienne Devineau : </b>C’est l’exercice qu’on est en train de se donner, sachant que selon le service, il peut y avoir aussi différentes grandes cultures de la note de synthèse. On essaye donc de naviguer entre ces cultures pour apprendre un petit peu le substrat commun entre toutes ces notes.
 
<b>Jean-Philippe Clément : </b>Il y a des subtilités entre Bercy et les autres ministères, c’est ce que vous venez de dire ?
 
<b>Pierre-Étienne Devineau : </b>Pas forcément exactement entre Bercy et les autres ministères, mais il peut y avoir des subtilités sur le type de plan, sur la longueur. On essaye donc de partir avec quelques administrations pilotes pour faire ce premier un outil de notes de synthèse sur mesure avec elles et, ensuite, on va le généraliser.
 
<b>Jean-Philippe Clément : </b>Justement, si on fait un peu le tour de vos clients de l’expérimentation, ceux qui ont dit « OK, je veux bien tester ces outils-là », qui sont ces clients et comment, concrètement, utilisent-ils l’outil ?
 
<b>Pierre-Étienne Devineau : </b>Ce sont principalement des administrations de l’État central, même si on a quelques collectivités qui sont intéressées et qu’on embarque petit à petit, qui vont arriver. Les deux premières administrations avec lesquelles on a travaillé c’est l’Agence nationale de cohésion du territoire via le réseau des maisons France services.
 
<b>Jean-Philippe Clément : </b>C’est quoi les réseaux des maisons France services ? Ça sert à quoi en théorie ?
 
<b>Pierre-Étienne Devineau : </b>Les réseaux des maisons France services, c’est un ensemble de lieux soit fixes soit mobiles, il y a aussi des maisons France Services dans des bus, qui sont répartis sur le territoire et où les citoyens et citoyennes peuvent se rendre avec ou sans rendez-vous, ça dépend, pour se faire accompagner par des agents publics soit pour répondre à des questions que les citoyens ont, soit, carrément, pour faire les démarches administratives avec eux.
 
<b>Jean-Philippe Clément : </b>D’accord. Du coup, qu’apporte cet outil aux agents publics qui reçoivent ces publics ?
 
<b>Pierre-Étienne Devineau : </b>L’outil qu’on est en train d’expérimenter dans les maisons France services, est un outil qui est adapté aux situations où les citoyens ont pris rendez-vous et ont indiqué, au moment de leur prise de rendez-vous, qu’ils voudraient être aidés sur tel ou tel genre de chose. Donc on fournit, à Albert, la raison du rendez-vous et Albert prépare une fiche pratique en fournissant à la fois les informations clés pour répondre à la demande de l’usager et les liens pratiques vers le bon téléservice pour faire la démarche ou l’administration à contacter ou les questions associées, etc. À chaque fois, quand Albert fournit une réponse, l’exercice c’est qu’il puisse donner la source de sa réponse.
 
<b>Jean-Philippe Clément : </b>D’ailleurs, ce n’est pas courant en IA générative d’arriver à remonter sur une source potentielle.
 
<b>Pierre-Étienne Devineau : </b>Ce n’est pas courant, mais ça l'est de plus en plus. Ce processus a un nom anglais, ça s’appelle la <em>Retrieval-Augmented Generation</em>, la génération augmentée par le fait de retrouver les informations, et ça marche en deux temps :<br/>
d’abord, vous prenez cette base de connaissances, cette base de documents, et vous l’analysez pour détecter ce dont parle chaque paragraphe. Puis vous enregistrez le sens, ce qu’on appelle la sémantique, donc vous enregistrez chaque paragraphe avec, on va dire, des étiquettes qui correspondent à ce dont il parle ;<br/> ensuite, quand vous venez poser des questions Albert, Albert va chercher dans toutes les étiquettes qu’il a fabriquées celles qui semblent les plus proches de votre question. Ce sont donc ces textes-là qu’il va relire au moment de répondre à votre question, il va donc vous répondre sur la base de ces extraits les plus pertinents.
 
<b>Jean-Philippe Clément : </b>Donc, dans ce cas-là, en fait l’IA sert d’assistant à l’agent public finalement en préparant le rendez-vous et ça permet, pendant le rendez-vous qui n’est pas forcément toujours très long, d’être très efficace sur la manière de répondre à la question de l’usager, voire de lui donner des éléments supplémentaires. C’est ça ?
 
<b>Pierre-Étienne Devineau : </b>Exactement. En fait, ça permet de gagner le maximum de temps sur la recherche d’informations pour consacrer le temps du rendez-vous à vraiment l’accompagnement de l’usager quand il a besoin d’aide pour faire la démarche en ligne, remplir les formulaires, etc. C’est donc passer moins de temps à rechercher des informations et plus de temps à faire ensemble.
 
<b>Jean-Philippe Clément : </b>Et l’usager repart avec sa fiche rédigée par Albert ou pas ? Pas à ce point-là quand même !
 
<b>Pierre-Étienne Devineau : </b>Pas à ce point-là !
 
<b>Jean-Philippe Clément : </b>D’accord ! Est-ce qu’il y a d’autres cas d’usage ? Est-ce que vous avez d’autres clients publics qui viennent vous demander des choses en particulier avec Albert ?
 
<b>Pierre-Étienne Devineau : </b>Oui, bien sûr. Sur le sujet des notes de synthèse, le premier service avec lequel on a commencé à travailler, c’est la Cour des comptes. Maintenant, d’autres ont rejoint l’aventure sur le sujet.
 
<b>Jean-Philippe Clément : </b>En plus, ce sont des rapports de synthèse qui sont souvent costauds.
 
<b>Pierre-Étienne Devineau : </b>Qui sont tout à fait conséquents, mais qui ont le bon goût d’avoir des plans très clairs, très travaillés. Un des exercices, c’est de pouvoir repartir de rapports de chambres régionales des comptes pour essayer d’en faire une synthèse croisée. L’avantage, c’est qu’on peut fournir à Albert des exemples de rapports produits par les chambres régionales des comptes et du rapport national correspondant de la Cour des comptes. On montre un petit peu à Albert comment l’exercice a été fait par le passé pour qu’il puisse, à son tour, aider à le faire. Sur le sujet, on est encore en phase expérimentale avec la Cour des comptes.
 
<b>Jean-Philippe Clément : </b>Du coup, Albert est quand même un bon assistant de la Cour des comptes ? Il a bien compris comment il fallait faire un rapport et comment il fallait le synthétiser ?
 
<b>Pierre-Étienne Devineau : </b>Il est en train d’apprendre, c’est un élève en formation.
 
<b>Jean-Philippe Clément : </b>C’est bien ! Vous êtes humble avec l’outil que vous développez. Je crois savoir que ça marche plutôt très bien !</br/>
Dans toutes ces données, dans tous ces rapports publics, il y a souvent des données nominatives. Du coup, c’est un peu sensible parce que ça veut dire qu’on donne à manger à l’IA pas mal de données où, à l’intérieur, il y a des noms et des prénoms de personnes, des noms de société. Comment gère-t-on, justement, le fait d’entraîner un modèle avec des données nominatives ?
 
<b>Pierre-Étienne Devineau : </b>C’est une excellente question qu’on est en train d’étudier avec la CNIL.</br/>
Pour l’instant, le choix sur lequel on est parti, c’est d’essayer de distinguer deux phases : la phase de conception du modèle, la façon dont on alimente le modèle, et la phase où on l’utilise. Dans la phase où on alimente le modèle, on essaye de lui donner peu ou pas de données personnelles. Ça veut dire qu’on a une première étape où on va retirer de cette base d’exemples, de cette base qu’on appelle la base d’apprentissage, les données personnelles via des règles qui permettent de les trouver et de les retirer au cas par cas.<br/>
À côté de ça, pour ne pas avoir de données personnelles, on a toute une stratégie où on crée des fausses données, c’est-à-dire des données qui ressemblent à des données authentiques, mais qui n’en sont pas, c’est ce qu’on appelle les données synthétiques, et les données synthétiques ne contiennent pas de données personnelles puisqu’elles sont sur des exemples factices, mais réalistes.
 
<b>Jean-Philippe Clément : </b>Et vous les générez avec de l’IA générative.
 
<b>Pierre-Étienne Devineau : </b>Exactement. Et là où ça devient amusant, c’est qu’on a des outils d’IA générative pour générer des exemples factices, mais réalistes, qu’on donne ensuite à manger Albert pour l’améliorer. C’est donc l’IA générative qui lui permet de s’améliorer elle-même.
 
<b>Jean-Philippe Clément : </b>On a fait un bon premier tour d’horizon de vos clients, de vos usages.<br/>
Je vous propose qu’on fasse une petite pause musicale.<br/>
Garlaban, notre programmateur musical, voulait, aujourd’hui, vous remercier pour tous vos partages et toutes les informations que vous nous donnez. Il vous offre ce morceau <em>A Token of gratitude</em>, un signe de gratitude, de The Radio Dept.
 
<b>Pause musicale : </b><em>A Token of gratitude</em> par The Radio Dept.
 
==15’ 43==
 
<b>Jean-Philippe Clément : </b>Merci The Radio Dept. Merci à Garlaban.<br/>
Vous êtes toujours sur Cause Commune en FM 93.1 à Paris, toujours <em>Parlez-moi d’IA</em>, toujours l’épisode consacré à la découverte d’Albert, le dispositif d’IA générative, conçu et déployé par le service public français, avec Pierre-Étienne Devineau, l’un des chefs d’orchestre du dispositif.<br/>
Pierre-Étienne, figurez-vous que Jérôme a une question, il a le droit, il a droit à une question dans l’émission.
 
<b>Pierre-Étienne Devineau : </b>Excellent.
 
<b>Jérôme Sorrel : </b>La question que je me posais pendant la pause musicale : combien êtes-vous dans votre service à travailler là-dessus ?, parce que ce sont quand même mes impôts tout ça !
 
<b>Pierre-Étienne Devineau : </b>C’est une très bonne question. Avec vos impôts, on rémunère, en ce moment, entre 10 et 15~personnes au sein du service Etalab<ref>[https://fr.wikipedia.org/wiki/Etalab Etalab, administration publique française qui vise à améliorer le service public et l'action publique grâce aux données]</ref> qui est en charge du développement d’Albert.
 
<b>Jean-Philippe Clément : </b>Très bien. Du coup, je vais continuer justement sur ce que vous faites et sur le dispositif technique qui est derrière le programme. On appareille donc des modèles, vous utilisez des modèles existants, vous n’avez pas créé des modèles fondationnels pour ça. Quels sont les modèles que vous utilisez pour réaliser ces services ?
 
<b>Pierre-Étienne Devineau : </b>On utilise LLaMA 2<ref>[https://fr.wikipedia.org/wiki/LLaMA LLaMA, <em>Large Language Model Meta AI</em>, grand modèle linguistique <em>open source</em> développé par Meta]</ref>, Mistral<ref>[https://fr.wikipedia.org/wiki/Mistral_AI Mistral AI, une entreprise française qui développe des grands modèles de langage <em>open source</em> et propriétaires]</ref> et des modèles dérivés de Mistral comme OpenHermes<ref>[https://huggingface.co/teknium/OpenHermes-2.5-Mistral-7B OpenHermes, en anglais]. </ref>.
 
<b>Jean-Philippe Clément : </b>D’accord. Ce sont des modèles <em>open source</em>, je crois.
 
<b>Pierre-Étienne Devineau : </b>Absolument. Les modèles Mistral, en particulier, et ses dérivés, sont des modèles qui ont une licence Apache<ref>[https://fr.wikipedia.org/wiki/Licence_Apache Licence Apache]</ref>, une licence qui nous permet de les réutiliser librement et c’est quelque chose qui est fondamental pour nous, pour notre autonomie stratégique.
 
<b>Jean-Philippe Clément : </b>Nous sommes, nous aussi, très sensibles à l’<em>open source</em> sur Cause Commune, je vous rappelle les émissions <em>Libre à vous !</em><ref>[https://www.libreavous.org/ Émission <em>Libre à vous !</em>]</ref> sur le sujet.<br/>
LLaMA 2, c’est le modèle <em>open source</em> développé par Meta, la boîte de Facebook et Mistral est un acteur français qui n’a même pas un an maintenant, c’est ça ?
 
<b>Pierre-Étienne Devineau : </b>C’est ça.
 
<b>Jean-Philippe Clément : </b>Essayez de nous expliquer. J’essaye de comprendre. Ce sont des modèles qui sont publiés quelque part, on peut aller les chercher, on peut aller les récupérer.
 
<b>Pierre-Étienne Devineau : </b>Absolument.
 
<b>Jean-Philippe Clément : </b>Comment ça se passe ? On peut les récupérer et que se passe-t-il après ?
 
<b>Pierre-Étienne Devineau : </b>En fait, on commence par les récupérer et, ensuite, on va vouloir les transformer un petit peu. Pour les transformer, on fait ce qu’on appelle du <em>fine-tuning</em> : on va donc prendre les données de l’administration qu’on a préparées, par exemple les exemples de résumés ou les exemples de questions/réponses sourcés qu’on a fabriqués à l’avance à partir des fiches d’information et on vient modifier à peu près 1 % du modèle, avec ces données, pour déplacer un peu la manière dont le modèle fonctionne.
 
<b>Jean-Philippe Clément : </b>C’est-à-dire que le modèle fonctionne déjà à 99 %, vous pouvez déjà lui parler, vous pouvez déjà interagir avec lui, mais pour qu’il soit meilleur, finalement, dans la fonction dans laquelle vous allez lui demander de travailler, vous lui donnez des données supplémentaires et des éléments supplémentaires. C’est ça ?
 
<b>Pierre-Étienne Devineau : </b>Exactement. Les éléments supplémentaires qu’on lui donne, déjà ça va l’aider à mieux parler français, à mieux maîtriser le langage administratif aussi pour essayer de bien le comprendre et, pourquoi pas, de bien le restituer.
 
<b>Jean-Philippe Clément : </b>C’est une langue à part !
 
<b>Pierre-Étienne Devineau : </b>C’est une langue à part, il est important de bien la comprendre et aussi de bien comprendre son vocabulaire, ainsi que les sigles administratifs par exemple.
 
<b>Jean-Philippe Clément : </b>Rien que ça déjà, ça doit effectivement beaucoup tourner dans les processeurs, rien que les sigles de l’administration française, effectivement !
 
<b>Pierre-Étienne Devineau : </b>Oh que oui ! Ensuite, quand on vient modifier ce petit pourcent des paramètres du modèle, on donne des exemples des activités sur lesquelles on veut que le modèle soit bon, donc des exemples de résumés. On a toute une stratégie pour faire les résumés de textes longs. D’ailleurs, je peux vous le raconter, grosso modo, en une phrase : en fait, ce sont des modèles qui sont doués pour faire des résumés de textes très courts, transformer un paragraphe long en un paragraphe court. Mais quand on veut transformer un document très long en un document très court, il y a tout un paquet de paragraphes. On a donc une stratégie : on vient découper le texte, selon son plan, en différentes parties, puis on découpe la partie en différents paragraphes, on résume chacun des paragraphes, ça donne un texte un peu plus court, puis on recommence, etc., jusqu’au moment où on a un texte suffisamment court.
 
<b>Jean-Philippe Clément : </b>Et, ce qu’on obtient à la fin est quand même intelligible ?
 
<b>Pierre-Étienne Devineau : </b>C’est quand même intelligible, absolument.
 
<b>Jean-Philippe Clément : </b>D’accord. Encore une fois, pour bien comprendre, sur quel type d’infrastructure faites-vous toutes ces opérations techniques ? C’est-à-dire qu’on récupère un modèle, donc on récupère un code source, quelque part sur un <em>repository</em> sur Internet, publié par LLaMA et Mistral. D’ailleurs où LLaMA et Mistral publient-ils ? Ils publient comme tout le monde sur GitHub ?
 
<b>Pierre-Étienne Devineau : </b>Les codes sont publiés sur GitHub. Les modèles sont publiés sur leurs sites respectifs, mais sont aussi concentrés sur Hugging Face<ref>[https://fr.wikipedia.org/wiki/Hugging_Face Hugging Face]</ref> qui est un petit peu l’équivalent de GitHub pour les modèles d’IA.
 
<b>Jean-Philippe Clément : </b>Donc, vous les récupérez pour les <em>fine tuner</em>, pour les préparer, comment faites-vous techniquement ? Où est le serveur ?
 
<b>Pierre-Étienne Devineau : </b>Aujourd’hui, on loue des serveurs dans le <em>cloud</em> public, pour nous permettre de faire ce <em>fine tuning</em>, de faire ces modifications assez légères et ensuite pouvoir utiliser les modèles, ce qu’on appelle en production, pour les utiliser au quotidien. En fait, la contrainte avec ces modèles, c’est que ce sont des modèles beaucoup trop gros pour tourner sur votre ordinateur ou le mien, on a donc vraiment besoin de ces serveurs en continu pour les utiliser.
 
<b>Jean-Philippe Clément : </b>Et le <em>cloud</em> public, ce sont des serveurs que l’administration publique maîtrise ? C’est ça ?
 
<b>Pierre-Étienne Devineau : </b>Pardon ! <em>Coud public</em>, c’est un anglicisme, c’est public au sens anglais, donc ce n’est pas l’administration publique, ça veut dire <em>cloud</em> commercial où on loue actuellement des serveurs. C’est une phase de transition. À côté de ça, on a commandé des serveurs sur une infrastructure qu’on partage, donc, sur ces serveurs qui vont réellement appartenir à l’administration publique, on pourra faire tourner nos modèles à l’avenir.
 
<b>Jean-Philippe Clément : </b>Juste par curiosité, aujourd’hui, vous vous allez chez quel type de prestataire pour faire cela ?
 
<b>Pierre-Étienne Devineau : </b>Aujourd’hui, on va chez des prestataires européens qui ont le label SecNumCloud<ref>[https://certification.afnor.org/numerique/qualification-secnumcloud Qualification SecNumCloud]</ref>, un label qui nous permet, entre autres, de mettre des données confidentielles, ça pourrait être quasiment du secret défense –~en l’occurrence ce n’est pas le cas, mais ça pourrait~– et il n’y a que quelques acteurs qui ont ce label-là.
 
<b>Jean-Philippe Clément : </b>D’accord. Vous faites donc vraiment très attention à là où vous mettez les données, même si elles ne sont pas totalement chez vous. On voit bien comment ces modèles <em>open source</em> permettent, finalement, d’avoir une plus grande souveraineté vis-à-vis de ce qu’on veut en faire et, peut-être aussi, une diffusion plus rapide. C’est ça ? C’est pour cela qu’on utilise de l’<em>open source</em> finalement ?
 
<b>Pierre-Étienne Devineau : </b>On utilise l’<em>open source</em> pour au moins trois raisons :
<ul>
<li>la première raison, c’est effectivement la souveraineté. C’est-à-dire qu’une fois que le modèle a été publié, n’importe qui est libre de l’utiliser, donc on n’est pas dépendant d’un acteur ;</li>
<li>une deuxième raison, c’est qu’en IA la communauté <em>open source</em> est effectivement extrêmement active. Dès lors que vous avez un modèle qui sort, vous allez avoir des élaborations, des versions dérivées du modèle qui vont être produites à leur tour en <em>open source</em>. Si le modèle n’était pas ouvert, s’il était ce qu’on appelle propriétaire, ça ne pourrait pas être le cas. Ça permet donc de bénéficier de l’innovation beaucoup plus rapidement ;</li>
<li>et enfin, une troisième raison qui est propre à l’administration publique mais qui est importante dans notre cas, c’est que depuis 2016, depuis la loi pour une République numérique<ref>[https://fr.wikipedia.org/wiki/Loi_pour_une_R%C3%A9publique_num%C3%A9rique Loi pour une République numérique]</ref>, les travaux de l’État sont, par défaut, ouverts, donc les données de l’État doivent être en <em>open data</em>, les codes de l’État doivent être en <em>open source</em>. C’est donc cohérent qu’on utilise des modèles eux-mêmes ouverts qu’on va pouvoir republier à notre tour.</li>
</ul>
 
<b>Jean-Philippe Clément : </b>D’accord. Vous disiez que vous utilisez deux grands modèles, Llama 2 et Mistral. Quelle est la différence entre LLaMA 2 et Mistral ? Pourquoi en utilisez-vous deux ? Il y en a un qui sait mieux faire un truc qu’un autre ? Pourquoi a-t-on besoin de deux modèles ou de trois ou de quatre ? Comment jugez-vous de la différence entre les modèles, finalement ?
 
<b>Pierre-Étienne Devineau : </b>En fait, c’est aussi pour une raison de déroulé de projet. LLaMA 2 date de juillet dernier, Mistral date d’octobre, je crois. On a donc amélioré nos modèles en continu, on avait commencé à travailler sur les deux, on a gardé les deux jusqu’ici, sachant qu’il y a peut-être une différence, quand même, entre les deux qui est assez intéressante : il y a plus de travail de modération des sorties de LLaMA 2 que de Mistral, Mistral étant un modèle peut-être un peu plus brut de décoffrage.
 
<b>Jean-Philippe Clément : </b>OK. En fait, c’est plutôt une question de fraîcheur de modèles, vous les avez pris au fur et à mesure qu’ils sont venus parce qu’ils étaient de mieux en mieux, finalement.
 
<b>Pierre-Étienne Devineau : </b>Absolument.
 
<b>Jean-Philippe Clément : </b>OK, c’est très clair. Du coup, il y a donc votre équipe, on a parlé d’une quinzaine de personnes.
 
<b>Pierre-Étienne Devineau : </b>Une quinzaine de personnes avec des profils d’experts en intelligence artificielle, une designeuse aussi qui va sur le terrain rencontrer les agents publics pour essayer de bien comprendre ce dont ils ont besoin et coconstruire nos outils numériques avec eux, et des profils de développeuse, développeur, etc.
 
<b>Jean-Philippe Clément : </b>Quand vous allez comme ça sur le terrain, quand vous rencontrez les différents services publics qui veulent faire appel à vous, il faut quand même vous assurer qu’en face vous ayez des personnes qui comprennent ce qu’elles vont faire. Comment fait-on monter en compétence les agents publics pas tant sur le développement mais sur l’usage de ces outils ? Comment leur apprend-on, tout simplement, à <em>prompter</em> correctement s’il faut qu’ils <em>promptent</em> ?
 
<b>Pierre-Étienne Devineau : </b>En les formant. Justement, dans le cadre des actions des maisons France services, on a fait deux formations : une formation sur l’intelligence artificielle générative en général pour bien comprendre ce que c’était, quelles opportunités et quelles limites ça pouvait avoir ; après ça, on a fait une formation un peu plus spécifique pour apprendre à <em>prompter</em> en général et apprendre à <em>prompter</em> Albert en particulier.
 
<b>Jean-Philippe Clément : </b>Et ce sont des formations qui sont en présentiel ? Qui sont en ligne ?
 
<b>Pierre-Étienne Devineau : </b>En ligne, on les a faites en ligne.
 
<b>Jean-Philippe Clément : </b>Du coup, chacun peut venir se former au fur et à mesure.
 
<b>Pierre-Étienne Devineau : </b>C’est ça, et on va reproduire ce genre de formation avec d’autres services publics.
 
<b>Jean-Philippe Clément : </b>Au-delà de votre équipe technique, est-ce que, dans les autres ministères, il y a aussi des techniciens, des <em>data scientists</em> avec lesquels vous travaillez ? Comment ça fonctionne ?
 
<b>Pierre-Étienne Devineau : </b>Oui, absolument. On est en train de structurer une communauté de <em>data scientists</em> des services publics qui travaillent sur l’IA générative. On en trouve beaucoup au ministère de l’Économie et des Finances, on en trouve aussi au ministère des Armées, à l’Intérieur, à l’Insee, etc. On a un groupe d’échanges, donc, chaque semaine, les gens ont rendez-vous avec les équipes de Bercy pour discuter de nos avancées techniques, se conseiller, partager des codes, des expertises, etc.
 
<b>Jean-Philippe Clément : </b>Ça plaît beaucoup à Jérôme qui a une nouvelle question, c’est inédit, deux questions dans l’émission !
 
<b>Pierre-Étienne Devineau : </b>Tant mieux pour moi !
 
<b>Jérôme Sorrel : </b>La question que j’ai envie de vous poser : un agent public qui n’est pas encore fourni avec votre service d’IA générative, peut-il, aujourd'hui, aller sur ChatGPT, sur Gemini ou autre, pour faire travailler l’intelligence artificielle sur une question qu’il a ? A-t-il le droit de le faire ?
 
<b>Jean-Philippe Clément : </b>Est-ce qu’il y a une doctrine en fait, c’est ce que tu veux dire ?
 
<b>Pierre-Étienne Devineau : </b>C’est une très bonne question. Il n’y a pas de doctrine qui ait été publiée par la France sur le sujet. On recommande aux agents publics d’utiliser des outils souverains pour lesquels leurs données seront sur des serveurs maîtrisés.
 
<b>Jean-Philippe Clément : </b>Et vous êtes là pour ça.
 
<b>Pierre-Étienne Devineau : </b>Exactement, on est là pour ça, mais il n’y a pas de doctrine générique. Il y a certains services où la réponse sera évidente et d’autres où elle le sera moins.
 
<b>Jean-Philippe Clément : </b>Donc, ce n’est pas interdit, mais on va dire que vous essayez de proposer une alternative à ces offres privées et étrangères, en plus, avec Albert. Du coup, au-delà des usages, est-il prévu, justement, qu’il y ait un Albert un peu libre-service, quelles que soient les administrations, en mode un peu questions/réponses finalement comme ChatGPT, qui soit mis à disposition à un moment donné ?
 
<b>Pierre-Étienne Devineau : </b>C’est ce vers quoi on veut aller, sachant qu’on apporte, avec Albert, le fait d’avoir des questions/réponses sourcées qui sont toujours adossées à une certaine base documentaire et c’est quelque chose qu’on veut garder. La direction qu’on a en ce moment, c’est d’essayer de trouver, de préparer un certain nombre de bases documentaires qui peuvent intéresser un grand nombre d’administrations pour les mettre sur nos serveurs. À côté de ça, si certaines administrations ont des documents qui ne sont pas dans la base documentaire, on leur permettra de les ajouter soit de manière permanente soit de manière éphémère, le temps de poser leurs questions. En tout cas, c’est quelque chose qu’on veut vraiment garder tel quel : des questions/réponses sourcées.
 
<b>Jean-Philippe Clément : </b>Finissons justement sur ces perspectives. Quelles sont vos grandes perspectives dans les prochains mois, les prochaines années ? Quels sont les grands projets qui vont structurer vos travaux ?
 
<b>Pierre-Étienne Devineau : </b>C’est d’abord élargir le périmètre de ces questions/réponses sourcées ;<br/>
ensuite sortir un logiciel « Albert synthèse », celui qui est en cours de préparation entre autres avec la Cour des comptes ;<br/>
n est en train d’enquêter sur d’autres cas possibles, on a une grande réunion avec un certain nombre de services pour essayer de faire émerger un troisième ou quatrième grand cas ;
et on a des pistes sur la simplification du langage administratif, mais c’est encore à confirmer.
 
<b>Jean-Philippe Clément : </b>C’est très intéressant. On a reçu ici un médecin qui a utilisé ces modèles de langage pour décrypter les petites synthèses techniques médicales en grandes synthèses qui étaient intéressantes. Du coup, je pense que pour simplifier le langage administratif, il y a de grandes chances que ça fonctionne très bien.<br/>
Merci beaucoup, Pierre-Étienne, pour cette exploration d’Albert, c’est l’heure de conclure. Je vous remercie beaucoup pour ce partage.<br/>
Auditeurs, n’hésitez pas à liker cet épisode, bien sûr ça manipule les algorithmes et c’est cool de manipuler les algorithmes !<br/>
Restez sur 93.1 FM sur Cause Commune, je vous laisse entre de bonnes mains, les émissions de Causes Commune.<br/>
À bientôt.
 
<b>Pierre-Étienne Devineau : </b>À bientôt. Merci.

Dernière version du 4 juin 2024 à 13:27


Publié ici - Juin 2024