Albert, le projet d’IA générative des services publics
Titre : Albert, le projet d’IA générative des services publics avec Pierre-Étienne Devineau
Intervenants : Pierre-Étienne Devineau - Jérôme Sorrel - Jean-Philippe Clément
Lieu : Podcast Parlez-moi d’IA - Radio Cause Commune
Date : 4 mai 2024
Durée : 30 min
Licence de la transcription : Verbatim
Illustration : À prévoir
NB : Transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.
Description
Albert, c’est le nom de code d’un projet de modèles d’IA générative spécialement déployés et entrainés pour les services publics français. L’administration française d’État configure ses propres outils IA pour mieux servir les administrés !
Transcription
Voix off : Parlez-moi d’IA.
Diverses voix off : Mesdames et Messieurs, bonjour.
Je suis un superordinateur CARL, cerveau analytique de recherche et de liaison.
C’est une machine qui ressent les choses.
On nous raconte n’importe quoi sur l’IA !
Qu’est-ce que tu en dis ?
Moi, je n’en dis rien du tout.
La créativité, elle reste du côté humain.
Jean-Philippe Clément : Bonjour à toutes et à tous. Je suis Jean-Philippe Clément. Bienvenue sur Parlez-moi d’IA. Merci, Jérôme Sorrel, à la réalisation de cette émission.
Jérôme cette semaine je vais te présenter Albert. C’est le nom de code d’un projet des modèles d’IA générative spécialement déployés et entraînés par les services publics. Oui Monsieur, l’administration française configure ses propres outils d’IA pour mieux servir ses administrés !
Vous êtes bien sur Cause Commune, la radio des possibles, c’est Parlez-moi d’IA. Nous avons 30 minutes pour essayer de mieux comprendre ces nouveaux outils sous leurs aspects sociétaux, culturels, sociaux, éthiques et pourquoi pas politiques.
Cause Commune que vous pouvez retrouver sur le Web, bien sûr, causecommune.fm et sur son app mobile, la bande FM 93.1 et le DAB+ et son podcast sur votre plateforme préférée. N’hésitez pas à faire poser un petit like, un petit partage, c’est notre seule récompense et, en plus, ça va manipuler les algorithmes et, forcément, c’est cool de manipuler les algorithmes !
Aujourd’hui, on va donc faire la connaissance d’Albert, le programme qui cherche à mettre en place l’IA générative au service des services publics. Concrètement, comment l’État va-t-il utiliser l’IA générative ? Comment ces nouveaux outils peuvent-ils aider les agents publics à mieux servir les usagers ? Et tout cela, arrivons-nous à le faire tout en restant indépendants des grands acteurs numériques ? Sommes-nous souverains dans l’usage de l’IA par les services publics ? Avons-nous vraiment les compétences, au sein de l’État, pour réaliser ce type de projet ? Plein de questions à ce sujet.
Notre invité du jour est ingénieur, mathématicien spécialiste, en data science, il ne s’appelle pas Albert, il est aujourd’hui responsable scientifique et technique à la Direction interministérielle du numérique, la DINUM, où il s’occupe de développer et de déployer des algorithmes au sein des services publics.
Bonjour Pierre-Étienne Devineau.
Pierre-Étienne Devineau : Bonjour Jean-Philippe.
Jean-Philippe Clément : Merci d’être avec nous à distance.
Pierre-Étienne, parlez-moi d’IA. Si vous deviez expliquer à votre grand-mère ce qu’est Albert et ce sur quoi vous travaillez, comment pourriez-vous le résumer ?
Pierre-Étienne Devineau : Je dirais à ma grand-mère que c’est un logiciel qui vient lire des textes, essaye de les analyser et propose soit un résumé du texte soit de répondre à des questions sur le texte.
Jean-Philippe Clément : D’accord. Du coup, c’est quelque chose qui a été développé par la DINUM, c’est un projet DINUM. D’abord une expérimentation ?
Pierre-Étienne Devineau : Absolument. C’est une expérimentation qui cherche à repartir de ce qu’on appelle les modèles fondations, donc des modèles d’IA grand public et libres d’utilisation, pour les modifier en leur donnant à voir des données de l’administration, des documentations, des fiches techniques, etc., produites par les services publics, de sorte que cette IA va s’en imprégner et être en mesure de répondre à des questions sur cette base. On dit que c’est une expérimentation, puisqu’on a commencé à l’utiliser notamment dans ce qu’on appelle les maisons France services qui sont des sortes de guichets où les Français peuvent se rendre pour se faire aider dans leurs démarches administratives.
Jean-Philippe Clément : Vous avez commencé à le dire. Qu’est-ce que permettent de faire ces dispositifs techniques d’IA pour l’administration française ? C’est utile à quoi ? C’est pour quels types de grands cas, sans forcément rentrer dans les cas d’usage et dans les clients, mais par grandes catégories, en fait, ça permet de faire quoi ?
Pierre-Étienne Devineau : Par grandes catégories, tous ce que ces logiciels ont en commun c’est qu’ils permettent d’analyser des textes. Une fois qu’on est en mesure d’analyser des textes, on peut aussi générer d’autres textes, produire des textes. Les grands usages que nous avons derrière, c’est de pouvoir répondre à des questions sur la base d’une base documentaire de connaissances, sur certaines bases de connaissances. Vous fournissez tout un ensemble de sources d’information et l’algorithme va trouver, dans ces sources, le passage qui répond le mieux à votre question et vous proposer une petite synthèse de la réponse.
Une autre grande famille de cas d’usage, c’est de proposer des résumés : vous fournissez un document de plusieurs dizaines de pages et l’outil vous propose un résumé en une page, une demi-page, tout cela est paramétrable ; ou encore de prendre plusieurs documents, qui ont chacun leur plan, et proposer une sorte de synthèse qui les combine.
Jean-Philippe Clément : Du coup, au niveau des concours de la fonction publique, c’est bon, il n’y a plus besoin de réviser la note de synthèse, c’est désormais Albert qui fait les notes de synthèse de l’administration française ?
Pierre-Étienne Devineau : Non, heureusement non. Dans les deux cas, on parle d’outil d’aide, un outil d’aide à la rédaction et un outil d’aide à la recherche d’informations. Et c’est vraiment rassurant de voir comme un assistant se perfectionne petit à petit, mais n’aura jamais vocation à remplacer le travail de l’agent public, simplement de l’aider.
Jean-Philippe Clément : Du coup, vous lui avez quand même montré beaucoup de notes de synthèse, beaucoup de documents administratifs, et il va avoir la capacité de générer du texte sous cette forme-là, cette forme très significative de l’administration qui est très factuelle ? Il va pouvoir le faire dans la forme, il va quand même pouvoir respecter la manière de faire la note de synthèse ?
Pierre-Étienne Devineau : C’est l’exercice qu’on est en train de se donner, sachant que selon le service, il peut y avoir aussi différentes grandes cultures de la note de synthèse. On essaye donc de naviguer entre ces cultures pour apprendre un petit peu le substrat commun entre toutes ces notes.
Jean-Philippe Clément : Il y a des subtilités entre Bercy et les autres ministères, c’est ce que vous venez de dire ?
Pierre-Étienne Devineau : Pas forcément exactement entre Be4rcy et les autres ministères, mais il peut y avoir des subtilités sur le type de plan, sur la longueur. On essaye donc de partir avec quelques administrations pilotes pour faire ce premier un outil de notes de synthèse sur mesure avec elles et, ensuite, on va le généraliser.
Jean-Philippe Clément : Justement, si on fait un peu le tour de vos clients de l’expérimentation, ceux qui ont dit « OK, je veux bien partir tester ces outils-là », qui sont ces clients et comment, concrètement, utilisent-ils l’outil ?
Pierre-Étienne Devineau : Ce sont principalement des administrations de l’État central, même si on a quelques collectivités qui sont intéressées et qu’on embarque petit à petit, qui vont arriver. Les deux premières administrations avec lesquelles on a travaillé c’est l’Agence nationale de cohésion du territoire via le réseau des maisons France services.
Jean-Philippe Clément : C’est quoi les réseaux des maisons France services ? Ça sert à quoi en théorie ?
Pierre-Étienne Devineau : Les réseaux des maisons France services, c’est un ensemble de lieux soit fixes soit mobiles, il y a aussi des maisons France Services dans des bus, qui sont répartis sur le territoire et où les citoyens et citoyennes peuvent se rendre avec ou sans rendez-vous, ça dépend, pour se faire accompagner par des agents publics soit pour répondre à des questions que les citoyens ont, soit, carrément, pour faire les démarches administratives avec eux.
Jean-Philippe Clément : D’accord. Du coup, qu’apporte cet outil aux agents publics qui reçoivent ces publics ?
Pierre-Étienne Devineau : L’outil qu’on est en train d’expérimenter dans les maisons France services, est un outil qui est adapté aux situations où les citoyens ont pris rendez-vous et qui ont indiqué, au moment de leur prise de rendez-vous, qu’ils voudraient être aidés sur tel ou tel genre de choses. Donc on fournit, à Albert, la raison du rendez-vous et Albert prépare une fiche pratique en fournissant à la fois les informations clés pour répondre à la demande de l’usager et les liens pratiques vers le bon téléservice pour faire la démarche ou l’administration à contacter ou les questions associées, etc. À chaque fois, quand Albert fournit une réponse, l’exercice c’est qu’il puisse donner la source de sa réponse.
Jean-Philippe Clément : D’ailleurs, ce n’est pas courant en IA générative d’arriver à remonter sur une source potentielle.
Pierre-Étienne Devineau : Ce n’est pas courant, mais c’est de plus en plus courant. Ce processus a un nom anglais, ça s’appelle la <em<Retrieval-Augmented Generation, la génération augmentée par le fait de retrouver les informations, et ça marche en deux temps :
d’abord, vous prenez cette base de connaissances, donc cette base de documents, et vous l’analysez pour détecter ce dont parle chaque paragraphe. Puis vous enregistrez le sens, ce qu’on appelle la sémantique, donc vous enrichissez chaque paragraphe avec, on va dire, des étiquettes qui correspondent à ce dont il parle. Ensuite, quand vous venez poser des questions Albert, Albert va chercher dans toutes les étiquettes qu’il a fabriquées celles qui semblent les plus proches de votre question. Ce sont donc ces textes-là qu’il va relire au moment de répondre à votre question, il va donc vous répondre sur la base de ces extraits les plus pertinents.
Jean-Philippe Clément : Donc, dans ce cas-là, en fait l’IA sert d’assistant à l’agent public finalement en préparant le rendez-vous et ça permet, pendant le rendez-vous qui n’est pas forcément toujours très long, d’être très efficace sur la manière de répondre à la question de l’usager, voire de lui donner des éléments supplémentaires. C’est ça ?
Pierre-Étienne Devineau : Exactement. En fait, ça permet de gagner le maximum de temps sur la recherche d’informations pour consacrer le temps du rendez-vous à vraiment l’accompagnement de l’usager quand il a besoin d’aide pour faire la démarche en ligne, remplir les formulaires, etc. C’est donc passer moins de temps à chercher des informations et plus de temps à faire ensemble.
Jean-Philippe Clément : Et l’usager repart avec sa fiche rédigée par Albert ou pas ? Pas à ce point-là quand même !
Pierre-Étienne Devineau : Pas à ce point-là !
Jean-Philippe Clément : D’accord ! Est-ce qu’il y a d’autres cas d’usage ? Est-ce que vous avez d’autres clients publics qui viennent vous demander des choses en particulier avec Albert ?
Pierre-Étienne Devineau : Oui, bien sûr. Sur le sujet des notes de synthèse, le premier service avec lequel on a commencé à travailler, c’est la Cour des comptes. Maintenant, d’autres ont rejoint l’aventure.
Jean-Philippe Clément : En plus, ce sont des rapports de synthèse qui sont souvent costauds.
Pierre-Étienne Devineau : Qui sont tout à fait conséquents, mais qui ont le bon goût d’avoir des plans très clairs, très travaillés. Un des exercices, c’est de pouvoir repartir de rapports de chambres régionales des comptes pour essayer d’en faire une synthèse croisée. L’avantage, c’est qu’on peut fournir à Albert des exemples de rapports produits par les chambres régionales des comptes et du rapport national correspondant de la Cour des comptes. On montre un petit peu Albert comment l’exercice a été fait par le passé pour qu’il puisse, à son tour, aider à le faire. Sur le sujet, on est encore en phase expérimentale avec la Cour des comptes.
Jean-Philippe Clément : Du coup, Albert est quand même un bon assistant de la Cour des comptes ? Il a bien compris comment il fallait faire un rapport et comment il fallait le synthétiser ?
Pierre-Étienne Devineau : Il est en train d’apprendre, c’est un élève en formation.
Jean-Philippe Clément : C’est bien ! Vous êtes humble avec l’outil que vous développez. Je crois savoir que ça marche effectivement très bien !
Dans toutes ces données, dans tous ces rapports publics, il y a souvent des données nominatives et, du coup, c’est un peu sensible parce que ça veut dire qu’on donne à manger à l’IA pas mal de données où, à l’intérieur, il y a des noms et des prénoms de personnes, des noms de société. Comment gère-t-on, justement, le fait d’entraîner un modèle avec des données nominatives ?
Pierre-Étienne Devineau : C’est une excellente question qu’on est en train d’étudier avec la CNIL. Pour l’instant, le choix sur lequel on est parti, c’est d’essayer de distinguer deux phases : la phase de conception du modèle, la façon dont on alimente le modèle, et la phase où on l’utilise. Dans la phase où on alimente le modèle, on essaye de lui donner peu ou pas de données personnelles. Ça veut dire qu’on a une première étape où on va retirer de cette base d’exemples, de cette base qu’on appelle base d’apprentissage, les données personnelles via des règles qui permettent de les trouver et de les retirer au cas par cas.
À côté de ça, pour ne pas avoir de données personnelles, on a toute une stratégie où on crée des fausses données, c’est-à-dire des données qui ressemblent à des données authentiques, mais qui n’en sont pas, c’est ce qu’on appelle les données synthétiques, et les données synthétiques ne contiennent pas de données personnelles puisqu’elles sont sur des exemples factices, mais réalistes.
Jean-Philippe Clément : Et vous les générez avec de l’IA générative.
Pierre-Étienne Devineau : Exactement. Et là où ça devient amusant, c’est qu’on a des outils d’IA générative pour générer des exemples factices, mais réalistes, qu’on donne ensuite à manger Albert pour l’améliorer. C’est donc l’IA générative qui lui permet de s’améliorer elle-même.
Jean-Philippe Clément : On a fait un bon un bon premier tour d’horizon de vos clients, de vos usages.
Je vous propose qu’on fasse une petite pause musicale.
Garlaban, notre programmateur musical, voulait aujourd’hui vous remercier pour tous vos partages et toutes les informations que vous nous donnez. Il vous offre ce morceau A Token of gratitude, un signe de gratitude, de The Radio Dept.
Pause musicale : A Token of gratitude par The Radio Dept.
15’ 43
Jean-Philippe Clément : Merci The Radio Dept