Émission Libre à vous ! du 4 avril 2023
Titre : Émission Libre à vous ! du 4 avril 2023
Intervenant·e·s : Vincent Calame - Sylvain Corlay - Nicolas Thiery - Jean-Christophe Becquet - Laure-Élise Déniel - Marie-Odile Morandi - Étienne Gonnu - Frédéric Couchet à la régie
Lieu : Radio Cause Commune
Date : 4 avril 2023
Durée : 1 h 30 min
Page des références de l'émission
Licence de la transcription : Verbatim
Illustration : Déjà prévue
NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.
Transcription
Voix off : Libre à vous ! l’émission pour comprendre et agir avec l’April, l’association de promotion et de défense du logiciel libre.
Étienne Gonnu : Bonjour à toutes, bonjour à tous.
Si je vous parle de Jupyter, à quoi pensez-vous ? À l'écosystème de logiciels libres de calcul, évidemment ! Ce sera notre sujet principal de l'émission du jour, avec également au programme « Données libres et sobriété énergétique » et « À l’Éducation nationale, la voie se libère et la mécanique se met en place ».
Soyez les bienvenus pour cette nouvelle édition de Libre à vous !, l’émission qui vous raconte les libertés informatiques, proposée par l’April, l’association de promotion et de défense du logiciel libre.
Je suis Étienne Gonnu, chargé de mission affaires publiques pour l’April.
Le site web de l’émission est libreavous.org. Vous pouvez y trouver une page consacrée à l’émission du jour, avec tous les liens et références utiles et également les moyens de nous contacter. N’hésitez pas à nous faire des retours ou à nous poser toute question.
Nous sommes mardi 4 avril 2023. Nous diffusons en direct, mais vous écoutez peut-être une rediffusion ou un podcast.
À la réalisation de l’émission du jour, mon collègue Frédéric. Salut Fred !
Frédéric Couchet : Salut, bonne émission à vous.
Étienne Gonnu : Nous vous souhaitons une excellente écoute.
[Jingle]
Chronique de Vincent Calame sur « Données libres et sobriété énergétique »
Étienne Gonnu : Nous allons commencer par une nouvelle chronique de Vincent Calame qui nous propose, depuis cette sixième saison de Libre à vous !, ses réflexions sur le Libre et la sobriété énergétique. Aujourd'hui, « Données libres et sobriété énergétique ». Salut Vincent.
Vincent Calame : Salut Étienne.
Jupyter, un écosystème de logiciels libres de calcul autant qu’une communauté
Étienne Gonnu : Passons à notre sujet suivant. J’ai plaisir à laisser la parole aujourd’hui à Jean-Christophe Becquet, vice-président de l’April, qui va animer le sujet principal du jour avec ses deux invités. N’hésitez pas à participer à leur conversation au 09 72 51 55 46 ou sur le salon web dédié à l’émission, sur le site causecommune.fm, bouton « chat ». Alors Jean-Christophe, si j’ai bien compris, vous allez nous parler de Jupyter, mais il ne s’agira ni d’astronomie, ni de monarchie républicaine.
Jean-Christophe Becquet : Absolument : il va s’agir de logiciels libres, mes invités vous expliqueront. Jupyter est un logiciel de calcul scientifique et moi je ne connais rien au calcul scientifique. Donc l’objectif et la ligne directrice qu’on s’est donné pour cette émission, c’est vraiment de parler de Jupyter en tant que logiciel libre. Pour ça, j’accueille aujourd’hui Sylvain Corlay. Sylvain Corlay est le fondateur et dirigeant de l’entreprise QuantStack, qui est développeuse de logiciels de calcul scientifique. Il est également membre du conseil d’administration de la fondation ??? [12:40] qui soutient le développement de logiciels libres de calcul scientifique. Il nous expliquera dans le détail tout à l’heure. Et enfin, il fait partie des développeurs principaux - cordev ??? en anglais - du projet Jupyter.
Et puis Nicolas Thiéry, enseignant-chercheur, professeur d’informatique à l’université de Paris-Saclay. En fait, Nicolas, on ne se connaît pas depuis longtemps, mais par contre je sais qu’il a grandi dans le logiciel libre parce que, au début du siècle, j’ai fait des conférences avec son papa, Jean Thiéry, sur le logiciel libre. Donc voilà, je pense que Nicolas connaît très bien le logiciel libre depuis longtemps.
Pour commencer cette émission, je vais proposer à Sylvain et Nicolas de se présenter un petit peu plus longuement, avant de rentrer dans le vif du sujet d’aujourd’hui : l’écosystème Jupyter. Sylvain, deux mots de présentation ?
Sylvain Corlay : Bonjour et merci pour l’invitation. Donc, oui, je suis le président de la société QuantStack, une société française, un éditeur de logiciels libres, qui rassemble les mainteneurs de nombreux projets libres pour le calcul scientifique. On est basé en France, mais avec des salariés en France, en Allemagne, au Royaume-Uni et en Autriche. Par ailleurs, donc, un des directeurs, des membres du conseil d’administration de la fondation ??? [14:15], qui est une fondation pour le logiciel libre, un peu comme la fondation Mozilla, la fondation Linux ou Apache, mais spécialisée dans le calcul scientifique, et le logiciel pour le calcul scientifique. Et enfin, j’anime un meet-up en région parisienne qui s’appelle ??? [14:30], qui compte à peu près 4 000 membres, et on organise des séminaires tous les deux, trois mois environ en région parisienne.
Jean-Christophe Becquet : Merci, Sylvain. Nicolas ?
Nicolas Thiéry : Bonjour, Jean-Christophe, merci pour l’invitation. Donc, comme tu as dit, je suis tombé dans le Libre assez petit. Et en fait je suis retombé dedans un peu plus formellement dans les années 95, 96. Et assez rapidement, j’ai voulu essayer de combiner mes deux passions : d’un côté le logiciel libre, pousser le logiciel libre, et puis mes métiers, et donc, en l’occurrence, mon métier d’enseignant et de chercheur. Alors, ça a commencé avec la recherche, puisque je suis dans un domaine où on utilise beaucoup le calcul pour faire avancer les mathématiques, pour explorer. Et du coup, on a besoin de logiciels. Et j’ai trouvé que dans mon domaine on utilisait beaucoup de logiciels qui n’étaient pas libres, ce qui posait un certain nombre de problématiques, notamment en termes de compréhension de ce qu’on voulait faire avec. Et donc j’ai essayé d’animer et de pousser ma communauté à utiliser du Libre pour faire le calcul en mathématiques et notamment j’ai assez rapidement contribué à un logiciel qui s’appelle ??? [15:40].
Et plus tard, pour différentes raisons, pour des questions de changement de focus dans ce que je faisais dans mon métier - et puis aussi les questions de covid ont influencé là-dedans - je me suis intéressé tout particulièrement à l’utilisation, là encore développement et utilisation de logiciels libres, mais cette fois plus pour l’enseignement, avec notamment tout ce qui était infrastructures et logiciels qui peuvent accompagner l’enseignement de la programmation et du calcul.
Jean-Christophe Becquet : Merci, Nicolas. Mais alors du coup, si Jupyter n’est pas une planète, tu peux nous dire, en quelques mots compréhensibles par le grand public, ce que c’est ?
Nicolas Thiéry : Alors ça va être très rapidement, et après il faudrait en fait montrer des exemples pour vraiment rendre ça concret. Mais une première définition très rapide, c’est de dire que Jupyter est un écosystème de logiciels, dont pas juste un logiciel, mais toute une myriade de logiciels qui fonctionnent ensemble et dont l’objectif est d’aider à chaque fois qu’on veut faire du calcul, mais du calcul dans lequel on a de l’humain dans la boucle, donc avec une interaction très rapide avec l’humain. Pour essayer de rendre un peu plus concret : l’application phare s’appelle le Carnet numérique, d’autres, Sylvain appellera ça le notebook. L’objectif du carnet numérique, c’est de pouvoir écrire dans des documents dans lequel on va, non seulement pouvoir raconter des histoires, avoir de la narration, mais dans lequel on va aussi pouvoir faire du calcul, pouvoir faire de la visualisation, ou pouvoir interagir avec les objets qu’on est en train de calculer, et puis, lorsque c’est nécessaire, faire de la programmation. Et puis autour de tout cela, qui dit document, en fait il y a toute une variété de documents auxquels on peut penser, donc il y a une pléthore d’outils pour faire des livres, faire des diapos, faire des documents qu’on peut distribuer en TP, des services en ligne pour faciliter l’accès à tout ceci.
Jean-Christophe Becquet : Alors Jean-Christophe, Fred me fait marquer, parce que ce n’est pas évident à l’oral, mais Jupyter s’écrit avec un Y et non pas un I. Donc, si vous le cherchez, notamment sur un moteur de recherche, tapez avec un Y, vous le trouverez plus facilement.
Nicolas Thiéry : Et j’expliquerai juste après pourquoi.
Jean-Christophe Becquet : Merci. Et donc ce que j’ai compris en discutant avec vous, c’est que Jupyter est un écosystème de logiciels extrêmement utilisé : plusieurs millions, dizaines de millions d’utilisateurs. Donc, pour commencer l’émission, je propose qu’on passe un peu en revue les différents champs d’utilisation de Jupyter. Et pour commencer, dans le champ de la recherche, dans ce domaine qui est le tien, Nicolas, du coup Jupyter est très utilisé.
Nicolas Thiéry : Le gros intérêt, et notamment donc du carnet, c’est sa flexibilité, c’est le fait d’avoir un unique outil qui va permettre de faire un petit peu tout le champ de travail, dans lequel on va pouvoir réfléchir, dans lequel on va pouvoir calculer, dans lequel on va pouvoir transmettre. Et donc ça, ça va permettre d’accompagner toutes les étapes de la recherche, que ce soit les phases d’exploration où on ne sait pas du tout ce qu’on va faire, et on prend des objets, on calcule avec, on voit ce qui en sort, on va vouloir observer des phénomènes. Et puis, après ces phénomènes, on va voir et transcrire, notamment avec des carnets de laboratoire, et puis ensuite interpréter ça, garder des notes au fur et à mesure de ce qu’on fait, et puis aller jusqu’à la publication et la transmission. Et le fait de pouvoir garder ce lien, non seulement entre un calcul et une narration, et de pouvoir choisir à toute étape un peu où on place le curseur entre les deux, donne beaucoup de souplesse.
Jean-Christophe Becquet : Et c’est nouveau, ce concept de carnet numérique ou notebook en anglais ?
Nicolas Thiéry : Alors pas du tout. De mon point de vue, je l’ai découvert au début de ma thèse, en 1994, donc, ça remonte déjà. Et puis déjà à l’époque c’était quelque chose qui n’était pas nouveau. Ce qui va être vraiment nouveau, c’est que, à l’époque, il y avait le système de calcul Maple, qui avait son système de carnet numérique, et puis il y avait le système de calcul Mathematica, qui avait son carnet numérique, et puis MATLAB, qui avait son carnet numérique, et puis, etc., etc. Donc, chaque système dans son coin avait développé un petit peu cet outil. Et là ce qui a vraiment évolué, c’est le fait que, grâce au logiciel libre, et en mettant un gros accent sur l’interopérabilité, il y a toute une communauté qui s’est mise ensemble pour développer un outil qui pouvait fonctionner, non pas avec un système, mais avec une collection de systèmes.
Et donc, on a mentionné tout à l’heure le nom de Jupyter, on se demandait : pourquoi un Y dans Jupyter ? Tout simplement parce que le nom vient de Julia, Python, PY, et R qui est un autre système de calcul statistique.
Et puis maintenant, depuis Jupyter, on peut interopérer avec C++, avec à peu près tous les langages existants. Donc ça permet vraiment au chercheur de ne pas avoir à réinventer, re-comprendre une interface différente à chaque fois qu’il veut passer d’un système de calcul à l’autre, et puis de focaliser tous les efforts, tout ce qui est un petit peu alternatif : tiens, je vais faire un bouquin, tiens, je vais faire des diapos, on n’a pas besoin de chacun refaire son système dans son coin. On peut juste utiliser les mêmes infrastructures.
Sylvain Corlay : Ah, et puis après, un autre gros facteur qui a fait que ça a vraiment explosé par rapport aux usages avant, c’est que ça ouvre toute une porte sur toute la masse de logiciels libres qui s’est développée au niveau du calcul. Et là, on peut dire qu’en vingt ans, trente ans, il y a vraiment une révolution entre une époque où à peu près tout était verrouillé dans MATLAB, Mathematica, etc., et puis maintenant où on peut, sauf dans les domaines très pointus, faire à peu près tous les calculs que l’on souhaite, entièrement en Libre.
Jean-Christophe Becquet : Tu parles de cette époque où tout était verrouillé ? Et tous les trois on s’est rencontrés dans un événement qui s’appelait les Open Science Days, les journées pour la science ouverte, qui s’est déroulé au mois de décembre dernier à Grenoble. Là, j’ai entendu vos interventions, j’ai beaucoup aimé la façon dont vous parliez de cet écosystème de logiciels libres, Jupyter, et notamment les liens que vous faites entre le logiciel libre et la science ouverte. Sylvain, logiciel libre, science ouverte, pour toi, ça marche ensemble, tu peux nous expliquer ?
Sylvain Corlay : Oui. Je pense que dans la science plus que dans n’importe quel autre domaine, le fait que le logiciel soit ouvert est particulièrement important, parce qu’il y aurait une contradiction vraiment intrinsèque entre le fait d’essayer de mieux comprendre la nature et de mieux comprendre le monde dans lequel on vit, et le faire avec des outils fermés. En plus de cette contradiction presque épistémologique, le fait d’utiliser des logiciels libres permet d’adresser une très grande quantité de cas d’usage, une très grande diversité de cas d’usage qu’on rencontre moins dans d’autres domaines que dans les sciences, parce que dans les sciences, on va très vite s’attaquer, dans différents laboratoires de recherche, à des questions très spécifiques qui ne seront sans doute pas aussi facilement adressables avec des logiciels fermés, peu extensibles, peu interopérables. Je pense que le logiciel libre est particulièrement important pour les sciences, et d’ailleurs ça fait vraiment partie de l’ADN de la recherche, depuis même longtemps avant le mouvement du logiciel libre.
Jean-Christophe Becquet : Alors, il y a une notion de transparence, il y a une notion aussi, peut-être, de réplicabilité des calculs qui sont faits avec un logiciel libre ? Nicolas, dans ta pratique de chercheurs, c’est quelque chose qui va de soi ?
Nicolas Thiéry : Qui ne va pas forcément de soi. C’est un problème difficile et, en fait, c’est un vrai domaine de recherche, sur comment est-ce qu’on peut arriver jusqu’à la reproduction parfaite. Mais le point, là, et on va retrouver la bonne vieille analogie à propos du logiciel libre, que c’est bien d’avoir un gâteau, mais ce qui nous intéresse, c’est d’avoir la recette du gâteau pour pouvoir refaire le gâteau, pour pouvoir adapter le gâteau, pour pouvoir changer sa recette et la distribuer aux autres. Et là, en fait, on est dans les cas où on est souvent sur des problèmes très techniques, où ça serait de la haute cuisine, l’équivalent. Et la recette, c’est bien, mais ça ne suffit pas, il faut aussi les tours de main. Comment est-ce qu’on fait ? Il ne suffit pas d’avoir juste une description rapide de quelles vont être les différentes étapes, mais on a vraiment besoin d’avoir tous les éléments qui permettent de reproduire le calcul.
Et c’est là où les carnets numériques sont un bout de la solution. Alors, il y a plein de problématiques qui se posent et ça ne résout pas toutes les problématiques, mais au moins ça permet de donner une solution aux problèmes de Je veux donner une description complète du calcul qui va être mené, en l’expliquant pour qu’un humain puisse comprendre ce qui s’est passé et en le comprenant, du coup pouvoir l’adapter. Mais en même temps, je veux que la même description soit compréhensible par un ordinateur, pour que l’ordinateur puisse relancer l’intégralité du calcul. Donc, ce qu’apporte vraiment le carnet numérique, c’est de pouvoir entremêler les deux. Là encore, ce n’est pas une idée nouvelle, on est autour des questions qui avaient commencé avec le ??? computing, les ??? [24:00] programming à l’époque et maintenant le ??? computing. Mais c’est vraiment cette question d’arriver à mêler quand on parle à l’humain et quand on parle à la machine, pour qu’après l’humain puisse reprendre et réadapter et reproduire complètement.
Jean-Christophe Becquet : Des programmes informatiques avec des sous-titres en langage humain, en quelque sorte.
Nicolas Thiéry : Exactement. Ou des programmes humains avec des sous-titres à l’ordinateur. Les deux sont mêlés. À l’origine du ??? programming, il y a des personnes dont une des citations était : un programme est conçu d’abord pour parler à un humain et, incidemment, éventuellement, pour être exécuté par une machine. Mais on est vraiment en train de parler un humain et de transmettre l’information à une machine.
Jean-Christophe Becquet : Génial. Alors dans cet événement, les Open Science Days, qui se déroulaient sur le campus de Grenoble, dans l’auditoire il y avait des universitaires, des enseignants chercheurs, des ingénieurs de recherche au CNRS, des doctorants à l’INRIA. Donc voilà : un auditoire très académique. mais en fait, ce que vous m’avez expliqué à la pause, c’est que Jupyter, on le rencontre aussi énormément dans l’industrie. Et ça c’est ton domaine, Sylvain, tu connais bien ce champs-là. Est-ce que tu peux nous parler un petit peu de l’utilisation de Jupyter dans le monde industriel ?
Sylvain Corlay : Oui, bien sûr. Jupyter est vraiment venu du monde académique. Les fondateurs du projet, Fernando Pérez et ??? [25:33] ont essayé de résoudre un problème qu’ils avaient dans le contexte de la recherche, et d’avoir une version plus interactive de ce qu’on appelle les carnets de recherche, qu’on trouve souvent en sciences physiques, qui sont ces sortes - littéralement - de cahiers dans lesquels les gens notaient leurs résultats, faisaient des petits dessins et des figures. Il y a une vraie filiation entre les premiers carnets de recherche de Galilée quand il a justement découvert les lunes de Jupiter, et les carnets numériques de Jupyter avec un Y, l’objet qui nous intéresse aujourd’hui.
En résolvant ce problème de l’interactivité et de la création d’un carnet numérique interactif, ils ont en fait aussi résolu un problème qui se posait beaucoup pour les ingénieurs. En fait, il y a une vraie dichotomie entre un informaticien qui serait en train d’implémenter une solution relativement connue d’une façon déterminée - par exemple je dois implémenter un certain protocole de communication - et un ingénieur plus proche de la recherche comme un data scientist qui a un objet qu’il étudie, comme un dataset ou un jeu de données qui serait relativement inconnu, et dans lequel il esaie de trouver des corrélations et qu’il essaie de mieux comprendre. Et dans l’interactivité, dans le genre de travail qu’il doit faire, en fait, il y a une part importante d’interactivité : on veut essayer quelque chose, tracer une figure, se rendre compte qu’on s’est trompé, et vite pouvoir itérer et améliorer ce qu’on fait. Le calcul interactif, c’est un métier très différent du développement logiciel, finalement, et cet outil, qui avait été fait par des chercheurs et pour des chercheurs, s’est avéré être extrêmement utile en data science en particulier. Et aujourd’hui c’est vraiment devenu une des solutions principales. Par exemple, pour les plus visibles, les géants du numérique comme Google, Amazon, ont leurs principales plateformes de data science basées sur Jupyter. Donc, avec Google, ???, Amazon ???, [27:30] Microsoft également, ce ne sont pas les seuls, en fait : finalement, la plupart des grandes entreprises qui embauchent et qui emploient des data scientists et des ingénieurs, finalement, ont des déploiements divers et variés de variations autour de Jupyter, en interne. Donc dans nos estimations actuelles on compte dans les dix, quinze millions d’utilisateurs : plus de la moitié d’entre eux sont en fait des professionnels et pas des gens du milieu académique.
Jean-Christophe Becquet : Oui, alors en effet, si les géants du numérique sont prescripteurs de cet écosystème logiciel Jupyter, on comprend bien pourquoi on arrive à avoir des millions ou dizaines de millions d’utilisateurs. Vous nous direz plus tard si ces utilisateurs permettent aussi d’avoir des contributeurs en nombre suffisant pour assurer la maintenance et le développement de Jupyter.
Mais avant ça, j’aimerais qu’on parle un petit peu de Jupyter comme outil pédagogique, Jupyter dans l’enseignement. Alors, Nicolas, tu es prof, passionné, je crois, de formation à l’informatique, au code. Est ce que tu peux nous parler de Jupyter dans l’enseignement ? Et peut-être dans les différents degrés de l’enseignement, de l’élémentaire au secondaire, en passant par le supérieur ?
Nicolas Thiéry : En fait, on va retrouver exactement ce qu’a mentionné Sylvain juste avant : c’est le fait que, habituellement, quand on parle de développement logiciel, on a d’un côté les développeurs de l’outil qui ont l’expertise, la connaissance, etc. Et de l’autre côté, les utilisateurs. Et la force de Jupyter c’est justement d’avoir cette flexibilité qui fait qu’on peut à la fois être du côté « j’écris du code » ou du côté « j’utilise du code, je le modifie ». C’est exactement ce que l’on veut dans le cadre d’un enseignement. On va avoir l’enseignant expert qui va concevoir du matériel, qui va pouvoir le faire parce qu’il a une vision globale, qui va pouvoir transmettre ce même document à d’autres enseignants qui n’ont peut-être pas la même compétence mais qui vont pouvoir suivre ce qui est fait, qui, eux-mêmes, vont pouvoir le passer aux étudiants, qui, au début, vont pouvoir utiliser des feuilles toutes faites. Donc, au départ, ils vont juste lire un document, et puis ce document va les inviter à faire des petites modifications, explorer - tiens là il y a un petit exercice à faire. Et puis au fur et à mesure, on va pouvoir guider l’étudiant pour qu’il soit de plus en plus autonome, qu’il soit en capacité, parce qu’il a acquis l’expertise et la compréhension, de pouvoir lui-même rédiger ses propres demandes, gérer ses propres calculs.
Donc, on a commencé à déployer ça en 2017 à Paris-Saclay, pour des cours de calcul, pour des cours de programmation. Le gros progrès, c’était vraiment d’autonomiser les étudiants. Notamment parce qu’avant on avait un peu cet effet où d’un côté, ils avaient le sujet de TP, de l’autre côté, ils avaient la feuille où ils avaient une action à faire, et puis éventuellement un terminal où ils pouvaient taper. Et rien que le fait de passer d’une zone à l’autre, ils se perdaient. Donc là, avec un document, on peut arriver à donner une trame narrative que l’étudiant va suivre. En plus, on rentre en plein dans le mode de fonctionnement : je scrolle, scrolle, scrolle sur WhatsApp, TikTok, etc. Donc, ils sont dans un mode où je parcours un document de manière linéaire, ils ont vraiment cette habitude, ce cadre-là. Donc ils peuvent suivre un document. Mais après, dans ce document, ça n’est pas juste un document à lire où on risque de se perdre, ou juste de scroller et de passer à autre chose, on peut introduire de la micro scénarisation avec : là, hop, on s’arrête ; là, il y a un petit calcul à faire ; là, je t’ai donné une ligne de code, mais elle ne marche pas, est-ce que tu peux la changer ? Là, tiens juste en dessous, faudrait faire ce petit calcul. Ou bien là, fait quelque chose et je vais te dire si c’est bon : ah non, ça n'est pas bon, je te mets un gros signal rouge et peut-être ce serait le moment de faire une pause et de réfléchir.
Donc, on a vraiment cette possibilité de donner le document. Donc, en début de TP on leur donne un paquet de documents, et après, les étudiants, en fait on leur dit : avancez en autonomie, à votre vitesse. Ça, c’est super important chez nous, notamment avec l’arrivée de NSI, qui fait qu’on a chez nous, dans nos...
Jean-Christophe Becquet : NSI ?
Nicolas Thiéry : NSI, c’est l’enseignement au lycée « Numérique et sciences de l’information », les enseignements d’informatique en très court. Et donc je suis dans une formation maths info, et une grosse difficulté, c’est qu’on a des étudiants qui ont suivi ça et d’autres non, et donc il y a un différentiel de niveau qui est vraiment considérable. Et donc là, le fait de pouvoir donner des documents et de dire aux étudiants « Allez à votre vitesse », ça permet à ceux qui sont à l’aise d’aller à toute vitesse et de venir rapidement aux choses plus avancées, et puis à ceux qui ont plus de difficultés de pouvoir prendre leur temps. Et du coup, moi, mon rôle d’enseignant est très différent : ce n’est pas « faites ça, faites ça, faites ça ». C’est plutôt, je surveille comment ça se passe et j’essaye de voir ceux qui avancent. Et comme les étudiants sont autonomes, parce qu’ils ont en gros toute l’information sous la main, je suis beaucoup moins souvent interrompu par « Monsieur, je suis bloqué, je sais pas quoi faire », etc. Et ce temps qui est libéré, ça me permet de repérer ceux qui ont le plus besoin, cette séance-là, pour n’importe quelle raison, et de m’asseoir à côté d’eux, et je peux décider de passer vingt minutes à côté d’un étudiant juste pour aider cette séance-là, sans difficulté, en ayant un groupe de trente étudiants. Donc ça, c’est vraiment quelque chose qui nous a beaucoup apporté. On s’attendait à ce que ça arrive, mais on n’était pas sûr. On a vraiment repéré que ça marchait bien. Et puis, donc, du coup, on a discuté avec d’autres collègues, ça s’est réparti. Donc maintenant, on a des collègues en géosciences, même endroit, en physique, en biologie, etc. qui utilisent les mêmes outils, là encore, pour accompagner du calcul.
En voyant ça, on s’est dit : bon, ça a l’air d’être bien utile à l’université, depuis la licence jusqu’au master, doctorat, puis après la recherche. On se disait peut-être que justement pour l’enseignement de NSI, ça pourrait être intéressant. Mais ça restait : Tant que je n’ai pas vu des étudiants fonctionner avec un outil, je ne crois pas que ça marche. Ce qui m’a convaincu que ça pouvait être pertinent, c’est qu’il y a eu une initiative de l’académie de Paris, qui a été rejointe ensuite par l’académie d’Orléans, qui a été de déployer un service Jupyter pour les lycées. Et donc ça fait deux ans et demi qu’ils ont commencé. En deux ans et demi, ils en sont maintenant à 500 000 utilisateurs.
Jean-Christophe Becquet : Donc ça, c’est le projet Capytale, aussi avec un Y, pour Python.
Sylvain Corlay : C’est ça exactement, le projet Capytale. Il n’y a pas eu de campagne massive d’information, il y avait un besoin, notamment du fait de l’introduction des NSI. Et voilà : maintenant chaque semaine ils ont 100 000 visiteurs qui reviennent, donc 100 000 étudiants, élèves des lycées qui l’utilisent.
Jean-Christophe Becquet : Donc est-ce qu’on peut dire en quelque sorte que le Notebook est un outil qui réunit, dans un environnement unique, à la fois le support de cours, le tutoriel, à la fois des exercices, mais qui, en plus, va être interactif au sens où il va permettre aux étudiants d’expérimenter par eux-mêmes différents scénarii, différentes hypothèses. Et, comme tu l’as dit précédemment, ça permet de faire, du coup, de l’individualisation, d’adapter vraiment le support d’enseignement au rythme, au niveau et aux attentes de l’étudiant ?
Sylvain Corlay : Exactement. Et le tout, donc, avec un système qui, en fait, est très léger ; en termes de ce qu’il impose, c’est très souple : c’est vraiment l’enseignant qui décide, tiens là ça va être avec des diapos. Mais finalement ces diapos, les étudiants peuvent travailler en autonomie chez eux parce que, par exemple, l’étudiant est à l’hôpital et ne peut pas venir en cours.
Voilà, il y a toute cette souplesse et, accessoirement, ce sont aussi des outils qui sont basés sur les technologies web, et donc ça veut dire que moi, quand je fais un calcul, peut-être que le calcul se fait sur ma machine, ou bien il se fait sur le serveur de la fac parce que je suis chez moi et que je n’ai pas les outils sur ma machine. Ça s’offre à une quantité de scénarios, ça me permet d’accéder à des ressources de calcul qui sont sur un centre de calcul à un endroit. Donc c’est vraiment toute cette flexibilité.
Jean-Christophe Becquet : Et j’imagine qu’au moment de la crise sanitaire, ces outils très adaptés pour l’enseignement à distance ont dû être bienvenus.
Nicolas Thiéry : Exactement. C’est l’occasion où, en fait, on a réécrit beaucoup de nos documents pour, justement, notamment, le truc qui ne marchait vraiment pas pendant la crise sanitaire, c’était l’équivalent des amphis : se mettre devant un ordinateur avec, potentiellement, peut-être 300 étudiants. On n’a aucune idée de ce qui se passe derrière, ça ne marchait juste pas. Donc, là, ce qu’on a fait, c’est vraiment rebasculer les documents sous forme, pour qu’ils travaillent en autonomie, et donc les séances d’emphi, en fait, ils lisaient les documents et me posaient des questions. Alors répondre aux questions de 150 étudiants qui travaillent en parallèle, c’était intéressant, c’est un joli challenge, mais voilà, on devine, c’était beaucoup plus vivant que tout ce qu’on peut faire de manière frontale qui ne marchait juste pas.
Jean-Christophe Becquet : Super. Donc, on parle de dix, quinze millions d’utilisateurs de l’écosystème logiciel libre Jupyter, dans le monde de la recherche, dans le monde de l’industrie, dans l’enseignement. On est l’April, et donc moi, j’ai envie de te demander, Nicolas : Jupyter, c’est un logiciel libre, mais pourquoi c’est important ?
Nicolas Thiéry : Alors c’est un logiciel libre, mais en fait, il faut surtout le penser - c’est une communauté, c’est des individus. Des individus du monde entier. Donc, ça a commencé aux États-Unis, mais maintenant c’est en Europe, c’est vraiment dans le monde entier.
Ça a commencé par la recherche, mais aussi les enseignants, des associatifs, des personnes dans les sociétés, dans les banques... Et donc tous ces gens-là qui, à priori, sont dans des univers complètement différents, ou même au niveau recherche - pensez physiciens, biologistes, etc. - des gens qui n’ont pas forcément l’habitude de se parler, qui se sont mis ensemble parce qu’ils avaient un besoin commun, et ce besoin commun c’était le fait de pouvoir faire du calcul avec l’humain au mieux. Ce besoin de calcul interactif.
Et ça, ça a été possible grâce aux logiciels libres, bien sûr, parce qu’il faut un pot commun, et pour formaliser ce pot commun, que l’on ne se pose pas sans arrêt les questions de propriété intellectuelle : oh non, je ne vais pas utiliser ça parce que c’est développé par telle boîte qui risque de me poser tel type de conflit. Donc, logiciel libre est très important, mais tout aussi important, il y a eu un effort énorme en termes de standardisation, par exemple pour le format du carnet Jupyter, pour que, certes il y a les outils de la communauté Jupyter, mais lorsqu’on écrit un carnet, ce carnet peut être importé dans plein d’autres outils qui sont développés par des gens qui sont dans d’autres communautés. Et ça se passe bien parce que, justement, le coeur, ça n’est pas tellement le fait de faire un carnet, mais ça a été de définir le format dans lequel on peut écrire un carnet. Donc, c’est devenu une sorte de lingua franca.
Jean-Christophe Becquet : Ça me fait penser à Open Document qui est connu pour être le format d’échange des fichiers de la suite bureautique Libre Office, mais qui, en fait, est un format de fichier ouvert qui est parlé par plusieurs centaines de logiciels libres parce qu’il est ouvert. Libre Office est le plus connu et le plus répandu, mais aujourd’hui, il y a plusieurs dizaines de logiciels qui utilisent le format Open Document. Est-ce qu’il se passe la même chose avec le format des DocBooks, Sylvain ?
[38:20]
Sylvain Corlay : Oui, absolument. Le format des DocBooks est très populaire et il y a même de nombreuses solutions propriétaires qui l’ont adopté comme nativement. Mais au-delà même du format de fichier, toutes les couches logicielles, les technologies qui composent Jupyter sont en fait spécifiées par leur interface, au sens : les protocoles de communication, les formats de fichiers qui sont supportés, les schémas des messages dans les protocoles, qui permettent à tout un chacun, en fait, de remplacer une seule partie de cette pile technologique et d’utiliser le reste. Par exemple Github, donc la solution de partage et de collaboration, aujourd’hui possédée par Microsoft, fait le rendu nativement des Notebooks de Jupyter en ligne dans leur interface graphique.
Jean-Christophe Becquet : Donc c’est un peu comme Internet, en fait : des briques avec des formats ouverts et des protocoles standardisés qui communiquent ensemble, et je peux remplacer n’importe quelle brique ou rajouter ma propre brique et la connecter avec l’écosystème, si elle respecte les protocoles standards ouverts et accessibles à tous.
Sylvain Corlay : Exactement. Un des buts, c’était vraiment de définir, en quelque sorte, le HTTP du calcul scientifique, comment on interagit avec un interpréteur d’un langage de façon standardisée, indépendamment du langage. Et toute l’infrastructure, en fait, a été conçue, d’abord par une spécification et ensuite une implémentation. Une spécification, c’est-à-dire comment ce nouveau composant va interagir avec le reste de l’écosystème.
Jean-Christophe Becquet : Je crois que vous nous avez fait comprendre que Jupyter, en fait, c’est bien plus qu’un logiciel. C’est un logiciel, mais c’est aussi des protocoles, des standards ouverts de fichier d’échange. C’est aussi une communauté d’utilisateurs, de contributeurs dont la diversité fait aussi la richesse, je crois.
Le moment est peut-être venu de la pause intermédiaire.
Étienne Gonnu : On peut faire une pause musicale, mais avant la pause, je vais quand même relayer deux questions, parce que moi je trouve ça passionnant, votre échange, et apparemment Marie-Odile aussi, qui nous suit sur le salon web de l’émission. Alors, une première question, elle demande : peut-on trouver des exercices Jupyter en ligne ?
Sylvain Corlay : Ça commence à se structurer. Si elle regarde sur Capytale, un projet de déploiement Jupyter pour le scolaire : une des grandes forces, ça a été justement, très rapidement, non seulement de donner la possibilité d’accéder à ces outils en ligne, mais aussi de définir une bibliothèque qui ont permis aux enseignants d’échanger. Et ça, ça a été très important, notamment dans le cas de nouveaux enseignements type NSI, parce que, parmi les enseignants, il y avait des experts qui ont développé leurs propres cours, mais il y avait aussi beaucoup d’enseignants qui se sont retrouvés du jour au lendemain à dire : jusqu’ici, vous enseigniez les maths, la technologie, et demain, vous allez enseigner la programmation. Et donc là, le fait d’avoir cette bibliothèque, c’est quelque chose qui était vraiment essentiel dans cette réussite. Après, il faudrait passer à la même chose, mais plus ouvert et plus large. C’est en train de se structurer. Pour le moment, on trouve des millions de carnets Jupyter : ce qui manque un peu, c’est les outils pour les chercher et les trouver plus facilement, les indexer.
Jean-Christophe Becquet : Ce qu’on peut convenir, c’est qu’après l’émission tu nous communiqueras tes meilleurs liens vers les ressources les plus pertinentes, et on les mettra sur le site de l’émission sur Libreavous.
Sylvain Corlay : Avec grand plaisir. Et ce qui va aller aussi avec : on a mentionné les Journées du Libre éducatif, qui ont eu lieu il y a un an. Les prochaines sont dans deux jours et, justement, une des choses qui va être discutée, c’est des plateformes pour pouvoir plus facilement partager des communs numériques pour l’éducation.
Jean-Christophe Becquet : Elles ont lieu à Rennes, on en parlera effectivement en fin de la mission.
On va faire la pause musicale. Après la pause musicale, je relayerai la seconde question de Marie-Odile, mais là, effectivement, je pense qu’il est temps de se reposer un peu les méninges avant de se replonger dans ce sujet passionnant. Je vous propose d’écouter ??? par ???, et on se retrouve dans environ trois minutes. Belle journée à l’écoute de Cause Commune, la voix des possibles.
Deuxième partie
Étienne Gonnu : Je suis Étienne Gonnu de l’April. Jean-Christophe Becquet, vice-président de l’association et ses invités, Sylvain Corlay et Nicolas Thiéry, nous parlent de Jupyter, avec un « y », un écosystème de logiciels libres de calcul et une communauté.
N’hésitez pas à participer à notre conversation au 09 72 51 55 46 ou sur le salon web dédié à l’émission, sur le site causecommune.fm, bouton « chat ».
Lors de la première partie de cet échange il a été question de science ouverte. Je vous invite à écouter ou lire l’émission 130 de Libre à vous ! dont le sujet principal portait justement sur la science ouverte.
Avant la pause j’évoquais des questions d’une de nos auditrices, Marie-Odile, qui avait une deuxième question, à propos des GAFAM – Google, Amazon, Facebook, Apple, Microsoft – que vous nous avez décrits comme utilisant également Jupyter : elle demande s’il s’agit de passagers clandestins ou s’ils participent à la communauté.
Sylvain Corlay : Je vais répondre à cette question. On ne va pas distribuer les bons et les mauvais points. Disons que des géants du numérique contribuent significativement au projet. Bloomberg, en particulier, a employé pendant de nombreuses années plusieurs contributeurs et mainteneurs du projet et a même, finalement, été à l’origine de la nouvelle interface graphique de Jupyter, JupyterLab, qu’ils ont décidé de développer, en partenariat avec le projet, de façon libre depuis le début.
Netflix a également eu pendant de nombreuses années plusieurs salariés qui contribuaient au projet Jupyter quasiment à plein temps.
Aujourd’hui Google Colab utilise une base de Jupyter, mais, disons, interagit moins avec la communauté, le fait un petit peu de façon isolée. Un très bon élève c’est actuellement AWS, donc Amazon, on ne les voit pas souvent comme des bons élèves en interaction avec le logiciel libre, avec les différents débats qu’il y a eu avec certains projets qu’ils déployaient en étant en compétition avec les sociétés qui avaient édité ces logiciels. En l’occurrence, dans le cas de Jupyter, il y a toute une équipe de développeurs qui travaillent à plein temps sur le projet dans le cadre de leur plateforme de data science qui s’appelle Amazon SageMaker.
Voilà. C’est assez variable, ce n’est pas toujours corrélé avec leur utilisation, l’ampleur de leur utilisation, malheureusement.
Jean-Christophe Becquet : Justement, dans cet écosystème de géants du numérique, ton entreprise, Sylvain, QuantStack, si j’ai bonne mémoire, ce sont 23 salariés.
Sylvain Corlay : On n’est pas encore un géant du numérique !
Jean-Christophe Becquet : Comment travaillez-vous au milieu ou à côté de ces géants, comment faites-vous votre place ? En fait, pour poser la question plus crûment : comment gagnez-vous de l’argent avec du logiciel libre ?
Sylvain Corlay : C’est une excellente question, c’est une question que je me pose beaucoup moi-même. Oui, effectivement, QuantStack est l’éditeur notamment de Jupyter. Parmi les 23, l’équipe compte entre 10 et 15 personnes qui contribuent significativement, qui consacrent une part importante de leur temps à Jupyter, toute la journée, tous les jours. On écrit du logiciel gratuit. Nos clients sont typiquement des grandes organisations qui dépendent fortement de ces technologies, soit dans les produits qu’elles éditent, qu’ils font, soit dans leur fonctionnement interne, qui vont faire appel à nous pour développer des nouvelles fonctionnalités, pour leur fournir du support commercial, les aider quand elles rencontrent des difficultés, parfois même pour déployer, créer des extensions, etc.
Je dirais que 99 % du code qu’on écrit est libre et open source. Quand on doit faire des choses qui ne sont pas libres, généralement c’est simplement parce que c’est complètement ad hoc, sur mesure, spécifique à un client et que ça n’aurait aucun intérêt : quand on doit faire un adaptateur pour un schéma de données propre à une entreprise et qui n’est vraiment utilisé par personne d’autre, on va leur faire leur petit plugin. Je dirais que l’énorme majorité des choses qu’on fait est libre et open source.
Jean-Christophe Becquet : Du coup, ça me donne envie de te questionner un petit peu plus en profondeur sur la gouvernance du projet. Comment un petit acteur comme QuantStack, quelques dizaines de personnes, peut arriver à discuter d’égal à égal avec Bloomberg, Amazon et d’autres géants du numérique ?
Sylvain Corlay : Dans certains cas, ces géants sont nos clients, dans d’autres cas, pas. En fait, la gouvernance du projet est vraiment une question complexe. Le projet Jupyter n’a pas été démarré par QuantStack, il a été démarré par des chercheurs et des professeurs aux États-Unis. Il y a plusieurs parties prenantes au développement du projet : à la fois des salariés dans les grandes sociétés, d’autres sociétés de conseil similaires à QuantStack mais pas en France, aux États-Unis, et nous. La gouvernance reflète, en fait, cette diversité d’acteurs.
Jean-Christophe Becquet : N’y a-t-il pas des conflits d’intérêt entre tous ces gens ?
Sylvain Corlay : Si, bien sûr. La façon dont la gouvernance du projet s’attaque à ce problème, c’est que chacun doit déclarer ses intérêts. Pour chaque décision, si la personne a un intérêt dans cette décision, elle doit le dire et c’est aux autres de déterminer s’il y a un conflit d’intérêt. C’est justement particulièrement important qu’on puisse partager, parfois, l’existence d’une relation commerciale, simplement du fait, dans un choix technologique – est-ce qu’on va utiliser une librairie A versus librairie B ? – qu’on ait déjà des billes dans l’une des deux, etc. Il faut absolument être transparent quant à ses intérêts dans ce genre de conversation.
Jean-Christophe Becquet : En tout cas, tu as l’air de dire que ce n’est pas parce qu’il est question d’argent que ça remet en cause le caractère libre des logiciels qui sont développés et que ça pose des problèmes. Ça peut poser des questions, mais, apparemment, vous avez des outils pour résoudre ces questions, notamment la déclaration des intérêts par chacun au moment de prendre les décisions importantes pour le projet.
Sylvain Corlay : Oui, absolument. Parfois, il peut y avoir aussi des intérêts entre les différentes personnes des comités, etc. Par exemple, l’un peut être l’employé de l’autre, peut chercher à être employé par l’autre. Toutes ces choses sont évidemment mouvantes et complexes, on est, finalement, dans une relativement petite communauté et les gens changent d’affiliation, travaillent ensemble, sont amis ou ne s’aiment pas. C’est le monde réel avec les relations sociales telles qu’elles sont. Il faut donc naviguer dans ces complexités-là.
Finalement, c’est beaucoup plus complexe qu’une société qui aurait une hiérarchie et une personne qui décide tout en haut : il faut atteindre et obtenir un consensus. De cette expérience j’ai appris que la transparence a beaucoup d’atouts, parce qu’elle permet parfois de lever des suspicions, de faire en sorte que les gens aient vraiment confiance. Même des gens qui ne s’aimeraient pas forcément beaucoup, des gens qui auraient des désaccords fondamentaux sur des choses indépendantes du logiciel libre, dans la vie, mais ils auront confiance dans les intentions des uns et des autres et, en se regardant dans le blanc des yeux, sauront collaborer et faire quelque chose ensemble.
Jean-Christophe Becquet : Confiance, transparence comme clefs de la gouvernance d’un projet libre mondial.
Tu nous as parlé tout à l’heure de ton rôle au sein de la fondation ??? que tu as comparée à la fondation Mozilla ou Apache. À quoi sert une fondation pour les logiciels libres ?
Sylvain Corlay : En fait, dans la hiérarchie des abstractions communes qu’on a créées pour fonctionner dans une société comme l’argent, ce qu’est une entreprise, c’est assez bas, en fait, un projet open source n’a pas d’existence légale indépendamment du reste. Parfois quand on a besoin de payer des gens, de gérer de la propriété intellectuelle, des logos, quand on a besoin de défendre justement un projet vis-à-vis d’un mauvais acteur, il faut avoir une entité légale qui endosse ce rôle. Ça peut être très cher de créer une entité légale. En France, c’est assez simple, on a un système associatif qui permet de créer une association loi 1901 à peu de frais, c’est un petit peu plus compliqué dans beaucoup d’autres pays. La fondation ??? sert d’entité légale commune à de nombreux projets open source qui sont affiliés à la fondation. Le terme légal américain pour ça c’est sponsoring fiscal, ça n’a rien à voir avec les impôts, c’est littéralement cette notion de servir d’entité légale pour de nombreux projets ou de nombreux communs, en fait.
Jean-Christophe Becquet : C’est à nouveau une mutualisation de ressources et de moyens par des projets qui peuvent être éventuellement de petite taille et qui se mettent ensemble. En français, il me semble qu’on emploie parfois le terme « association ombrelle » pour dire que c’est une entité qui va protéger et soigner plusieurs projets qui, tous seuls, ne pourraient pas s’offrir un service comptable, un service juridique, un service communication, etc.
Sylvain Corlay : ??? « fournit », entre guillemets, les services comptable, financier, légaux donc autour de la propriété intellectuelle sur les marques, les logos, juridique et aussi une assistance dans les demandes de financements, des choses comme ça.
Jean-Christophe Becquet : OK. Ça c’était sur la partie Jupyter et monde économique. Peut-être revenir vers Nicolas pour revenir un peu sur Jupyter et secteur public. À part les expériences que tu as mentionnées dans l’enseignement, est-ce que tu as le sentiment que le secteur public s’implique de la bonne manière dans l’écosystème Jupyter ou est-ce qu’on profite d’être à la radio pour lancer un appel ?
Nicolas Thiery : Le système est un petit peu particulier et c’est une grosse problématique à laquelle on réfléchit avec les collègues : comment développe-t-on du Libre dans le milieu académique dans lequel on est ? La propriété du milieu, notamment au niveau de la recherche, c’est que c’est une collection d’acteurs, donc d’enseignants-chercheurs qui ont une grosse liberté dans ce qu’ils doivent faire, mais ils ont un métier : leur rôle c’est de faire de l’enseignement, c’est de faire de la recherche. Après, comment ils s’organisent pour le faire, quels outils, dans quoi ils s’investissent, ils ont une très grande liberté pour le faire.
Du coup, ce qui marche très bien c’est le côté Développer par les utilisateurs pour les utilisateurs. Un chercheur a besoin de telle bibliothèque de calcul, il va se mette avec des copains, ils vont se mettre ensemble pour développer ces outils parce qu’eux-mêmes vont en avoir besoin, de même pour de l’enseignement. Ça marche bien à chaque fois que c’est assez centré métier, c’est-à-dire que l’expertise qu’il faut pour développer l’outil est une expertise qui est proche de ce que fait la personne, de l’enseignement ou de la recherche. Ça a donné de très belles réussites avec des outils comme Scikit-learn ou d’autres bibliothèques de calcul qui ont été développées comme ça, par des collectifs de chercheurs.
Là où ça commence à devenir plus difficile c’est lorsqu’il s’agit de plus d’infrastructure, lorsqu’il s’agit de construire les routes et les ponts sur lesquels on va pouvoir faire fonctionner ces logiciels.
Un outil comme Jupyter c’est quelque chose qui est technique, qui est assez éloigné de la façon dont ça fonctionne dans le monde de la recherche. Ce que je fais avec mes objets mathématiques n’a rien à voir avec la programmation web d’un réseau qui doit le faire. À la fois je n’ai pas l’expertise en tant qu’enseignant-chercheur pour contribuer vraiment au cœur de Jupyter et, d’autre part, j’ai plus de mal à justifier. À la fin je dois dire que j’ai fait de la recherche et quand je dis que pour pouvoir faire ma recherche j’ai dû faire quelques petits calculs, ça passe, c’est valorisé, mais quand je dis que j’ai développé telle bibliothèque qui est à l’autre bout du monde, c’est plus difficile à justifier.
Du coup, une problématique qu’on a eue dans pas mal de logiciels comme ça, c’est comment aller au-delà de la couche métier, mais aller plus profondément et arriver à financer le développement de la partie vraiment infrastructure qui est derrière.
On a la chance, dans le cas de Jupyter, que c’est mutualisé à une telle échelle qu’à l’échelle de la communauté, avec des acteurs privés, publics, il y a des moyens qui arrivent pour faire un certain nombre de choses.
Jean-Christophe Becquet : Tu veux dire que l’acteur public est un petit opportuniste et attend que les GAFAM financent le développement de l’outil pour pouvoir ensuite s’en servir ?
Nicolas Thiery : On bénéficie d’une collaboration ! De fait, dans les besoins, et on a travaillé sur ce genre de chose, c’est arriver non seulement à prendre des décisions à l’échelle des individus dans le public mais arriver à prendre des décisions collectives et ces décisions collectives c’est souvent tout ce qui est gestion d’appels à projet, pour arriver à dire à l’institution : là il y a un objet qui est important, il faut investir dedans.
La bonne nouvelle, c’est que l’institution a beaucoup évolué depuis 20 ans. Il y a 20 ans quand on disait « on va développer du logiciel libre », on nous demandait pourquoi faites-vous ça ? Il fallait justifier, des fois il fallait même se battre pour dire « c’est du logiciel libre qu’on veut développer ».
Jean-Christophe Becquet : Vous êtes payés pour publier des articles, pas pour développer du code !
Nicolas Thiery : D’une part et, d’autre part, si votre outil est utile il faut que vous le vendiez, il faut que ça rapporte de l’argent à l’université.
Jean-Christophe Becquet : Les fameuses agences de valorisation dans les universités.
Nicolas Thiery : Voilà ! Qui progressent. On a eu un exemple à Grenoble d’une agence où il y avait vraiment une évolution des mentalités, mais c’est quelque chose qui prend du temps.
Jean-Christophe Becquet : Effectivement, la représentante de l’Agence de valorisation de l’université de Grenoble avait la parole pendant l’évènement Open Science Days pour dire : « Si vous voulez faire du logiciel libre, on peut vous aider, on peut vous accompagner ». Ça dénote quand même une sacrée évolution des mentalités.
Ce que tu racontes sur la difficulté de maintenance des infrastructures me rappelle l’échange que j’avais eu sur un tout autre logiciel, le logiciel Geotrek de portails de randonnée développé initialement par le Parc des Écrins et des Cévennes, qui est aujourd’hui répandu dans plus de 150 territoires partout en France et ça commence à l’étranger. Ce dont ils me témoignaient c’est que quand on veut rajouter une nouvelle fonctionnalité visible dans Geotrek, par exemple on veut savoir gérer les voies d’escalade, on va trouver un territoire qui a des voies d’escalade et qui veut bien faire un marché et financer la fonctionnalité « Voies d’escalade ». Par contre, quand c'est une fonctionnalité de maintenance technique qui ne se voit pas, passer de la version 2 à la version 3 de Python, on a énormément de mal à la financer ça et également le temps d’animation de la communauté. Par exemple eux font tous les deux ans les Rencontres Geotrek où ils invitent tous les utilisateurs de Geotrek à se mettre pendant deux jours dans une salle avec des présentations, etc., il faut réserver une salle, organiser les intervenants, faire le programme, réserver le repas, etc., et cela avait l’air de reposer sur la bonne volonté quasi-bénévole de quelques-uns sans arriver à le financer.
Est-ce que c’est aussi ton sentiment, Sylvain, qu’on arrive à vendre des nouvelles fonctionnalités, par contre, quand il s’agit de travailler sur les fondations, les bases du projet, c’est beaucoup plus difficile ?
Sylvain Corlay : On arrive généralement à bien communiquer avec nos clients sur le fait que certaines nouvelles fonctionnalités vont nécessiter du travail en amont. On arrive encore à faire ça, c’est-à-dire à expliquer qu’on ne peut pas faire les choses seulement de façon ???. [1 h 4 min]
Je voulais rebondir sur une chose qu’on a dite précédemment sur l’interaction du public avec le projet, justement sur ce que disait Nicolas. Aujourd’hui, par exemple, contribuer à l’interface graphique de Jupyter nécessite une telle sophistication et une spécialisation dans ce genre de chose, qui n’est pas vraiment une spécialisation que vont avoir les ingénieurs de recherche dans le secteur public parce qu’ils font du code de recherche, mais pas des problèmes, par exemple, d’édition collaborative, de tests de relation visuelle, des systèmes de plugin, l’internationalisation, toutes ces choses. La somme de toutes ces choses devient tellement complexe que même pour un développeur expérimenté il y a un coût d’entrée dans ces technologies qui est beaucoup plus grand aujourd’hui qu’il y a une dizaine d’années. D’ailleurs, la part de contributions qui vient de chercheurs et de gens du monde académique a plutôt diminué dans le temps. Ceux qui restent encore des contributeurs sont des gens qui ont grandi avec le projet et ont appris toutes ces choses au fur et à mesure des années. Avoir de nouvelles personnes qui viennent de ce milieu-là pour contribuer devient de plus en plus difficile aujourd’hui.
Jean-Christophe Becquet : Dans ta conférence à Grenoble, tu parlais de l’effort énorme qui a été fait pour rendre Jupyter accessible, la notion d’accessibilité aux personnes en situation de handicap. Qui finance de tels travaux ?
Sylvain Corlay : J’allais justement y revenir. Nos clients actuels, pour l’instant, ne se sont pas tellement intéressés à ces problématiques. La base de clients de QuantStack, de ma société – nous sommes finalement une société qui allons vendre notre temps et notre expertise à la part des utilisateurs qui est prête à dépenser de l’argent pour améliorer Jupyter – en fait, ces clients ne sont pas représentatifs de la communauté des utilisateurs, ils sont représentatifs de la communauté des gens qui ont de l’argent pour améliorer Jupyter et leurs problématiques ne sont pas forcément les problématiques du public général, en particulier l’accessibilité. C’est un problème extrêmement important, on estime qu’il y a environ 15 % des utilisateurs du Web qui ont besoin de certains aménagements d’accessibilité et il y a une très grande diversité disons de handicaps et de raisons pour lesquelles un site ou une application web pourraient ne pas être utilisables par quelqu’un. Si on fait des déploiements de Jupyter pour l’enseignement secondaire, pour des millions d’enfants, si on ne veut pas exclure dès le début une part, peut-être 10 % de ces enfants qui, par exemple seraient mal voyants ou ne pourraient faire usage des dispositifs de ??? [1 h 6 min 50], c’est un vrai problème. C’est peut-être un endroit où le public devrait investir.
Jean-Christophe Becquet : C’est important, c’est complexe et effectivement on pourrait imaginer que le secteur public soutienne ce type de développement ; aujourd’hui ce n’est pas encore le cas.
On me fait signe que le temps va bientôt presser. Je trouvais intéressant de prendre le temps de cet échange. Il reste deux points, en fait, que je voulais aborder avec vous. Peut-être en deux minutes, Sylvain, les perspectives sur Jupyter dans les six mois/douze mois qui viennent, quels sont les changements importants sur le projet ?
Sylvain Corlay : La version majeure prochaine de JupyterLab, qui est la principale interface graphique de Jupyter, est en version bêta, donc 4.0 version bêta ; la prochaine version a beaucoup de nouvelles fonctionnalités. Un sujet sur lequel on a énormément travaillé dans les deux dernières années, c’est l’édition collaborative, à la Google Docs, qui va permettre à différentes personnes de collaborer en temps réel sur un document partagé. Aujourd’hui, je suis convaincu que l’édition collaborative va devenir omniprésente dans toutes les interfaces de création de contenu en ligne, pas seulement pour des interfaces de création de contenu textuel comme on le voit dans Google Docs.
Jean-Christophe Becquet : Et les bloc-notes, les pads comme on voit sur le Chapril par exemple.
Sylvain Corlay : Ça va être le cas pour la photo, la CAO et Jupyter va avoir un rôle à jouer là-dedans.
Jean-Christophe Becquet : Et aussi, du coup, les bloc-notes Jupyter de code.
Sylvain Corlay : Oui, c’est justement le cas dans la prochaine version. On a écrit les fondations technologiques pour le permettre pour d’autres types de contenus.
Pour l’accessibilité il y a eu des améliorations dans la version 4 mais, malheureusement, on est encore loin du compte. J’espère qu’on aura la possibilité de continuer à travailler sur le sujet dans les mois et les années qui viennent.
Jean-Christophe Becquet : Vous l’avez dit, Jupyter ce n’est pas que du code, ce n’est pas que du logiciel. Une annonce majeure et j’avais envie que ce soit le point d’orgue de notre émission : cette année, pour la première fois en France, à la cité des sciences au mois d’avril aura lieu la JupyterCon ? C’est quoi cet événement ?
Sylvain Corlay : C’est la conférence mondiale sur Jupyter, qui se passe pour la première en France et pour la première fois en Europe. Elle a déjà eu lieu deux fois à New-York en 2017 et 2018, pas en 2019. En 2020, elle a été organisée à nouveau mais en ligne à cause de la fin du monde qu’on a tous vécue. On attend à peu près 1000 personnes à la cité des sciences, on a vraiment des intervenants très intéressants qui viennent, dont un prix Nobel d’économie, Paul Romer, qui vient de parler de son usage de Jupyter, et aussi Alyssa Goodman de Harvard University et Craig Peters & Cory Gwin de GitHub qui vont parler de Github ??? [ 1 h 10 min 00] et de leur usage de Jupyter dans ce contexte-là.
Jean-Christophe Becquet : En tout cas, je trouve qu’on a là un magnifique exemple de collaboration multi-acteurs avec la cité des sciences. J’imagine que des acteurs publics vous soutiennent pour l’organisation de cet évènement.
Sylvain Corlay : Non, on n’a pas de soutien du public. C’est un évènement qu’on organise via la fondation ??? et des sponsors principalement privés. C’est finalement un peu le mot de la fin par rapport aux relations avec le public, on a là un logiciel qui est utilisé par une énorme majorité des universités, des laboratoires de recherche scientifique en France et la plupart des entreprises stratégiques. Nous faisons notre chiffre d’affaires 100 % à l’étranger, on a aujourd’hui zéro commande publique en France sur Jupyter. Donc le passager clandestin ce ne sont pas, aujourd’hui, les géants du numérique.
Jean-Christophe Becquet : C’est un appel et il mérite d’être entendu. Je rends l’antenne.
Étienne Gonnu : Merci beaucoup. Un grand merci à Sylvain Corlay, à Nicolas Thiery et à Jean-Christophe Becquet pour cet échange qui était vraiment passionnant à suivre et qui sera bientôt disponible en podcast.
Je vous propose à présent de faire une pause musicale.
[Virgule musicale]
Étienne Gonnu : Après la pause musicale, nous entendrons une nouvelle chronique « Les transcriptions qui redonnent le goût de la lecture ». Avant cela nous allons écouter agenda. par Üben Üben Üben. On se retrouve juste après. Belle journée à l’écoute de Cause Commune, la voix des possibles.
Pause musicale : agenda. par Üben Üben Üben.
Voix off : Cause Commune, 93.1.
Étienne Gonnu : Nous venons d’écouter agenda. par Üben Üben Üben, disponible sous licence libre Creative Commons Attribution, CC BY SA, une douce mélodie pour se détendre après un échange intense et passionnant.
[Jingle]
Étienne Gonnu : Avant de passer à notre sujet suivant, je vais redonner 30 secondes la parole à Nicolas Thiery qui voulait terminer quand même sur une note positive.
Nicolas Thiery : À propos de l’implication du public, notamment ce qu’on a vraiment remarqué en 20 ans. Autant, à l’époque, le Libre était quelque chose qui n’était pas du tout compris dans les ministères, et là ça a complètement évolué : maintenant, quand on dit qu’on veut faire du Libre, c’est quelque chose qui est compris, notamment grâce à une génération de libristes qui sont maintenant dans les ministères. Une excellente illustration de ça, c’est l’implication de l’Éducation nationale avec la Journée du Libre Éducatif dont on va vous parler juste après.
Étienne Gonnu : Parfait, merci beaucoup. Nous allons passer à notre dernier sujet.
[Virgule musicale]
Chronique « Les transcriptions qui redonnent le goût de lecture » de Marie-Odile Morandi intitulée « À l’Éducation nationale, la voie se libère et la mécanique se met en place ». Une chronique enregistrée et lue par Laure-Élise Déniel
Étienne Gonnu :
Marie-Odile Morandi, voix de Laure-Élise Déniel : Bonjour à toutes. Bonjour à tous.
M. Audran Le Baron a été nommé directeur du numérique pour l’éducation en juillet 2021. Depuis cette date, il est intervenu à plusieurs reprises et quelques-unes de ses interventions ont été transcrites par notre groupe Transcriptions. Dans la chronique « Les transcriptions qui redonnent le goût de la lecture », aujourd’hui choix a été fait de revenir sur les propos de M. Le Baron. Il s’agit, par ordre chronologique, de son intervention très remarquée pour l’ouverture de la première édition de la Journée du Libre Éducatif qui s’est tenue à Lyon le 1er avril 2022. Il est ensuite intervenu en mai 2022 au Séminaire Moodle, puis en novembre 2022 au Salon Open Source Experience dans une conférence intitulée « Éducation et Open Source en France ». Et enfin, en décembre 2022, il était l’invité de Ludomag, média d’actualité sur l’éducation et le numérique, à l'occasion du salon Educatech Expo, avec une conférence intitulée « Numérique éducatif : une stratégie commune et collective pour une meilleure efficacité ! ». La durée de chacune de ces interventions est inférieure à 25 minutes et les liens sont disponibles sur la page des références de l’émission d’aujourd’hui.
Les libristes que nous sommes regrettent que dans les discours les expressions « open source » et « logiciel libre » soient employées de façon indifférenciée, mais ce sont bien les quatre grandes libertés fondamentales qui définissent les logiciels libres que M. Le Baron rappelle :
le droit d’utiliser les logiciels et ressources libres ;
le doit de les étudier, d’étudier notamment le code source des logiciels ;
le droit de les adapter ;
et le droit de les partager.
Pour lui ces quatre droits essentiels résonnent tout particulièrement avec les grands principes, les valeurs qui animent et qui unissent, au sein de l’Éducation nationale, la communauté scolaire. Historiquement l’Éducation nationale s’est construite sur la volonté de libérer les savoirs et les connaissances, de les diffuser au plus grand nombre pour que chacune et chacun puisse se les approprier, les utiliser, les partager, les étudier ; des valeurs fondatrices communes avec celles du monde du logiciel libre.
Durant le premier semestre 2022, la Direction du numérique éducatif a travaillé à coconstruire une stratégie numérique pour l’éducation. En effet, tout un écosystème riche mais complexe est à mettre en mouvement au service de cette vision stratégique parce que l’éducation est une politique publique partagée : l’État est là pour créer un terrain favorable, fixer un certain nombre de règles communes, fournir des infrastructures et proposer des services ; le ministère intervient sur les sujets de formation et de pédagogie ; les collectivités locales se chargent de l’équipement numérique – les communes pour les écoles, les départements pour les collèges et les régions pour les lycées ; les éditeurs de manuels scolaires, les entreprises des technologies de l’éducation, l’EdTech, et les associations, proposent des services et des outils pédagogiques numériques. Cette vision stratégique, nous dit-il, a été construite collectivement avec des valeurs de transparence et une collaboration étroite avec l’ensemble de ces acteurs, afin de partager un cap commun pour pouvoir démultiplier l’énergie au service d’un même service public.
Cette stratégie se structure autour de quatre grands axes :
se former à l’ensemble des outils numériques qui composent le paysage de l’éducation, entre pairs et en réseau ;
équiper et outiller ; l’objectif est de faire se développer les outils qui permettront d’alimenter, d’enrichir l’offre à disposition des enseignants et de l’ensemble des personnels de l’Éducation nationale, c’est-à-dire les plateformes, les infrastructures nécessaires pour que chacun puisse se concentrer sur ce qui fait la valeur ajoutée, à savoir créer des ressources et des logiciels pédagogiques libres ;
et enfin animer afin de mettre en réseau l’ensemble des acteurs qui contribuent, les faire se parler, travailler ensemble pour construire le Libre éducatif de demain.
Le ministère et la Direction du numérique pour l’éducation ont un rôle dans le fait de construire un contexte qui soit favorable au développement de communs numériques, de ressources et logiciels libres au service de l’éducation afin de rendre le système scolaire à la fois plus efficace et plus efficient.
Quelques conditions sont à respecter.
L’enjeu principal est de fournir aux professeurs une offre numérique qui soit à la fois simple, utilisable facilement, avec une expérience utilisateur au centre de la conception de ces services.
L’offre numérique proposée à la communauté éducative doit être stable et pérenne, c’est-à-dire ne plus dépendre de tel ou tel marché public. La garantie de pérennité est un gage de développement des pratiques. Les enseignants ont besoin de temps pour s’emparer de nouveaux outils, les intégrer dans leurs pratiques pédagogiques sur le long terme. Ces impératifs ont un impact sur le budget qu’il faut lui aussi pérenniser : il est nécessaire de mettre en place des dispositifs budgétaires qui permettent aux enseignants d’acquérir des ressources numériques, quand ils en ont besoin, de sorte à entretenir le marché de l’EdTech qui pourra ainsi continuer à proposer et à innover en s’appuyant sur ces achats.
Les services doivent fonctionner correctement les uns avec les autres, donc des règles d’interopérabilité doivent être fixées. M. Le Baron affirme qu’il est important d’exiger l’ouverture d’un certain nombre de données dans des formats ouverts et interopérables au sein de l’éducation.
Il souhaite développer un numérique souverain, c’est-à-dire qui ne lie pas à tel ou tel éditeur en particulier non européen, et qui protège les données dans le strict respect du RGPD, le Règlement général de protection des données, afin d’acquérir la confiance du monde de l’éducation.
Les solutions de cloud, apportées par des entreprises étasuniennes, emportent avec elles un certain nombre de textes de lois américaines qui s’appliquent, y compris au-delà de leurs frontières. Ces solutions, actuellement, ne sont pas conformes au RGPD et ne peuvent satisfaire cette confiance. On doit privilégier des offres de services qui permettent une pleine compatibilité avec ce règlement européen.
À ce sujet, dans l’émission Smart Tech du 4 janvier 2023 menée par Delphine Sabattier, intitulée « Travail en ligne : le choix du libre », il est rappelé qu’au mois de novembre 2022 le ministère de l’Éducation nationale, en réponse à une question du député Philippe Latombe, a demandé d’arrêter le déploiement ou l’extension des solutions non compatibles avec le RGPD, proposées par Google ou Microsoft aux élèves et aux enseignants. Jean-Paul Smets, défenseur du Libre de longue date, souligne qu’il existe énormément d’alternatives dans le monde du Libre. Au cours de cette émission, est présentée la plateforme Netframe, simple d’usage, de Valentin Przyluski, désormais en logiciel libre, gratuite pour l’éducation, pour les laboratoires de recherche et pour les associations, afin d’augmenter sa diffusion auprès des communautés et permettre à tout le monde de l’utiliser. Pour Valentin, il faut tordre le cou au vieux cliché, qu’on entend encore parfois dans la bouche des décideurs publics, colportant que les logiciels français sont moches et ressemblent à des logiciels des années 90.
Une orientation vers un numérique éthique et responsable, plus sobre, moins énergivore pour réduire l’empreinte environnementale du numérique dans l’éducation, fait aussi partie de la feuille de route du numérique éducatif. Certes, de nombreux volets passent par les équipements, les infrastructures, l’écoconception des logiciels, etc. et M. Le Baron pense qu’il faut décourager les usages de l’ordre du gadget et faire en sorte de concentrer les usages numériques uniquement là où on sait qu’il y a valeur ajoutée, une amélioration des buts pédagogiques. M. le Baron affirme avec conviction que le logiciel libre fait partie de la solution d’un usage plus sobre des outils numériques.
Nous vivons dans un monde de plus en plus informatisé, numérisé à tous les étages, dans toutes les professions, dans la vie sociale. L'école a un rôle primordial dans le fait de former nos enfants pour en faire des citoyens éclairés de ce monde. Pour cela, il faut former par le numérique, mais aussi former au numérique.
Former par le numérique, c'est-à-dire en utilisant l'outil numérique au service des apprentissages dans la classe, en dehors de la classe, dans la relation entre l’équipe pédagogique, l’élève, les parents, etc., en différenciant les apprentissages et en permettant de la remédiation personnalisée auprès de chaque élève.
Apprendre le numérique et le codage par la participation à des projets en Libre, par la pratique au travers de logiciels libres sont des modes d’acquisition des compétences et des savoirs préconisés dans les programmes dits de spécialité proposés au lycée, SNT, Sciences numériques et technologie, et NSI, Numérique et sciences informatiques.
M. Le Baron rappelle l’existence de la plateforme Pix, entièrement en open source, dont le code est librement accessible, partagé et ouvert aux contributions. Pix permet l’auto-évaluation de ses propres compétences, propose des ressources de remédiation à l’issue de chaque parcours, avec, en fin de collège et en fin de lycée, une possibilité de certification pour l’ensemble des élèves du système éducatif français.
Sont énumérées et commentées les solutions, les services soit déjà déployés soit en cours de déploiement à disposition des établissements scolaires, et vous trouverez cette liste en lisant ou relisant les transcriptions. Focus particulier est donné à la plateforme apps.education.fr qui offre un ensemble de services à l’ensemble des agents du ministère donc aux enseignants. On peut y trouver BigBlueButton, le logiciel de classe virtuelle et de visioconférence ; un service PeerTube de partage de vidéos, alternative à YouTube gratuite, garantie sans pub ; un service Nextcloud qui permet à tout professeur d’avoir ses documents hébergés dans un cloud français, sur la base de logiciels libres, etc.
Une plateforme Moodle sera l’outil offert à tous les enseignants pour créer des parcours pédagogiques, les co-écrire entre pairs, les mettre en libre accès pour les partager, les mutualiser, les dupliquer. Chaque professeur pourra venir récupérer des contenus, se les réapproprier, les modifier, les améliorer et les reverser à l'ensemble de la communauté, définition même du commun numérique. Un accompagnement des enseignants sera prévu pour les aider à intégrer l’utilisation de cet outil dans leurs pratiques pédagogiques.
Cette plateforme en construction est basée sur un logiciel libre et chacune des évolutions de son code source sera reversée à la communauté Moodle, comportement identique à celui en action pour le logiciel BigBlueButton. Ainsi, l’Éducation nationale contribue au développement, en tout cas de certaines fonctionnalités, des logiciels libres qu’elle utilise.
Dans un élan de lyrisme, c’est lui qui le dit, M. Le Baron nous fait part de son rêve : démocratiser l'usage de Moodle, former la communauté pour mettre l'ensemble des acteurs en synergie et avoir ainsi bâti, dans cinq ans, un Wikipédia de ressources pédagogiques pérennes et interopérables, des programmes français, ambition on ne peut plus motivante ! Il ajoute que le monde de l’éducation et le monde des logiciels libres, étant donné les valeurs qu’ils partagent, étaient faits pour se rencontrer. Ils se sont rencontrés, la rencontre a été plus que fructueuse, et ils ne sont pas près de se quitter !
La stratégie du numérique pour l’éducation 2023-2027 a été présentée fin janvier 2023. L’April a étudié ce document et, dans un communiqué de presse récent, que vous pouvez lire sur le site april.org, se montre surprise du fait que soit évoquée comme allant de soi dans les pratiques du ministère relatives à son système d'information, une priorité au logiciel libre sans aucune indication quant à la mise en œuvre opérationnelle de cette priorité. Nul doute que des interventions sur ce sujet suivront dans les semaines à venir que notre groupe ne manquera pas de transcrire.
Quoi de Libre ? Actualités et annonces concernant l'April et le monde du Libre
Étienne Gonnu : Nous voilà de retour en direct, nous approchons de la fin de l’émission à grande vitesse, nous allons terminer par quelques annonces.
[Virgule musicale]
Il me reste malheureusement très peu de temps, donc je vais donner des informations très rapidement et je vous invite à les retrouver toutes sur l’agendadulibre.org.
Demain 5 avril, ma collègue Isabella Vanni interviendra dans le rendez-vous Éduc et elle nous proposera une présentation sur « Le logiciel libre : quand l’informatique est vecteur d’émancipation et de coopération », demain 5 avril, entre 10h30 et 11h30. Les inscriptions sont gratuites mais elles sont obligatoires dans la limite des places disponibles, et certaines seront retransmises en ligne.
On parlait des Journées du Libre éducatif qui se dérouleront à Rennes vendredi 7 avril, un événement animé notamment par l’inestimable Alexis Kauffmann.
Cause commune propose un apéro ce vendredi 7 : venez rencontrer les gens qui font les émissions, Fred de l’April sera sans doute là.
Et du côté de Lyon, les 13 et 14 avril auront lieu les MiXiT, des conférences pour l’éthique et la diversité dans la tech avec des crêpes et des cœurs, qui auront lieu au campus de l’université Lyon 1, les 13 et 14 avril.
Merci à toutes les personnes qui ont participé à l’émission : Vincent Calame, Jean-Christophe Becquet, Sylvain Corlay, Nicolas Thierry, Marie-Odile Morandi ainsi que ??? [1:29:59]. Un grand merci à toute l’équipe qui s’occupe des podcasts ainsi qu’à Olivier Grieco, directeur d’antenne de la radio.
Pas d’émission la semaine prochaine, on se retrouve en direct mardi 18 avril à 15h30. Notre sujet principal portera sur le fédiverse, une fédération de serveurs basés sur des logiciels libres formant un véritable réseau social.
Nous vous souhaitons de passer une très belle fin de journée. On se retrouve en direct mardi 18 avril et d’ici là, portez-vous bien.
Générique de fin d’émission : Wesh Tone par Realaze.