Place du libre - enseignement informatique et science des données

De April MediaWiki
Aller à la navigationAller à la recherche


Titre : La place du libre dans l'enseignement de l'informatique et de la scince des données

Intervenant : Mihaela Jugunaru-Mathieu

Lieu : Rencontres Mondiales du Logiciel Libre

Date : Juillet 2017

Durée : 23 min

Visionner la vidéo

Support de la présentation

Licence de la transcription : Verbatim

Statut : Transcrit MO

Description

Enseigner l’informatique peut se faire de différentes manières et le moyen le plus sûr de donner aux étudiants des habitudes de programmation, de développement logiciel et de travail bien fait est de leur faire faire des travaux pratiques.

On se pose toute de suite la question du système d’exploitation, du langage, de l’environnement de programmation.

Nous, enseignants, avons donc le choix. Et le choix doit être réfléchi, entre portabilité, fiabilité de l’outil et usage collectif, potentiel de développement. Parfois, nous nous trouvons dans la position de prescripteurs, quand nos élèves viennent nous demander de ce qu’ils pourraient installer chez eux.

Il arrive aussi que notre relation avec le libre se fasse à travers nos étudiants qui travaillent avec des outils libres adaptés à des tâches particulières.

Le logiciel libre est donc souvent la meilleure option support pour faire apprendre comme pour résoudre des problèmes de l’industrie.


00'

Ceux qui étaient tout à l’heure à écouter Vincent en début d’après-midi ne sont pas là parce qu’ils vont entendre quasi le même son de cloches. Je vais parler plutôt de la place que j’accorde au libre en tant qu’enseignante en informatique et en sciences des données

Je viens de Saint-Étienne, plus précisément de l’École des mines de Saint-Étienne, je vais commencer par vous dire un bref CV, le pourquoi de la chose. Mon approche logiciel libre qui, ma foi, n’est absolument pas du tout militante par éducation, c’est juste que je suis tombée dans la marmite et je me suis trouvée bien. Je vais parler aussi de la place que j’accorde moi, en tant enseignante, et puis je vais parler aussi de retour que mes étudiants me font systématiquement en diverses occasions, surtout que j’ai eu à faire à des populations d’étudiants assez disparates.

Peut-être que mon accent vous intrigue. Je suis d’origine roumaine et j’ai fait à partir du DEA des études en France, donc en informatique à l’École des mines de Saint-Étienne. À l’époque c’était très à la mode le calcul parallèle, donc j’ai fait du calcul parallèle, plus précisément de l’équilibrage de charges.

Ensuite j’ai travaillé comme ingénieur d’études dans une SSII qui faisait du logiciel avec bases de données, programmation C, programmation graphique des interfaces. Et puis, depuis 2000, très précisément septembre 2000, je suis maître-assistant à l’École des mines en informatique, avec des fonctions d’enseignement et de recherche.

Une courte pause dans le cursus de maître-assistant j’ai dû faire un séjour au Mexique, pour des raisons personnelles, en suivant la famille, et puis, l’occasion était trop belle pour ne pas travailler là-bas, donc j’ai travaillé quatre trimestres comme professeur invité à l’Universidad Autónoma Metropolitana. J’ai enseigné en espagnol et j’ai eu des étudiants mexicains. Des étudiants avec, ma foi, un profil très différent de ce que j’avais en France. Et puis récemment, depuis 2014, je suis responsable d’une formation de 160 heures dans le cursus ingénieur civil des mines, donc pour les étudiants en formation initiale à l’École des mines, pour les initier aux problèmes du Big Data.

Y a-t-il besoin que j’explique le Big Data ? C’est plutôt un syntagme à la mode, mais ça cache, en fait, une réalité dans laquelle on demande beaucoup plus de soin dans la programmation qu’auparavant, du fait de grand volume des données, du fait de la vitesse à laquelle les données arrivent et surtout d’un certain besoin, d’un certain fantasme de pouvoir extraire rapidement de la valeur de ces données qui peuvent être d’un format très variable. Donc ces quatre faits, finalement – valeur, vitesse, variabilité de format - sont les caractéristiques du Big Data.

Petite image, peut-être que Bibiana n’est pas trop dépaysée, les jacarandas de la cour, d’une des cours intérieures de l’université mexicaine.

Tout petit retour en arrière. Donc Universidad Autónoma Metropolitana à Mexico, c’était la troisième grande université du pays, localisée sur cinq campus à Mexico DF [District fédéral], donc la capitale. Je travaillais sur un campus et sur ce campus on formait surtout des ingénieurs, du moins les élèves avec lesquels j’étais en contact, et ceux qui étaient dans un cursus informatique, computation comme on dit là-bas. Donc j’ai eu des étudiants de tronc commun, donc ce qu’on appelle des étudiants de tronc commun qui sont assez différents des élèves du cycle ICM [Ingénieurs Civils des Mines] de tronc commun donc en première année. Il manque quelques quatre années de différence. Je parlerai tout à l’heure de mes étudiants.

J’ai eu des élèves au fil des années, donc des élèves de l’École des mines, naturellement, des élèves d’un master spécialisé à l’époque. Donc c’était des gens qui avaient une certaine formation professionnelle, mais qui n’étaient pas informaticiens donc qui voulaient appendre pour intégrer le métier d’ingénieur de développement informatique. Et puis j’ai eu des étudiants de niveau master maestria au Mexique, master en France, donc plutôt niveau bac + 4. Donc un panel assez large d’étudiants.

J’avoue aussi que dans ma vie j’avais toujours rêvé d’être professeur, ce qui est très étrange mais voilà !Et puis je me disais je ne veux pas être professeur chez les petits, je veux être professeur chez les grands, parce que ce qui m’intéresse c’est de transmettre le savoir. Je parlais de mes prétentions du haut de mes quinze ans, il ne fallait pas faire gaffe, mais n’empêche que j’étais formatée pour ça. Et quand on a de étudiants de tronc commun et des étudiants en général, le savoir est quelque chose qu’on transmet, mais je vous assure, le plus compliqué c’est de savoir comment on le transmet, malgré tout. C’est vrai qu’on n’a plus les problèmes classes - maîtresse est-ce que j’écris avec le stylo rouge ou avec le stylo bleu . dieu merci, mais quand même on a toujours un problème du comment de la chose. Surtout que j’en parlerai tout à l’heure, on a des étudiants qui changent et on a des profils qui changent et aussi des attentes, maintenant, des générations qui changent.

J’ai enseigné un panel très large depuis toujours, donc même quand j’étais étudiante en thèse, j’assistais des travaux pratiques en programmation, beaucoup de programmation. Donc à Mexico, surtout, j’ai assuré quatre trimestres le cours d’introduction à la programmation.

Mes recherches portent surtout sur la fouille du texte et apprentissage automatique. Du coup j’assure aussi des cours comme ça. J’ai enseigné un cours de grid et de cloud computing il y a quelques années ici même à Télecom Saint-Étienne, des cours de calcul parallèle, recherches op [opérationnelles], algorithmique, donc ça ce sont mes passions et puis des cours de bases de données, bases de données avancées. Donc j’ai fait pas mal de choses.

Et puis, si j’assure toujours à une variété de publics et une variété de cours, étonnement mes supports de cours sont toujours faits en Latex de la manière la plus sobre possible. Ça ressemble à peu près à ceci. Les slides de cours c’est toujours le même format. Le choix étant dicté par Latex et puis par le format final. D’habitude je le mets en PDF pour être sure qu’ils vont pouvoir le lire et le relire. Pareil les sujets d’examen, de TP, tout est fait en latex et je n’aime plutôt pas Word et je vous expliquerai pourquoi.

Ça ce sont d’autres locaux de l’École des mines de Saint-Étienne, ceux précisément qui sont sur le site de Manufrance et où se trouve mon bureau.

Bon. Pourquoi Latex ?

7’ 19

Je vais vous parler de logiciel libre et le Latex a été le premier choix logiciel libre que j’ai fait de manière inconsciente. J’avais besoin de rédiger ma thèse. Auparavant j’avais rédigé le rapport de DEA ; ça s’appelait à l’époque master recherche. J’avais besoin de réaliser quelque chose de joli, il faut dire, dans lequel j’écrivais aisément des formules mathématiques et surtout, c’est entre parenthèses, j’avais besoin de gérer proprement mes références bibliographiques. Pour moi c’était mortel ! Déjà avant, les références bibliographiques, dans un petit rapport de DEA, c’était intenable quand on en rajoutait une il fallait renuméroter, c’était l’enfer, c’était l’horreur, c’était les années 90, et je me suis dit tu vas apprendre Latex, tu verras c’est beaucoup plus facile. Et je suis tombée dans la marmite et j’y suis restée. Au point que même si j’ai une lettre à écrire aux autorités officielles je la fais d’abord en Latex, je l’envoie en PDF mais ça c’est une autre question.

Et puis du coup, petit à petit, je commençais à avoir une conscience du Libre plus ou moins développée. Donc en société de service informatique on fait surtout ce qu’on nous dit de faire, on ne se pose pas trop de questions. On voit quand même des prix de licences logicielles qui sont assez faramineux et puis on arrive à une carrière en enseignement supérieur on se pose la question il faut que je leur apprenne à programmer et que j’aide un collègue en TP d’analyse numérique, mais quels logiciels on va utiliser et pourquoi ? Et puis on se posait la question, en salle ils vont utiliser tel logiciel, mais chez eux, s’ils veulent travailler, ils vont utiliser quoi ? Donc on se pose tout de suite la question de sur quel support informatique on va enseigner, nous enseignants en informatique ? Les papiers ne suffisent pas ; il faut surtout mettre la main à la pâte et programmer, programmer, essayer des tas de choses, jusqu’à ce qu’on comprenne ce qu’on fait et jusqu’à ce qu’on acquière les bons réflexes, les bonnes manières de travailler.

Donc on se pose forcément la question sur quel support enseigner. Et ma foi ce que je vais vous raconter par le suite, ce sont surtout des choix de ce type.

Mon séjour au Mexique. C’est dommage que Vincent qui a expliqué à 14 heures des choses ne soit pas là. Je commence, très contente de moi, directe, mes cours avec les élèves. Première question qu’ils me posent c’est : « Professora, quels logiciels doit-on acheter ? » Et là je tombe des nues. Je savais quel était le salaire de base, quel était le salaire moyen. Je savais aussi qu’il y avait marché parallèle des logiciels sur une grande rue du centre de Mexico dans lequel on achetait avec 20 pesos, enfin un peu plus de six euros, Photoshop par exemple. Mais pour moi c’était impensable d’engraisser qui que ce soit, soit de manière licite soit de manière illicite. Donc il fallait faire quelque chose.

En support pour l’enseignement j’utilisais des serveurs Linux. Il s’agissait notamment de programmer en C. Donc on utilisait GCC et puis les éditeurs soit Wim, soit VI, soit quelque chose qui s’appelait Tiny ou Nano en éditeurs de programme. Mais il fallait aussi se poser la question mais s’ils n’ont pas la connexion internet chez eux, on était quand même au Mexique, qu’est-ce que je vais leur dire de prendre en échange ? [Ah celui-là je ne l’ai pas mis. Si.] Et du coup, à mes élèves de Mexico, j’avais suggéré DevC++ qui était un outil graphique, donc un IDE [integrated development environment] d’interface graphique, basé sur le compilateur GNU, qui leur permettait de n’importe quel système d’exploitation, soit Windows, soit Linux, de pouvoir faire des programmes, les compiler, les exécuter, voir si ça marche.

Au fil du temps, les outils plutôt informatiques que j’ai utilisés. Donc je suis très grand fan de GCC et de shell, ça vous l’avez compris, C c’est parmi mes langages favoris. J’ai beaucoup utilisé Scilab, plutôt en guise de MATLAB, enfin comme correspondant à MATHLAB, et aussi parce j’ai un besoin très furieux de calculer le déterminant d’une matrice pour voir si la matrice est singulière ou pas. J’ai plutôt tendance à ouvrir Scilab qu’autre chose.

J’ai dû enseigner au fil du temps aussi un cours d’un XML pendant quelques années et du coup, je me suis appuyée sur Xsltproc, donc faire des feuilles de style XSLT et sur Qizx ; comme moteur Xquery. Donc, au fil du temps, Scheme naturellement, du Prolog, dans la version SWI-Prolog, Protégé. À l’époque où j’avais expliqué donc le SWI-Prolog et Protégé, à l’époque où j’avais enseigné mon cours de maestria en intelligence artificielle.

Je les prends dans le désordre, vous voyez bien, et puis gLite qui est un middleware pour faire du grid computing, qui est libre donc c’est issu d’un projet de recherche aux États-Unis, commencé fin des années 90, qui continue toujours et qui permet justement d’illustrer toutes les fonctionnalités de ce que doit être un middleware supportant le calcul de grid.

Et puis, je l’ai mis très en foncé avec sa petite icône, un logiciel très étrange, enfin très étrange, qui s’appelle Raptor, que j’utilisais beaucoup pour les étudiants de tronc commun au Mexique, donc c’était des étudiants qui n’avaient jamais programmé, qui n’avaient pas fait de cours d’Excel ni rien du tout, qui étaient censés faire par la suite diverses filières d’ingénieurs, des chimistes, des ingénieurs de l‘environnement, des ingénieurs en construction, des informaticiens, enfin de la computation comme ils appelaient, mais qui n’avaient pas programmé ou peu. Il y en avait certains qui savaient programmer. Et, d’un point de vue pédagogique, il fallait que je sache passer, que j’arrive à passer la notion de ce que c’est qu’est test, ce que c’est qu’une boucle for, ce que c’est qu’une boucle while. Et Raptor, je vous conseille d’essayer de le retrouver, donc le software Raptor, c’est un petit logiciel qui permet de dessiner des diagrammes de flux, mais non pas les dessiner mais les exécuter pas à pas ou les exécuter dans leur globalité. Donc ce qui est extrêmement convenable et c’est une manière très visuelle de voir : je passe par ici, je prends la branche de noms et j’exécute et je fais ma boucle et voici le résultat qui s’affiche en clair. En plus le logiciel, il faut le dire en passant mais je n’ai pas utilisé ça, permet d’exporter son diagramme de flux dans un programme en C ou en C++, qui fera l’affaire.

Donc ça ce sont les outils que j’ai aimé le plus. J’en ai vu plein. Je déplore parfois, par exemple, et c’est dommage que Vincent soit parti, des logiciels pour faire des jolies figures autres qu’en Latex parce que c’est quand même long en Latex, qui ne sont pas entretenus ou peu entretenus, donc j’ai des formats de figures qui ne s’ouvrent plus, malheureusement. Mais bon !

15’ 00

En sciences de données,