Différences entre les versions de « Quelles nouvelles de la bibliothèque universelle des logiciels - Roberto Di Cosmo »

De April MediaWiki
Aller à la navigationAller à la recherche
(Contenu remplacé par « Catégorie:Transcriptions Publié [https://www.librealire.org/quelles-nouvelles-de-la-bibliotheque-universelle-des-logiciels-roberto-di-cosmo ici] - Mars 2021 »)
Balise : Contenu remplacé
 
(10 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
 
[[Catégorie:Transcriptions]]
 
[[Catégorie:Transcriptions]]
  
<b>Titre :</b> Quelles nouvelles de la bibliothèque universelle des logiciels ? Pourquoi et comment archiver, préserver et surtout partager les codes sources, nouveau patrimoine immatériel de l’humanité ?
+
Publié [https://www.librealire.org/quelles-nouvelles-de-la-bibliotheque-universelle-des-logiciels-roberto-di-cosmo ici] - Mars 2021
 
 
<b>Intervenant·e·s :</b> Roberto Di Cosmo - Caroline Lachowsky
 
 
 
<b>Lieu :</b> <em>Autour de la question</em> - RFI
 
 
 
<b>Date :</b> 26 janvier 2021
 
 
 
<b>Durée :</b> 48 min 30
 
 
 
<b>[https://aod-rfi.akamaized.net/rfi/francais/audio/magazines/r252/autour_de_la_question_1_20210126.mp3 Podcast]</b>
 
 
 
[https://www.rfi.fr/fr/podcasts/autour-de-la-question/20210126-quelles-nouvelles-de-la-biblioth%C3%A8que-universelle-des-logiciels?fbclid=IwAR1PmDmMTMoUqD8OqveNIYCakknOEz_46u6RxDfYamRFln662fc8XNZkOyY&ref=tw_i Présentation de l'émission]
 
 
 
<b>Licence de la transcription :</b> [http://www.gnu.org/licenses/licenses.html#VerbatimCopying Verbatim]
 
 
 
<b>NB :</b> <em>transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.<br/>
 
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.</em>
 
 
 
==Description==
 
 
 
Prenons des nouvelles d’un projet enthousiasmant, d’une utopie en construction,  le projet mondial de préservation et de partage de notre patrimoine numérique commun : Software Heritage . Une véritable bibliothèque universelle des codes sources et des logiciels libres, imaginée et construite en réseau,  par notre invité le chercheur en informatique Roberto Di Cosmo dans  l’esprit des pionniers du web : le partage et la diffusion des connaissances, en toute liberté et ouvert à tous sur la planète. Depuis 2017, l’Unesco, le CNRS et de nombreuses institutions universitaires à travers le monde ont répondu présents à cette initiative sans précédent. Pourquoi et comment partager ce patrimoine universel de l‘humanité ?
 
 
 
==Transcription==
 
 
 
<b>Voix off : </b><em>Autour de la question</em>. Qu’est-ce que ça va changer ? Comment ça se passe ailleurs ? Pourquoi ça ? En quoi ça nous touche ?<br/>
 
Caroline Lachowsky.
 
 
 
<b>Caroline Lachowsky : </b>Bonjour. Ravie de vous retrouver chers amis auditeurs à l’esprit libre et curieux pour prendre des nouvelles d’un projet enthousiasmant, d’une utopie en construction, il n’y en a pas tant que ça par les temps qui courent. C’est le projet mondial de préservation et de partage de notre patrimoine numérique commun, Software Heritage, une véritable bibliothèque universelle des codes sources, des logiciels libres, imaginée et construite en réseau par notre invité, le chercheur en informatique Roberto Di Cosmo, dans l’esprit des pionniers du Web, le partage et la diffusion des connaissances en toute liberté, ouvert à tous sur la planète.<br/>
 
Depuis 2017, l’Unesco, le CNRS et de nombreuses institutions universitaires et techniques à travers le monde ont répondu présent à cette initiative sans précédent : pourquoi et comment partager ce patrimoine universel de l’humanité ?<br/>
 
Bienvenue au cœur de ce chantier pas tout à fait comme les autres, sur le site virtuel de la bibliothèque universelle des codes sources et des logiciels libres.
 
 
 
<b>Harold Abelson, voix off : </b><em>Programs must be written for people to read and only incidentally for machines to execute.</em>
 
 
 
<b>Caroline Lachowsky : </b>C’est un des pionniers et fervent défenseur du logiciel libre, le chercheur Harold Abelson du MIT qui le disait en 1985, je traduis : « Les programmes informatiques doivent être écrits pour que les gens puissent les lire et accessoirement pour que les machines les exécutent. »<br/>
 
Merci de nous le rappeler. Roberto Di Cosmo, bonjour.
 
 
 
<b>Roberto Di Cosmo : </b>Bonjour Caroline. C’est un plaisir d’être ici avec vous aujourd’hui.
 
 
 
<b>Caroline Lachowsky : </b>Un plaisir partagé d’être en direct avec vous ensemble en studio, Roberto Di Cosmo, pour nous donner des nouvelles de ce formidable projet de bibliothèque universelle des codes sources et de logiciels libres. Un projet, j’ai envie de dire à la fois essentiel, utopique et monumental que vous construisez, que vous portez avec votre petite équipe, Roberto, depuis plus de trois ans. Je rappelle que vous êtes chercheur en informatique, détaché de l’Inria, porteur donc initiateur et développeur de Software Heritage. Comment vous définiriez ce projet très inspirant ? J’ai envie de dire que c’est un des projets les plus inspirants de la décennie.
 
 
 
<b>Roberto Di Cosmo : </b>Merci de dire ça. Ça fait plaisir de voir qu’effectivement on peut apprécier l’importance des logiciels qui sont autour de nous. Si on regarde autour de nous aujourd’hui, tout notre monde, en particulier dans cette période de crise dans laquelle on a besoin de visioconférence, de communication, de courrier électronique, d’activités, d’applications de partout, ce sont les logiciels qui sont au cœur de notre société. D’une certaine façon ils construisent le tissu de notre société moderne.<br/>
 
Déjà, on a un peu de mal à voir les logiciels, on appuie sur des boutons, on voit des applications, etc., mais il faut savoir que ces logiciels ne sortent pas de rien, ils ont été développés, écrits – on dit effectivement écrire un programme –, conçus par des personnes, par des êtres humains qui ont développé ces logiciels, les codes sources de ces logiciels, qui sont après traduits dans un langage qui est exécutable par la machine. Effectivement, les premiers efforts sont faits par des êtres humains qui décrivent les fonctionnements de ces applications, de ces logiciels que nous utilisons. Ce sont des descriptions très complexes.<br/>
 
Quand j’étais petit, j’étais un fana d’astronomie et de fusées, etc. Quand j’étais beaucoup plus jeune, je me rappelle qu’on m’avait dit que la navette spatiale était l’objet le plus complexe jamais conçu par l’être humain, on parle des années 80.<br/>
 
Aujourd’hui, les logiciels sur lesquels nous nous appuyons pour faire fonctionner nos sociétés sont énormément plus complexes que ces navettes spatiales d’un temps, dans les systèmes d’exploitation, ce qu’il y a dans nos téléphones.
 
 
 
<b>Caroline Lachowsky : </b>Chacun de ces logiciels est plus complexe.
 
 
 
<b>Roberto Di Cosmo : </b>Chacun de ces logiciels est d’une complexité énorme et pour les faire fonctionner il faut effectivement arriver à les comprendre. Il y a toute une population technique, des sortes de nouveaux littéraires du 21e siècles que sont les développeurs qui écrivent cette littérature technique pour que les machines puissent faire ce dont on a besoin.<br/>
 
Il faut savoir que justement cette littérature technique était normalement réservée au cercle des gens qui développent, était donc peu vue, peu connue, mais c‘est une partie essentielle de notre patrimoine culturel technique et scientifique. On s’est aperçu, il y a cinq ou six ans, qu’effectivement personne ne s’intéressait à préserver ce patrimoine culturel, à faire en sorte qu’il soit réuni dans une unique grande bibliothèque d’Alexandrie pour que, après, ça soit accessible à tous et préservé sur le long temps. C’est à ce moment-là qu’on s’est lancés dans cette initiative, vous dites ambitieuse, un peu folle, mais je dirai passionnante, d’aller retrouver tous ces logiciels, collecter tous ces logiciels, tous ces codes sources, les archiver de façon qu’on ne puisse pas les perdre et faire en sorte que ça soit facilement accessible à tous.
 
 
 
<b>Caroline Lachowsky : </b>On va justement revenir sur la façon dont vous faites, parce qu’à chaque étape il y a de questions, Vous avez commencé, on l’a dit – on l’avait dit ici même en 2018, je vous avais reçu au tout démarrage de Software Heritage – par collecter, parce qu’en plus ils sont encore vivants ou ils étaient encore vivants, les codes sources des tout premiers informaticiens. On le rappelle, même pour moi, si j’ai bien compris, les codes sources c’est évidemment un langage informatique, mathématique, mais avec des annotations absolument humaines de chacun de ces développeurs pour pouvoir aller plus loin, pour pouvoir les comprendre, pour pouvoir les reproduire. Vous avez commencé par collecter ces trésors, effectivement culturels, techniques de l’humanité avant qu’ils ne disparaissent. Vous avez notamment récupéré le code source d’Apollo, vous parliez d’astronomie, c’est ça.
 
 
 
<b>Roberto Di Cosmo : </b>Il y a énormément de logiciels anciens mais qui restent quand même passionnants. Effectivement, parmi les nombreux logiciels qu’on a pu retrouver, il y a le code source du système de contrôle et guidage de l’Apollo 11 qui a permis de mettre les pieds du premier homme sur la lune. Au passage je signale que c’est grâce à une femme, Margaret Hamilton, qui avait piloté l’équipe des personnes qui ont développé ce logiciel. On peut effectivement aller regarder ce logiciel. Je vais essayer d’expliquer ça à travers la radio : si vous regardez dans l’archive vous allez retrouver quelques bribes de ce logiciel-là et là-dedans, par exemple sous la colonne de gauche vous allez voir un charabia technique totalement incompréhensible, c’est quelque qui est réservé, qui doit être traduit pour la machine, et, dans la colonne de droite il y a tout un tas de commentaires écrits en anglais – c’était une équipe américaine à l’époque – dans lesquels, essentiellement, les développeurs annotaient ce que le logiciel était censé faire à cet endroit-là. Par exemple, il fallait retourner les modules lunaires pour mettre des pattes vers la lune pour pouvoir atterrir, il fallait faire tout un tas d’instructions. Tous ces commentaires étaient effectivement annotés et ces commentaires n’existent plus pour la machine, c’est-à-dire qu’une fois qu’on a construit l’exécutable qui est exécuté par la machine, ces commentaires disparaissent. Ces commentaires sont seulement une transmission des connaissances du développeur, de la personne qui écrit le logiciel, à une autre personne qui va devoir lire le logiciel, qui peut être la même personne un peu plus tard.
 
 
 
<b>Caroline Lachowsky : </b>C’est donc d’humain à humain. Au fond ce n’est pas d’humain à la machine, c’est d’humain à humain.
 
 
 
<b>Roberto Di Cosmo : </b>Évidement, d’une certaine façon, des fois on peut dire que le code source du logiciel c’est un message envoyé d’un humain à un autre humain pour lui expliquer ce qu’on veut que l’ordinateur fasse. C’est très important. Quand il y a un problème – ces objets sont très complexes – il faut retrouver l’explication de ce qu’il fait. Toujours pour revenir à Apollo 11, il y a un moment mythique, le moment de l’alunissage, à quelques dizaines de secondes, à une poignée de secondes de l’alunissage, il y a un code d’erreur qui s’affiche sur l’ordinateur de bord, qui était 12.01 et on entend Amstrong qui parle avec une froideur, un sang froid impressionnant, qui demande à Houston de lui expliquer ce que veut bien dire « 12.01 ». Il y avait les jeunes ingénieurs qui avaient la pile de tous les codes sources, qui fouillent dedans pour voir ce qu’est que ce code 12.01. Très rapidement, ils découvrent que c’était finalement un détail mineur, il n’y avait rien de grave. Il a dit « OK, on y va » et c’est comme ça qu’on a eu le premier alunissage. C’est super important.
 
 
 
<b>Caroline Lachowsky : </b>L’importance de ces commentaires qu’il faut donc retrouver, collecter, archiver, partager. À chaque fois, à chaque étape ça soulève des questions monumentales, autour de la mise en place de cette bibliothèque universelle des codes sources et des logiciels, il y a évidemment celle de la quantité de données à archiver et à partager, qui ne cesse d’augmenter, chaque année, chaque mois, chaque jour, presque chaque seconde. Comment faire avec l’exponentiel ? C’est le sens de la question que vous pose, Roberto, Cécile Lestienne , ma consœur directrice de la rédaction de <em>Cerveau & Psycho</em>.
 
 
 
<b>Cécile Lestienne, voix off : </b>Ces projets de conservation sont toujours fascinants et intéressants. La question que je me pose c’est comment, derrière, va-t-on pouvoir étudier tout ça ?
 
 
 
<b>Caroline Lachowsky : </b>Roberto Di Cosmo, qu’est-ce qu’on va faire de tout ça, de tout ce que vous collectez et archivez ?
 
 
 
<b>Roberto Di Cosmo : </b>C’est une excellente question.<br/>
 
Effectivement. Déjà, retrouver tous les logiciels, ce n’est pas facile parce qu’ils sont pas mal éparpillés sur la planète, il faut tous les collecter, dans des plateformes qui ne sont pas tout à fait compatibles les unes avec les autres. Une fois qu’on a construit toute cette archive, ce qu’on est en train de faire. Pour vous donner quelques chiffres : aujourd’hui on a déjà 150 millions de projets logiciels archivés.
 
 
 
<b>Caroline Lachowsky : </b>150 millions ! Waouh !
 
 
 
<b>Roberto Di Cosmo : </b>150 millions. Il y en a des tout petits qui n’ont aucun intérêt. Il y en a des très grands, très sophistiqués, historiques, c’est le cas de l’Apollo 11 ou du noyau Linux qui est utilisé partout dans nos ordinateurs modernes. Évidemment, il y a un peu de tout comme, dans une grande bibliothèque, vous avez les grandes œuvres et de petites œuvres, là c’est pareil.<br/>
 
Ce qu’on est en train de faire, on structure tous ces logiciels dans une structure qui est très particulière. On ne va pas rentrer dans les détails techniques ici, qui permet effectivement de tracer non seulement les logiciels eux-mêmes mais comment ils ont été développés, par qui, comment ils ont évolué d’une version préliminaire, en version intermédiaire, en version finale, etc.
 
 
 
<b>Caroline Lachowsky : </b>La trace de tout. Vous gardez la trace de tout.
 
 
 
<b>Roberto Di Cosmo : </b>La trace de toutes les modifications : qui a modifié, quoi, pourquoi, à quel moment. Quand on a besoin de développer des objets techniques aussi complexes, il faut garder la trace de leurs modifications. On préserve tout ça et cet énorme graphe, cette énorme structure mathématique qu’on construit, nous donne une sorte de vision complète de l’évolution du développement logiciel sur les dernières 60 années.<br/>
 
Effectivement, comment étudier tout ça ? Il y a tellement de prismes, d’axes pour regarder les choses. On peut avoir un prisme purement technique, c’est-à-dire essayer de voir la qualité de certains logiciels, comment ça a évolué ; c’est le domaine, par exemple, du génie logiciel qui est une branche de l’informatique. Vous pouvez avoir des études de nature plus, comment dire, sciences humaines, c’est-à-dire l’histoire des communautés de développement. Ou alors, pour citer mon numéro deux sur le projet qui est Stefano Zacchiroli, un autre italien – il y a des Italiens qui arrivent en France de temps à autre ! – qui a publié récemment un article passionnant dans lequel il a regardé tout l’historique qu’on a reconstruit dans l’archive pour voir quelle est la contribution, par exemple, des femmes. Là il a découvert qu’historiquement, il y a peu près 8 % de femmes parmi les contributeurs aux logiciels depuis très longtemps, mais il y a un petit espoir, si on regarde surces dernières années, maintenant on est passé de 8 à 10 %.
 
 
 
<b>Caroline Lachowsky : </b>Ça augmente un peu.
 
 
 
<b>Roberto Di Cosmo : </b>On a besoin de plus de femmes, on a énormément besoin de femmes en informatique.
 
 
 
<b>Caroline Lachowsky : </b>Appel à toutes les informaticiennes et futures informaticiennes qui nous écoutent.
 
 
 
<b>Roberto Di Cosmo : </b>Absolument.
 
 
 
<b>Caroline Lachowsky : </b>Comment fait-on pour retrouver selon les critères que l’on choisit ? Est-ce qu’l y a un moteur de recherche ? Est-ce que c’est possible de retrouver dans cette immense banque de données logiciels, bibliothèque universelle des codes sources, Roberto Di Cosmo.
 
 
 
<b>Roberto Di Cosmo : </b>Ça c’est un grand défi. Effectivement, on est tellement habitués, dans notre monde d’aujourd’hui, à avoir des outils informatiques extrêmement performants – des moteurs de recherche, des systèmes collaboratifs – qu’on a tendance à les prendre pour acquis. Évidemment ça doit être facile de faire un moteur de recherche sur les codes sources des logiciels, vu que vous avez tellement de moteurs de recherche, pour ne pas en citer, Google, Bing et compagnie, ou Qwant le moteur de recherche français.
 
 
 
<b>Caroline Lachowsky : </b>Libre.
 
 
 
<b>Roberto Di Cosmo : </b>Mais construire un moteur de recherche c’est extrêmement compliqué. Nous avons commencé par faire un moteur de recherche simple, qui vous permet de chercher non pas à l’intérieur des logiciels, mais avec le nom dans les 150 millions de logiciels, des projets qu’on a déjà archivés.
 
 
 
<b>Caroline Lachowsky : </b>Quand on le connaît, on peut le retrouver.
 
 
 
<b>Roberto Di Cosmo : </b>Si vous connaissez l’URL, vous pouvez le retrouver. Par contre, l’étape suivante qui est un défi beaucoup plus important, c’est de pouvoir de chercher à l’intérieur de cette grande masse de codes de façon intelligente pour poser des questions du style : est-ce qu’il y a un logiciel qui est utile en biologie, aujourd’hui, pour la bio ? Est-ce qu’il y a un logiciel qui a été développé récemment ? Est-ce qu’il y a un logiciel qui est compatible avec tel système d’exploitation ou qui a été développé par des développeurs à plusieurs endroits de la planète ?, donc poser ces types de questions-là. C’est quelque chose auquel on veut répondre, mais il faut plus de ressources que celles que nous avons aujourd’hui, donc c’est dans la ligne de mire de ce qu’on veut faire. On espère y arriver un peu plus avant.
 
 
 
<b>Caroline Lachowsky : </b>Petit à petit, lentement, l’oiseau de cette bibliothèque universelle fait son nid.<br/>
 
<em>Autour de la question</em>, comment construire cette bibliothèque universelle et virtuelle des codes sources accessible à tous. Rappelons que c’est cette philosophie-là des pionniers, c’est vraiment pour que tout le monde puisse y avoir accès. On va y revenir. On continue de s’interroger ensemble, Roberto Di Cosmo, sur cette utopie en marche qui est en train de devenir réalité à l’écoute de votre choix musical.<br/>
 
C’est Vangelis qui vous inspirer <em>Conquest Of Paradise</em>. Tiens donc ! Vous nous direz pourquoi ensuite.
 
 
 
==15’ 07==
 
 
 
<b>Caroline Lachowsky : </b>Grandiose. Vangelis sur RFI,
 

Dernière version du 20 mars 2021 à 14:02


Publié ici - Mars 2021