Pourquoi une bibliothèque universelle des logiciels - Software Heritage - Roberto Di Cosmo : Différence entre versions

De April MediaWiki
(16’ 55)
(24’ 23)
Ligne 145 : Ligne 145 :
 
==24’ 23==
 
==24’ 23==
  
<b>Caroline Lachowsky : </b>Que pouvez-vous répondre Roberto Di Cosmo
+
<b>Caroline Lachowsky : </b>Que pouvez-vous répondre, Roberto Di Cosmo, à cette question compliquée mais bien réelle de Thomas Hervé Mboa Nkoudou au Cameroun ?
 +
 
 +
<b>Roberto Di Cosmo : </b>Effectivement. Il a soulevé tout un tas de questions. J’aimerais bien les reprendre dans un autre ordre.
 +
 
 +
<b>Caroline Lachowsky : </b>Volontiers.
 +
 
 +
<b>Roberto Di Cosmo : </b>Tout d’abord ce qu’on appelle la science ouverte aujourd’hui m’appelle une petite réflexion. Vous voyez, moi à l’époque où j’étais étudiant par exemple je n’aurais jamais pensé de la science fermée ; la science était naturellement ouverte. J’ai étudié à Pise qui était la patrie de Galileo Galilei qui est celui qui a créé la méthode scientifique – c’est ce que nous disons en Italie, je sais bien qu’en France on dit autre chose, mais l’important c’est que la méthode scientifique est là – et une partie essentielle de la méthode scientifique c’est la capacité pour d’autres de vérifier indépendamment ce que nous avons trouvé, nous, dans notre recherche.
 +
 
 +
<b>Caroline Lachowsky : </b>Donc la science, pour vous, était essentiellement fondamentalement ouverte.
 +
 
 +
<b>Roberto Di Cosmo : </b>Fondamentalement ouverte parce que sinon ce n’est pas de la science. Comme disait Karl Popper qui est un épistémologue très influent du début du siècle passé, les occurences non reproductibles n’ont pas d’intérêt pour la science. C’est nécessaire de pouvoir reproduire ces connaissances. Pour reproduire ces connaissances il faut regarder le monde d’aujourd’hui qui est un monde beaucoup plus complexe que celui de nos ancêtres il y a quatre ou cinq siècles. Vous avez des articles scientifiques qui décrivent ce qu’on a trouvé quand on fait de la recherche mais très souvent aujourd’hui, quand vous regardez ces articles, cet article vous dit que vous avez analysé un certain nombre de données, un certain jeu de données, que vous avez fait un certain type de calcul et que ce calcul a donné un certain résultat qui est le résultat scientifique. Je ne sais pas, par exemple 42. Eh bien si vous avez seulement l’article, vous n’avez pas les données, vous n’avez pas les logiciels avec lesquels on a fait les calculs, comment je peux bien vérifier, moi, que le résultat est bien 42 et comment je peux jouer avec pour apprendre des choses nouvelles, changer un peu les données, voir si le résultat reste toujours 42 ou si c’était un hasard, etc. ? Donc c’est vraiment nécessaire de rendre les articles scientifiques librement accessibles. Et là il y a une véritable barrière entre le Nord et le Sud qui vient du modèle de publication scientifique actuel qui est complètement inadapté au mode de transmission moderne dans lequel Internet permet de rendre les choses disponibles immédiatement et alors qu’on a bloqué tout ça derrière des barrières financières sur lesquelles il faudrait passer une émission entière.
 +
 
 +
<b>Caroline Lachowsky : </b>Oui, il faudrait passer une émission entière, rappelons quand même que vous êtes un ardent défenseur des logiciels libres.
 +
 
 +
<b>Roberto Di Cosmo : </b>Et de l’<em>open access</em>.
 +
 
 +
<b>Caroline Lachowsky : </b>Et de l’<em>open access</em> et que vous avez tout de suite senti ces obstacles, ces dangers, cette fermeture.
 +
 
 +
<b>Roberto Di Cosmo : </b>Immédiatement.
 +
 
 +
<b>Caroline Lachowsky : </b>Une fermeture on va dire quoi ? Économique, du savoir, enfin vraiment on a fermé un outil qui était totalement ouvert.
 +
 
 +
<b>Roberto Di Cosmo : </b>Qui était totalement ouvert. Qui était censé être ouvert. Pour résumer en quelques lignes ma vision de ce qui s’est passé ; je suis suffisamment âgé pour avoir vécu la période avant Internet. Avant Internet, le mécanisme le plus efficace pour diffuser le savoir c’était effectivement de publier dans des journaux papier qui après étaient redistribués dans toutes les bibliothèques sur le monde, il n’y avait pas d’autre solution.
 +
 
 +
<b>Caroline Lachowsky : </b>Or aujourd’hui, avec Internet…
 +
 
 +
<b>Roberto Di Cosmo : </b>Or aujourd’hui, avec Internet, cette façon de fonctionner est complètement obsolète ; on peut aller beaucoup plus vite. Mais si vous voulez avant, l’économie d’avant Internet est une économie dans laquelle tout le monde trouvait son petit bénéfice : les chercheurs y trouvaient la façon plus efficace de distribuer ; les bibliothèques avaient une façon de dupliquer les choses à un coût pas trop élevé ; les éditeurs se rémunéraient à côté. Aujourd’hui on est dans un monde dans lequel le travail habituel des éditeurs n’a plus de sens ; il faut distribuer plus facilement, plus rapidement, mais on a entre temps des entreprises milliardaires qui existent et qui freinent évidemment. Là il y a un changement de modèle économique ; ce changement-là n’a pas été complètement maîtrisé.
 +
 
 +
<b>Caroline Lachowsky : </b>Et en même temps vous qui êtes un ardent défenseur de l’<em>open access</em>, des logiciels libres, pour monter cette extraordinaire bibliothèque universelle du code source, donc pour collecter et partager cette science informatique, vous avez fait une fondation et qui est-ce qu’on retrouve ? Certains de vos « ennemis » entre guillemets des GAFAM, des grosses ???, des grosses entreprises informatiques qui, au départ, voulaient tout fermer et qui en fait se rendent compte que ce n’est pas possible.
 +
 
 +
<b>Roberto Di Cosmo : </b>Et là, si vous voulez, c’est quelque chose de fascinant ; vous avez raison de le rappeler. Il y a 20 ans j’avais écrit un livre qui était un peu au vitriol sur Microsoft. Vous savez des fois on dit « quand le sage indique que la lune, le sot ne voit qu’un doigt ». À l’époque moi j’étais très énervé contre un monopole complet sur la chaîne de l’information et il arrive qu’il y a 20 ans, le monopoliste sur la chaîne de l’information s’appelait Microsoft.
 +
 
 +
<b>Caroline Lachowsky : </b>Aujourd’hui ce ne sont les GAFA.
 +
 
 +
<b>Roberto Di Cosmo : </b>Ce ne sont pas tout à fait les mêmes.
 +
 
 +
<b>Caroline Lachowsky : </b>Ce ne sont pas tout à fait les mêmes.
 +
 
 +
<b>Roberto Di Cosmo : </b>Donc je ne suis pas très surpris de voir Microsoft qui devient plutôt partenaire en soutien. Je ne dis pas que tout est blanc, mais quand même le monde n’a pas mal changé. Et effectivement on a besoin de contribuer à ce partage de la connaissance. Je reviens sur la partie science ouverte ; c’est important de partager les articles, c’est important de partager les données et jusque-là on avait un petit peu oublié que c’est bien d’avoir ??? les données mais si on n’a pas le logiciel avec lequel on a fait les analyses, on est toujours incapable de reproduire un résultat scientifique.<br />
 +
Donc ce qu’apporte Software Heritage, cet éclairage-là, c’est une plateforme internationale pour partager les codes sources des chercheurs, des recherches et, avec ça, on commence avec le ministère de la recherche ici en France, on commence à collaborer avec des entités internationales, parce que c’est la même infrastructure qu’on utilise aussi pour le patrimoine culturel, c’est le même tuyau, mais qui a une finalité importante pour le partage des connaissances.
 +
 
 +
<b>Caroline Lachowsky : </b>Et qui pourra donc être partagé sur la planète entière
 +
 
 +
<b>Roberto Di Cosmo : </b>Sur la planète entière.
 +
 
 +
<b>Caroline Lachowsky : </b>Dans le monde entier et réduire cette injustice cognitive dont parlait notre chercheur camerounais.
 +
 
 +
<b>Roberto Di Cosmo : </b>Absolument. Mais il y a une autre partie dans l’injustice cognitive dont il parle c’est effectivement le fait qu’il faut exposer plus souvent les chercheurs des pays émergents à des modèles, des connaissances et des modèles économiques plus avancés, sur lesquels on commence à travailler maintenant.<br />
 +
Je reviens sur votre question sur Microsoft. Par exemple Microsoft, Oracle, ces entreprises-là, il y a 20 ans, ne juraient que par des logiciels propriétaires, fermés, et maintenant, si vous regardez 20 ans après, petit à petit ils sont en train de prendre un énorme tournant ils sont en train d’investir de plus en plus dans le développement des logiciels libres, ils contribuent aux logiciels libres. L’année passée Microsoft était le premier contributeur en logiciels libres sur la plateforme la plus connue qui s’appelle GitHub ; c’est étonnant mais en réalité c’est aussi naturel parce que la complexité des logiciels grandit à une telle vitesse qu’on ne peut plus se permettre de tout refaire tout seul et qu’il est nécessaire d’avoir des ingénieurs, des personnes qui connaissent bien ces logiciels ; et la meilleure façon de les connaître c’est de pouvoir mettre la main dans le code source. Vous vous rappelez, c’est le code source qu’on peut lire en étant développeur.
 +
 
 +
<b>Caroline Lachowsky : </b>Donc mettre les mains dans le cambouis du code source, ouvrir le capot de la machine.
 +
 
 +
<b>Roberto Di Cosmo : </b>Dans le cambouis du code source, ouvrir le capot de la machine. Donc petit à petit les gens sont en train de migrer dans cette direction et c’est le même mouvement que vous voyez aussi dans ce mouvement de science ouverte ; on se rend compte que c’est important de partager parce que comme ça on construit plus, on va plus loin. Ce qui n’enlève rien après de valoriser la recherche scientifique, mais ça c’est un autre sujet.
 +
 
 +
<b>Caroline Lachowsky : </b>C’est un autre sujet. <em>Autour de la question</em>, « comment partager nos logiciels en toute liberté ». On s’interroge depuis la Jamaïque de l’importance de partager avec Capleton sur RFI <em>Never Share</em> ; ça c’est politique !
 +
 
 +
[Pause musicale]
 +
 
 +
==33’ 00==
 +
 
 +
<b>Caroline Lachowsky : </b>Capleton sur RFI, <em>Never Share</em>.

Version du 14 septembre 2018 à 08:44


Titre : « Pourquoi une bibliothèque universelle des logiciels ? »

Intervenants : Roberto Di Cosmo - Caroline Lachowsky

Lieu : Émission Autour de la question - RFI

Date : septembre 2018

Durée : 48 min 30

Écouter ou télécharger le podcast

Licence de la transcription : Verbatim

NB : transcription réalisée par nos soins. Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Statut : Transcrit MO

Description

Notre invité du jour, le chercheur en informatique Roberto Di Cosmo, s'interrogera autour de la question suivante : « Pourquoi une bibliothèque universelle des logiciels ? » Pourquoi une bibliothèque universelle (une bibliothèque d’Alexandrie) des logiciels ? Comment collecter, préserver et rendre accessible à tous, ce nouveau patrimoine commun de l’humanité ? Comment partager nos logiciels en toute liberté ? Avec Roberto Di Cosmo, chercheur en informatique détaché auprès d'Inria, directeur de l'initiative Software Heritage, professeur d'Informatique de l'Université Paris Diderot, et membre de l'IRIF.

Transcription

Voix off : Autour de la question. D’où ça vient ? Qu’est-ce que ça va changer ? C’est pour qui ? À quoi ça sert ? Caroline Lachowsky.

Caroline Lachowsky : Bonjour. Ravie de vous retrouver chers amis auditeurs pour une nouvelle saison avec ??? à la réalisation cette année, autour de toutes les questions qui nous animent. J’en profite pour vous remercier de votre interactivité et de votre curiosité. Nous ferons d’ailleurs encore plus appel à vous pour nourrir nos échanges. Je vous en reparle très vite, car nous sommes concernés et tous contributeurs aujourd’hui et c’est précisément cette réflexion qui a amené notre invité. Le chercheur en informatique Roberto Di Cosmo, ardent défenseur de la diffusion des savoirs, a initié une bibliothèque universelle des logiciels. Une véritable bibliothèque d’Alexandrie pour collecter, préserver et rendre accessibles à tous les codes sources de tous les logiciels disponibles dans le monde. Soutenue par l’Unesco, cette initiative essentielle, Software Heritage, arrive à point nommé pour préserver et mettre en commun ce nouveau patrimoine de l’humanité. Autour de la question pourquoi et comment partager nos logiciels en toute liberté ? Bienvenue.
Bonjour Roberto Di Cosmo.

Roberto Di Cosmo : Bonjour Caroline.

Caroline Lachowsky : Merci d’être en direct avec nous. Vous êtes chercheur informaticien, professeur à l’université de Paris Diderot, détaché auprès d’Inria, l’Institut national de recherche en informatique, ardent défenseur des logiciels libres et de la diffusion de tous les savoirs, vous êtes donc à l’initiative de ce fantastique projet de grande bibliothèque du code source, Software Heritage, inauguré à l’Unesco en juin dernier ; la bibliothèque d’Alexandrie des logiciels a pour mission de collecter, d’organiser, de préserver et de partager tous les logiciels disponibles. C’est une initiative formidable, assez monumentale ; comment vous est venu cette idée Roberto Di Cosmo ?

Roberto Di Cosmo : Tout d’abord je vous remercie beaucoup Caroline de m’accueillir pour parler de ce projet ; c’est quelque chose que je trouve passionnant. Pour comprendre effectivement comment cette idée est née, il faut que je vous dise : je suis un chercheur en informatique, je travaille avec les gens qui travaillent avec moi comme Stefano Zacchiroli et d’autres personnes de mon équipe, sur l’analyse et l’évolution des codes logiciels, et il y a quatre ans à peu près, on avait commencé un certain travail d’analyse sur des logiciels, qui avait l’air de fonctionner plutôt bien, et c’était tout naturel de se poser la question et de dire comment on peut faire ce travail-là sur tous les logiciels qui existent ? Donc on a juste commencé à chercher en se disant il doit bien y avoir un endroit dans lequel il y a bien tous les codes sources de tous les logiciels ; il y a sûrement quelqu’un qui y a pensé. Et là on a bien cherché, on a bien cherché à droite, à gauche, on n’a rien trouvé et, du coup, on a pris conscience d’un problème qui est quand mème incroyable, c’est-à-dire l’informatique est une discipline qui a changé, transformé, révolutionné notre monde, il y a des logiciels partout, ils sont nécessaires pour communiquer, pour transférer, pour acheter, pour s’entretenir, pour tout faire – et ils sont assez récents ça fait une cinquantaine d’années que les logiciels ont commencé vraiment à transformer notre monde – et pourtant personne jusque-là ne s’est soucié de préserver ce nouveau patrimoine des connaissances technologiques.

Caroline Lachowsky : Un nouveau patrimoine de connaissances technologiques. Rappelons, on va y revenir, que les logiciels, les tout premiers sont toujours valables aujourd’hui et qu’en plus, j’ai envie de vous poser la question pourquoi maintenant ? Mais parce que maintenant peut-être qu’on est à une période charnière justement entre les débuts de l’informatique et puis cette croissance exponentielle des logiciels ?

Roberto Di Cosmo : Absolument. Donc là, quand on a commencé à regarder – le sujet est immédiatement devenu passionnant quand on s’en est aperçus – on s’est rendu compte qu’on est à un moment vraiment charnière, un moment particulier dans l’histoire de l’informatique, parce que les premiers informaticiens un peu modernes, ceux qui commencé à travailler avec des vrais ordinateurs datent d’il y a un petit demi-siècle. Un petit demi siècle c’est beaucoup pour la vitesse d’évolution de l’informatique mais c’est très peu par rapport à l’histoire d’une discipline.
Donc on a une opportunité unique de pouvoir encore parler à la plupart des gens qui ont écrit les premiers logiciels, qui savent comment les logiciels qui ont fabriqué Internet, qui ont fabriqué le Web, qui ont fabriqué tout ça, ont été développés, pourquoi ils ont été faits de telle sorte ; ces personnes sont encore vivantes.

Caroline Lachowsky : Donc on peut aller les voir et on peut leur demander comment elles ont fait leur code et récupérer tous ces codes sources. C’est ça ?

Roberto Di Cosmo : On peut aller les voir. Exactement et ça c’est une opportunité unique parce que dans d’autres disciplines, je parle des mathématiques moi j’aimerais bien parler avec Archimède et lui demander pourquoi il a fait les chose comme ça, mais c’est un peu trop tard, il y a 2000 ans qui sont passées. J’aimerais bien passer avec Leibnitz, avec Newton, avec Pascal mais c’est un peu trop tard, ils sont déjà tous partis, alors que dans l’informatique l’essentiel des gens est encore là. Donc il y a cette possibilité de tout récupérer et, en plus, si vous regardez – et on a des chiffres on peut regarder comment ça fonctionne – on voit que le développement des logiciels explose. Il n’y a jamais eu autant de logiciels qui sont développés, donc non seulement on peut récupérer le passé, mais on se trouve aussi dans une phase où il est vraiment nécessaire de construire l’infrastructure de préservation pour s’assurer que demain on ne devra pas faire pas faire un effort inhumain pour récupérer des choses qu’on perd. Chaque année qui passe la quantité de logiciels à préserver grandit et il faut s’y mettre tout de suite pour que la tâche ne soit pas infaisable.

Caroline Lachowsky : Pour collecter ce qui est fait et ensuite pour pouvoir les relire, si j’ose dire, sur tous les supports parce que cette question est là aussi évidement.

Roberto Di Cosmo : Évidemment, et c’est très bien qu’on ait parlé de ça parce que vous voyez, on peut se poser la question et savoir, mais d’accord, mais les logiciels, moi je suis pas informaticien pourquoi ça devrait m’intéresser ? D’un côté, il faut savoir que les logiciels arrivent en deux fois : il y a les logiciels exécutables qu’on peut trouver sur son téléphone ou sur son ordinateur, qu’on utilise pour faire une tâche particulière, ça c’est bien, mais ces logiciels exécutables-là ne sortent pas d’un chapeau ils ont été écrits, et regardez, on utilise vraiment le terme écrire un logiciel, les logiciels sont écrits par des développeurs, par des êtres humains, qui peuvent être des développeurs, des ingénieurs, des chercheurs, des hobbyistes, des personnes qui ont appris informatique toutes seules et qui écrivent ces logiciels dans ce qu’on appelle des langages informatiques, mais ces langages informatiques et ces codes sources des logiciels sont une forme de connaissance spéciale parce qu’ils sont faits pour qu’un autre développeur puisse les lire, parce qu’on a besoin de les modifier peut-être dans une semaine, peut-être dans un mois, et peut-être que la personne qui va les modifier ça va être moi-même donc j’ai intérêt à ce que ça soit relisible. Et en même ils sont suffisamment techniquement détaillés pour produire les exécutables qu’on utilise partout.
Donc nous on se focalise sur les codes sources et pourquoi les codes sources ? Parce que justement, comme ils sont faits pour être lus par des êtres humains, ils ont la propriété qu’on pourra toujours les relire et comprendre ce qu’ils font, même quand les machines sur lesquelles ils pouvaient s’exécuter n’existeront plus.

Caroline Lachowsky : Autour de la question, pourquoi et comment l’heure est venue de collecter et de partager tous ces codes sources de nos logiciels en toute liberté, petit rappel historique et chronologique de cette informatisation de notre monde. C’est le mix forcément codé et programmé par ???

7’ 08

Diverses voix off : Le premier programmeur au monde est une programmeuse. Et ça, c’est l’histoire d’Anna Lovelace ; elle s’est passionnée pour la machine analytique. Dans une de ses notes, elle décrit l’enchaînement d’instructions qu’il faut donner à la machine pour réaliser une suite mathématique, mais pas seulement l’algorithme qui permet de réaliser cette suite, elle décrit jusqu’à la position des rouages. Et ça, traduire un algorithme dans une séquence d’instructions qu’il faut donner à un ordinateur pour qu’il le réalise, c’est de la programmation informatique.

C’est incroyable ça !

Là c’est un ordinateur qui ne peut rien faire comme ça. Ce qu’on fait c’est qu’on prend une cassette et, à partir de là, cette cassette contient des programmes pour l’ordinateur et, vous avez vu, j’ai appuyé sur un bouton, j’appuie sur autre bouton et on va charger le programme.

Ah vous êtes le nouveau prof d’informatique, c’est ça ?

J’ai décidé de porter la liberté aux utilisateurs de l’informatique. Le but est d’éliminer le logiciel pas libre et de le remplacer par du logiciel libre. Le logiciel privateur ne doit pas exister.

Tant mieux, parce que moi j’adore ça la liberté !

Il n’y a pas un catalogue central de tous les logiciels nous utilisons tous des plateformes diverses et variées, pour développer, pour distribuer.

C’est là Alexandrie, qui met en place un projet qu’il a imaginé pour la Grèce c’est-à-dire réunir tous les savoirs du monde au même endroit. L’idée est magnifique, il faut juste la réaliser !

Ouais, il n’y a plus qu’à réunir les gars maintenant.

Caroline Lachowsky : Il n’y a plus qu’à, Roberto Di Cosmo, c’est vite dit sauf que c’est un travail de titan, monumental. Est-ce qu’on pourrait avoir une idée, après ce résumé de l’informatique au cours de notre siècle – on a même entendu Richard Stallman, celui qui nous met en avant les logiciels libres –, est-ce qu’on peut avoir une idée du volume de données monstrueux que vous avez à traiter pour cette bibliothèque universelle des logiciels ?

Roberto Di Cosmo : En réalité, effectivement, c’est une très bonne question : il y a combien de codes sources logiciels informatiques ??? Je peux vous dire déjà ce que nous avons trouvé. Au bout de quatre ans de travail, parce qu’on a quand même commencé à travailler il y a un petit moment pour construire l’infrastructure.

Caroline Lachowsky : L’infrastructure de cette bibliothèque universelle des logiciels et commencé à les collecter ; c’est ça ?

Roberto Di Cosmo : Eh oui, exactement, commencé à les collecter. Parce que si vous voulez, d’une certaine façon on a besoin de construire une infrastructure, un énorme aspirateur qui se connecte aux différents endroits sur la planète dans lesquels on développe les logiciels, en particulier, en premier lieu, les logiciels libres et qui les récupèrent avec toute leur histoire de développement. Donc on sait en détail quelle ligne de code a été rajoutée par qui, à quel moment, pourquoi ; ça c’est vraiment passionnant et fascinant. Là, aujourd’hui, on a déjà identifié plus de 80 millions d’origines à partir desquelles on récupère ces logiciels et après, en regardant ce qu’il y a là-dedans, on a trouvé plus de 4 milliards et demi de fichiers sources tous différents, parce qu’un même fichier source peut-être réutilisé à plusieurs endroits mais nous on ne le garde qu’une seule fois ; donc il y a plus de 4 milliards et demi de fichiers sources tous différents qui ont été développés. Dans notre bibliothèque, si vous regardez, le logiciel le plus ancien date des années 70, voire un peu avant, et le logiciel le plus moderne date peut-être d’hier, parce qu’on ne collecte pas seulement le passé, mais aussi tout ce qui se développe aujourd’hui.

Caroline Lachowsky : Vous m’avez montré sur votre ordinateur tout à l’heure le code source d’Apollo. Incroyable, avec des commentaires en plus, Roberto Di Cosmo.

Roberto Di Cosmo : Absolument. Si vous regardez, dans cette énorme bibliothèque on trouve de vrais trésors. Un de ces trésors que j’adore particulièrement c’est le code source du système de commande de l’Apollo 11 qui a plusieurs particularités. Tout d’abord parce qu’effectivement, là on a mentionné Ada Lovelace, mais la personne qui a piloté l’équipe qui a développé ce logiciel s’appelle Margaret Hamilton ; c’est une dame incroyable.

Caroline Lachowsky : Une femme informaticienne.

Roberto Di Cosmo : Une femme informaticienne qui a 82 ans aujourd’hui. J’ai eu la chance de la rencontrer il y a quelques mois lors d’une conférence internationale ; elle est toujours aussi brillante, aussi géniale que ce qu’elle était à l’époque où elle développait ces codes-là.
Donc on trouve de vrais trésors, parce que vous voyez, à l’époque, l’ordinateur de l’Apollo 11 c’était un ordinateur qui était très avancé pour l’époque mais qu’on programmait avec des langages informatiques qui étaient de très bas niveau, très proches de la machine donc on souffrait beaucoup pour programmer tout ça et donc on mettait énormément de commentaires. Les commentaires sont faits pour des êtres humains, pour leur dire « regarde les instructions suivante va faire telle ou telle autre chose ». Et ce qu’on a regardé ensemble tout à l’heure, justement il y avait un fragment du programme d’allumage des réacteurs de l’Apollo 11 qui est développé d’une façon un peu particulière ; du coup les commentaires des développeurs sont géniaux parce qu’il y a un des développeurs qui écrit, qui reprend l’ancienne devise honni soit qui mal y pense, c’est-à-dire « ne pensez pas mal ; si on a codé comme ça on n’avait pas le moyen de faire mieux » et plus tard un ??? qui écrit no ???, « ne pas toucher si vous ne savez pas ce que vous faites ». Ça c’est une partie qui est super délicate dans les commandes de l’Apollo 11.

Caroline Lachowsky : Que ce soit pour l’Apollo ou pour les commandes d’un avion, il ne vaut pas toucher le code source.

Roberto Di Cosmo : Il vaut mieux ne pas toucher si on ne sait pas ce qu’on fait. D’accord ! Il faut un peu regarder. Donc on peut encore relire tout ça et en révisant ces codes on voit vraiment une histoire passionnante et, vous voyez, les instructions pour l’ordinateur vont finir dans l’ordinateur, mais les commentaires ne disent rien à l’ordinateur ; ils nous parlent à nous, ils nous racontent une histoire humaine. L’histoire de l’informatique est une histoire d’êtres humains, d’hommes et de femmes qui ont travaillé ensemble, qui ont passé des nuits et des jours de passion pour construire cette ??? logique qui change le monde d’aujourd’hui.

Caroline Lachowsky : Qui change le monde d’aujourd’hui.

Roberto Di Cosmo : Et c’est cette histoire qu’on veut construire.

Caroline Lachowsky : Voilà. Vous voulez construire cette histoire et vous nous montrez aussi que ces logiciels, ces codes sources, sont quoi ? Des sortes d’objets vivants, enfin sur lesquels on peut travailler aussi aujourd’hui encore.

Roberto Di Cosmo : Absolument. C’est tout à fait ça. C’est important de comprendre que les codes sources des logiciels sont des objets nobles. Ce sont des créations de l’esprit humain ; ils sont développés par des êtres humains et maintenant, comme la complexité technologique grandit énormément, très souvent ce sont des gros logiciels. Prenez les navigateurs internet comme Firefox, prenez des systèmes de base de données comme PostgreSQL ou d’autres, du traitement d’images comme Gimp, ce sont des logiciels qui font des centaines, des milliers, voire des millions de lignes de code, et une seule personne ne peut pas se permettre d’écrire tout ça toute seule, donc on écrit de façon collaborative et on travaille ensemble sur cet objet, sur des plateformes qu’on appelle souvent des forges logicielles pour travailler ensemble. Et c’est fascinant. Par exemple, si on veut comparer avec la littérature. Le code source on l’écrit, on l’écrit comme on écrirait un texte, et là aussi c’est important de savoir pourquoi tel texte a été écrit de telle façon. Dans notre approche traditionnelle à la littérature, d’abord on sélectionne les livres qui sont importants et une fois qu’on a trouvé un livre qui est important, je ne sais pas, de Zola, de Hugo, eh bien on passe des nuits et des semaines et des années avec des étudiants dans les bibliothèques à chercher les lettres, les notes, les brouillons de ces écrits.

Caroline Lachowsky : Comment ont été écrits ces chefs-d’œuvres.

Roberto Di Cosmo : Pourquoi ils ont décidé d’écrire comme ça, etc. Alors dans le monde de l’informatique, pour les besoins de l’informatique, on garde la trace de tous ces développements au moment où on développe. Du coup, il y a peut-être des logiciels qui ne sont pas très intéressants, ce n’est pas grave, mais quand on a un logiciel intéressant, on a toute cette trace. Donc nous gardons non pas seulement des codes sources mais aussi toute la trace de développement.

Caroline Lachowsky : La trace humaine derrière ! On reconnaît bien l’humaniste et informaticien que vous êtes, Roberto Di Cosmo, et vous avez choisi évidemment d’écouter Birdy sur RFI People Help The People.

[Pause musicale]

16’ 55

Caroline Lachowsky : Birdy sur RFI, People Help The People. C’est votre choix Roberto Di Cosmo et pour cause, l’entraide, le partage, c’est la source même de cette bibliothèque universelle des codes sources.

Roberto Di Cosmo : Vous avez raison Caroline, c’est un de mes moteurs intérieurs depuis très longtemps. C’est-à-dire à la fois comme enseignant en informatique, comme professeur d’université, comme chercheur, ma mission a toujours été de partager à la fois la connaissance et la passion pour la connaissance. Il ne suffit pas juste de partager les notions, il faut aussi partager la passion. Donc là c’est une vraie passion de partager un peu cette histoire de l’informatique parce que autant la plupart des personnes qui nous écoutent au aujourd’hui ne sont pas directement capables de lire un programme informatique, autant dans quelques années, vous voyez le travail qu’on fait c’est sur le long terme, la plupart d’entre nous seront capables de lire un peu le code informatique de la même façon que la plupart de nous sont capables aujourd’hui de faire un peu de maths, de faire un peu d’histoire, de faire un peu de philosophie ; petit à petit l’informatique entre dans les écoles.
Donc on construit cette infrastructure pas seulement pour aujourd’hui mais vraiment pour le futur, pour les générations futures.

Caroline Lachowsky : Pour les générations futures, pour qu’elles soient capables de revenir à la source justement de tous ces logiciels que nous utilisons et pour les générations futures sur tous les coins de la planète parce que vous qui êtes très sensible à ces questions de partage, de transfert, de diffusion des savoirs, comment faire pour que cette bibliothèque universelle des logiciels puisse être accessible à ceux qui en ont le plus besoin et je pense notamment au grand Sud, à nos auditeurs sur le contient africain, en Amérique latine, ailleurs que là où on pense qu’ils sont fabriqués ces logiciels.

Roberto Di Cosmo : Effectivement. Ça c’est vraiment la question de l’université : un des aspects magiques de l’information et de l’informatique de l’Internet d’aujourd’hui c’est qu’effectivement une infrastructure comme celle-ci, peu importe où elle est fabriquée, elle peut rendre un service à tout le monde sur la planète et il ne faut pas publier qu’il y a quand même des tuyaux des fois qui ne sont pas si grands que ça donc c’est très important qu’il n’y ait pas une seule copie de cette bibliothèque.
Nous construisons ici à Paris ce projet magnifique de Software Heritage, mais dès le départ dans notre tête il y a eu cette idée de faire en sorte que à terme nous arrive à avoir un grand réseau international de miroirs pour faire en sorte qu’il y ait une copie de tous ces contenus à différents endroits sur la planète. Pourquoi ? Pour rendre plus facilement accessible de l’endroit où on se trouve et aussi, éventuellement, pour adapter la présentation aux besoins des différentes personnes. Il y a des gens qui veulent faire de la recherche très avancée sur les contenus, ils ont une certaine infrastructure ; d’autres veulent juste le réutiliser ailleurs.
Et il y a aussi un autre aspect, on veut aussi, je vous le disais tout à l’heure 80 millions de ressources en logiciels.

Caroline Lachowsky : C’est monstrueux.

Roberto Di Cosmo : C’est énorme ! Comment chercher dedans ce qui est intéressant. Donc là on essaie de nouer des partenariats avec des équipes de recherche, avec des entreprises, par exemple avec Qwant récemment pour construire un moteur de recherche qui soit adapté au code source, qui facilite l’accès aux contenus pour tout le monde.

Caroline Lachowsky : Pour tout le monde et qui permette aussi, ce dont on parle beaucoup aujourd’hui, ce sont les questions de science ouverte, que tous les chercheurs aient accès à cela. À ce sujet je vous propose, Roberto Di Cosmo, d’écouter l’éclairage d’un chercheur camerounais Thomas Hervé Mboa Nkoudou. Il est doctorant en communication publique à l’université de Laval au Québec ; il est président de l’APSOHA, l’Association pour la promotion de la science ouverte en Haïti et en Afrique francophone ; il a beaucoup travaillé sur toutes ces questions de libre accès, sur les obstacles aussi à l’adoption de la science ouverte par les étudiants africains. Il réagit depuis Yaoundé au Cameroun à la création de cette bibliothèque universelle des codes sources de logiciels.

Thomas Hervé Mboa Nkoudou : En fait, pour moi ça a toujours été très important cette idée d’ouverture et de partage de l’information et du code source pour le design qui existe. C’est juste parce que, en tant qu’Africain et pensant à partir de l’Afrique, je dirais c’est une grosse chance pour nous de pouvoir avoir fait toutes ces données de façon libre et de façon ouverte, parce que ça nous permet de contourner un certain nombre de barrières notamment financières. Pour moi c’est d’une importance capitale d’avoir accès aux codes.

Caroline Lachowsky : Vous avez même mené une enquête sur les obstacles, finalement, à l’adoption de l’open science notamment chez les étudiants en Afrique, en Haïti. Quels sont ces obstacles ?

Thomas Hervé Mboa Nkoudou : En fait le projet SOHA est né du financement d’aide du Canada qui visait justement à documenter l’invisibilité des chercheurs d’Afrique francophone et Haïtiens sur le Web scientifique. On se posait la question de savoir pourquoi avec tous les outils open qui existent aujourd’hui, ces Africains et Haïtiens sont toujours autant absents sur la scène internationale du savoir. Alors on a mené cette enquête-là qui nous a amenés vers neuf injustices cognitives. Nous les avons appelées des injustices cognitives, c’est-à-dire des obstacles qui nous empêchent de penser en tant qu’Africains parce qu’elle n’est pas forcément liée à nous, elle est quelquefois liée à la barrière linguistique, elle est liée à la barrière infra-structurelle, elle est liée à la barrière pédagogique et elle est liée… on en a neuf ; en tout cas nous avons sorti tout un livre là-dessus avec mes collègues.

Caroline Lachowsky : Et vous avez l’impression que justement ces bibliothèques universelles du code source, cette manière de partager le patrimoine logiciel de l’humanité, ça peut être particulièrement utile pour lever ces obstacles, les injustices cognitives pour les chercheurs africains ou pour les étudiants africains et haïtiens ?

Thomas Hervé Mboa Nkoudou : C’est déjà un bon début, mais il faut se poser la question de savoir aussi dans quel sens. Parce que le libre accès et l’ouverture aussi est un couteau à double sens. Parce s’il faut faire une écologie du savoir sur le Web on se rend compte que la majorité des savoirs disponibles proviennent d’une région du monde, notamment du Nord. Il faut donner aux Africains, donner aux universités africaines, aux institutions supérieures africaines, les infrastructures qui permettront aux chercheurs africains ou bien aux savants africains de générer la connaissance endogène.

Caroline Lachowsky : Merci infiniment. On va en reparler avec vous certainement sur notre antenne Thomas Hervé Mboa Nkoudou. Est-ce que vous auriez, pour terminer, une question à poser à notre invité, en studio avec nous, Roberto Di Cosmo ?

Thomas Hervé Mboa Nkoudou : Je ne sais pas quelles mesures ont été prises au niveau local, parce que l’Unesco quand même a une puissance politique ; ils peuvent facilement faire avancer les choses au niveau africain. Donc j’aimerais bien savoir sur la structure au niveau du Cameroun, au niveau d’autres pays africains, quelles sont les dispositions qui ont été prises ? Parce qu’il est aussi vrai que l’Unesco en tant que force politique peut-être va s’arrêter au niveau étatique, au niveau exécutif, mais l’information n’arrive jamais où ça devrait arriver c’est-à-dire au niveau des étudiants. Par exemple pour moi la chose qui ferait changer les choses lors de sa présentation qu’il nous présente un peu les dispositions pour qu’un étudiant qui n’est pas le neveu de tel ministre soit autant informé, autant impliqué dans la chose. C’est compliqué comme question, mais ce sont nos réalités.

24’ 23

Caroline Lachowsky : Que pouvez-vous répondre, Roberto Di Cosmo, à cette question compliquée mais bien réelle de Thomas Hervé Mboa Nkoudou au Cameroun ?

Roberto Di Cosmo : Effectivement. Il a soulevé tout un tas de questions. J’aimerais bien les reprendre dans un autre ordre.

Caroline Lachowsky : Volontiers.

Roberto Di Cosmo : Tout d’abord ce qu’on appelle la science ouverte aujourd’hui m’appelle une petite réflexion. Vous voyez, moi à l’époque où j’étais étudiant par exemple je n’aurais jamais pensé de la science fermée ; la science était naturellement ouverte. J’ai étudié à Pise qui était la patrie de Galileo Galilei qui est celui qui a créé la méthode scientifique – c’est ce que nous disons en Italie, je sais bien qu’en France on dit autre chose, mais l’important c’est que la méthode scientifique est là – et une partie essentielle de la méthode scientifique c’est la capacité pour d’autres de vérifier indépendamment ce que nous avons trouvé, nous, dans notre recherche.

Caroline Lachowsky : Donc la science, pour vous, était essentiellement fondamentalement ouverte.

Roberto Di Cosmo : Fondamentalement ouverte parce que sinon ce n’est pas de la science. Comme disait Karl Popper qui est un épistémologue très influent du début du siècle passé, les occurences non reproductibles n’ont pas d’intérêt pour la science. C’est nécessaire de pouvoir reproduire ces connaissances. Pour reproduire ces connaissances il faut regarder le monde d’aujourd’hui qui est un monde beaucoup plus complexe que celui de nos ancêtres il y a quatre ou cinq siècles. Vous avez des articles scientifiques qui décrivent ce qu’on a trouvé quand on fait de la recherche mais très souvent aujourd’hui, quand vous regardez ces articles, cet article vous dit que vous avez analysé un certain nombre de données, un certain jeu de données, que vous avez fait un certain type de calcul et que ce calcul a donné un certain résultat qui est le résultat scientifique. Je ne sais pas, par exemple 42. Eh bien si vous avez seulement l’article, vous n’avez pas les données, vous n’avez pas les logiciels avec lesquels on a fait les calculs, comment je peux bien vérifier, moi, que le résultat est bien 42 et comment je peux jouer avec pour apprendre des choses nouvelles, changer un peu les données, voir si le résultat reste toujours 42 ou si c’était un hasard, etc. ? Donc c’est vraiment nécessaire de rendre les articles scientifiques librement accessibles. Et là il y a une véritable barrière entre le Nord et le Sud qui vient du modèle de publication scientifique actuel qui est complètement inadapté au mode de transmission moderne dans lequel Internet permet de rendre les choses disponibles immédiatement et alors qu’on a bloqué tout ça derrière des barrières financières sur lesquelles il faudrait passer une émission entière.

Caroline Lachowsky : Oui, il faudrait passer une émission entière, rappelons quand même que vous êtes un ardent défenseur des logiciels libres.

Roberto Di Cosmo : Et de l’open access.

Caroline Lachowsky : Et de l’open access et que vous avez tout de suite senti ces obstacles, ces dangers, cette fermeture.

Roberto Di Cosmo : Immédiatement.

Caroline Lachowsky : Une fermeture on va dire quoi ? Économique, du savoir, enfin vraiment on a fermé un outil qui était totalement ouvert.

Roberto Di Cosmo : Qui était totalement ouvert. Qui était censé être ouvert. Pour résumer en quelques lignes ma vision de ce qui s’est passé ; je suis suffisamment âgé pour avoir vécu la période avant Internet. Avant Internet, le mécanisme le plus efficace pour diffuser le savoir c’était effectivement de publier dans des journaux papier qui après étaient redistribués dans toutes les bibliothèques sur le monde, il n’y avait pas d’autre solution.

Caroline Lachowsky : Or aujourd’hui, avec Internet…

Roberto Di Cosmo : Or aujourd’hui, avec Internet, cette façon de fonctionner est complètement obsolète ; on peut aller beaucoup plus vite. Mais si vous voulez avant, l’économie d’avant Internet est une économie dans laquelle tout le monde trouvait son petit bénéfice : les chercheurs y trouvaient la façon plus efficace de distribuer ; les bibliothèques avaient une façon de dupliquer les choses à un coût pas trop élevé ; les éditeurs se rémunéraient à côté. Aujourd’hui on est dans un monde dans lequel le travail habituel des éditeurs n’a plus de sens ; il faut distribuer plus facilement, plus rapidement, mais on a entre temps des entreprises milliardaires qui existent et qui freinent évidemment. Là il y a un changement de modèle économique ; ce changement-là n’a pas été complètement maîtrisé.

Caroline Lachowsky : Et en même temps vous qui êtes un ardent défenseur de l’open access, des logiciels libres, pour monter cette extraordinaire bibliothèque universelle du code source, donc pour collecter et partager cette science informatique, vous avez fait une fondation et qui est-ce qu’on retrouve ? Certains de vos « ennemis » entre guillemets des GAFAM, des grosses ???, des grosses entreprises informatiques qui, au départ, voulaient tout fermer et qui en fait se rendent compte que ce n’est pas possible.

Roberto Di Cosmo : Et là, si vous voulez, c’est quelque chose de fascinant ; vous avez raison de le rappeler. Il y a 20 ans j’avais écrit un livre qui était un peu au vitriol sur Microsoft. Vous savez des fois on dit « quand le sage indique que la lune, le sot ne voit qu’un doigt ». À l’époque moi j’étais très énervé contre un monopole complet sur la chaîne de l’information et il arrive qu’il y a 20 ans, le monopoliste sur la chaîne de l’information s’appelait Microsoft.

Caroline Lachowsky : Aujourd’hui ce ne sont les GAFA.

Roberto Di Cosmo : Ce ne sont pas tout à fait les mêmes.

Caroline Lachowsky : Ce ne sont pas tout à fait les mêmes.

Roberto Di Cosmo : Donc je ne suis pas très surpris de voir Microsoft qui devient plutôt partenaire en soutien. Je ne dis pas que tout est blanc, mais quand même le monde n’a pas mal changé. Et effectivement on a besoin de contribuer à ce partage de la connaissance. Je reviens sur la partie science ouverte ; c’est important de partager les articles, c’est important de partager les données et jusque-là on avait un petit peu oublié que c’est bien d’avoir ??? les données mais si on n’a pas le logiciel avec lequel on a fait les analyses, on est toujours incapable de reproduire un résultat scientifique.
Donc ce qu’apporte Software Heritage, cet éclairage-là, c’est une plateforme internationale pour partager les codes sources des chercheurs, des recherches et, avec ça, on commence avec le ministère de la recherche ici en France, on commence à collaborer avec des entités internationales, parce que c’est la même infrastructure qu’on utilise aussi pour le patrimoine culturel, c’est le même tuyau, mais qui a une finalité importante pour le partage des connaissances.

Caroline Lachowsky : Et qui pourra donc être partagé sur la planète entière

Roberto Di Cosmo : Sur la planète entière.

Caroline Lachowsky : Dans le monde entier et réduire cette injustice cognitive dont parlait notre chercheur camerounais.

Roberto Di Cosmo : Absolument. Mais il y a une autre partie dans l’injustice cognitive dont il parle c’est effectivement le fait qu’il faut exposer plus souvent les chercheurs des pays émergents à des modèles, des connaissances et des modèles économiques plus avancés, sur lesquels on commence à travailler maintenant.
Je reviens sur votre question sur Microsoft. Par exemple Microsoft, Oracle, ces entreprises-là, il y a 20 ans, ne juraient que par des logiciels propriétaires, fermés, et maintenant, si vous regardez 20 ans après, petit à petit ils sont en train de prendre un énorme tournant ils sont en train d’investir de plus en plus dans le développement des logiciels libres, ils contribuent aux logiciels libres. L’année passée Microsoft était le premier contributeur en logiciels libres sur la plateforme la plus connue qui s’appelle GitHub ; c’est étonnant mais en réalité c’est aussi naturel parce que la complexité des logiciels grandit à une telle vitesse qu’on ne peut plus se permettre de tout refaire tout seul et qu’il est nécessaire d’avoir des ingénieurs, des personnes qui connaissent bien ces logiciels ; et la meilleure façon de les connaître c’est de pouvoir mettre la main dans le code source. Vous vous rappelez, c’est le code source qu’on peut lire en étant développeur.

Caroline Lachowsky : Donc mettre les mains dans le cambouis du code source, ouvrir le capot de la machine.

Roberto Di Cosmo : Dans le cambouis du code source, ouvrir le capot de la machine. Donc petit à petit les gens sont en train de migrer dans cette direction et c’est le même mouvement que vous voyez aussi dans ce mouvement de science ouverte ; on se rend compte que c’est important de partager parce que comme ça on construit plus, on va plus loin. Ce qui n’enlève rien après de valoriser la recherche scientifique, mais ça c’est un autre sujet.

Caroline Lachowsky : C’est un autre sujet. Autour de la question, « comment partager nos logiciels en toute liberté ». On s’interroge depuis la Jamaïque de l’importance de partager avec Capleton sur RFI Never Share ; ça c’est politique !

[Pause musicale]

33’ 00

Caroline Lachowsky : Capleton sur RFI, Never Share.