Pourquoi une bibliothèque universelle des logiciels - Software Heritage - Roberto Di Cosmo : Différence entre versions

De April MediaWiki
(16’ 55)
(24’ 23)
Ligne 155 : Ligne 155 :
 
<b>Caroline Lachowsky : </b>Donc la science, pour vous, était essentiellement, fondamentalement ouverte.
 
<b>Caroline Lachowsky : </b>Donc la science, pour vous, était essentiellement, fondamentalement ouverte.
  
<b>Roberto Di Cosmo : </b>Fondamentalement ouverte parce que sinon ce n’est pas de la science. Comme disait Karl Popper qui est un épistémologue très influent du début du siècle passé, les occurrences non reproductibles n’ont pas d’intérêt pour la science. C’est nécessaire de pouvoir reproduire ces connaissances. Pour reproduire ces connaissances il faut regarder le monde d’aujourd’hui qui est un monde beaucoup plus complexe que celui de nos ancêtres il y a quatre ou cinq siècles. Vous avez des articles scientifiques qui décrivent ce qu’on a trouvé quand on fait de la recherche mais, très souvent aujourd’hui, quand vous regardez ces articles, cet article vous dit que vous avez analysé un certain nombre de données, un certain jeu de données, que vous avez fait un certain type de calcul et que ce calcul a donné un certain résultat qui est le résultat scientifique. Je ne sais pas, par exemple 42. Eh bien si vous avez seulement l’article, vous n’avez pas les données, vous n’avez pas les logiciels avec lesquels on a fait les calculs, comment je peux bien vérifier, moi, que le résultat est bien 42 et comment je peux jouer avec pour apprendre des choses nouvelles, changer un peu les données, voir si le résultat reste toujours 42 ou si c’était un hasard, etc. ? Donc c’est vraiment nécessaire de rendre les articles scientifiques librement accessibles. Et là il y a une véritable barrière entre le Nord et le Sud qui vient du modèle de publication scientifique actuel qui est complètement inadapté au mode de transmission moderne dans lequel Internet permet de rendre les choses disponibles immédiatement et alors qu’on a bloqué tout ça derrière des barrières financières sur lesquelles il faudrait passer une émission entière.
+
<b>Roberto Di Cosmo : </b>Fondamentalement ouverte parce que sinon ce n’est pas de la science. Comme disait Karl Popper qui est un épistémologue très influent du début du siècle passé, les occurrences non reproductibles n’ont pas d’intérêt pour la science. C’est nécessaire de pouvoir reproduire ces connaissances. Pour reproduire ces connaissances il faut regarder le monde d’aujourd’hui qui est un monde beaucoup plus complexe que celui de nos ancêtres il y a quatre ou cinq siècles. Vous avez des articles scientifiques qui décrivent ce qu’on a trouvé quand on fait de la recherche mais, très souvent aujourd’hui, quand vous regardez ces articles, un article vous dit que vous avez analysé un certain nombre de données, un certain jeu de données, que vous avez fait un certain type de calcul et que ce calcul a donné un certain résultat qui est le résultat scientifique. Je ne sais pas, par exemple 42. Eh bien si vous avez seulement l’article, vous n’avez pas les données, vous n’avez pas les logiciels avec lesquels on a fait les calculs, comment je peux bien vérifier, moi, que le résultat est bien 42 et comment je peux jouer avec pour apprendre des choses nouvelles, changer un peu les données, voir si le résultat reste toujours 42 ou si c’était un hasard, etc. ? Donc c’est vraiment nécessaire de rendre les articles scientifiques librement accessibles. Et là il y a une véritable barrière entre le Nord et le Sud qui vient du modèle de publication scientifique actuel qui est complètement inadapté au mode de transmission moderne dans lequel Internet permet de rendre les choses disponibles immédiatement, alors qu’on a bloqué tout ça derrière des barrières financières sur lesquelles il faudrait passer une émission entière.
  
<b>Caroline Lachowsky : </b>Oui, il faudrait passer une émission entière, rappelons quand même que vous êtes un ardent défenseur des logiciels libres.
+
<b>Caroline Lachowsky : </b>Oui, il faudrait passer une émission entière. Rappelons quand même que vous êtes un ardent défenseur des logiciels libres.
  
 
<b>Roberto Di Cosmo : </b>Et de l’<em>open access</em>.
 
<b>Roberto Di Cosmo : </b>Et de l’<em>open access</em>.
Ligne 167 : Ligne 167 :
 
<b>Caroline Lachowsky : </b>Une fermeture on va dire quoi ? Économique, du savoir, enfin vraiment on a fermé un outil qui était totalement ouvert.
 
<b>Caroline Lachowsky : </b>Une fermeture on va dire quoi ? Économique, du savoir, enfin vraiment on a fermé un outil qui était totalement ouvert.
  
<b>Roberto Di Cosmo : </b>Qui était totalement ouvert. Qui était censé être ouvert. Pour résumer en quelques lignes ma vision de ce qui s’est passé ; je suis suffisamment âgé pour avoir vécu la période avant Internet. Avant Internet, le mécanisme le plus efficace pour diffuser le savoir c’était effectivement de publier dans des journaux papier qui, après, étaient redistribués dans toutes les bibliothèques sur le monde, il n’y avait pas d’autre solution.
+
<b>Roberto Di Cosmo : </b>Qui était totalement ouvert. Qui était censé être ouvert. Pour résumer en quelques lignes ma vision de ce qui s’est passé ; je suis suffisamment âgé pour avoir vécu la période avant Internet. Avant Internet, le mécanisme le plus efficace pour diffuser le savoir c’était effectivement de publier dans des journaux papier qui, après, étaient redistribués dans toutes les bibliothèques sur le monde ; il n’y avait pas d’autre solution.
  
 
<b>Caroline Lachowsky : </b>Or aujourd’hui, avec Internet…
 
<b>Caroline Lachowsky : </b>Or aujourd’hui, avec Internet…
  
<b>Roberto Di Cosmo : </b>Or aujourd’hui, avec Internet, cette façon de fonctionner est complètement obsolète ; on peut aller beaucoup plus vite. Mais si vous voulez, avant, l’économie d’avant Internet était une économie dans laquelle tout le monde trouvait son petit bénéfice : les chercheurs y trouvaient la façon plus efficace de distribuer ; les bibliothèques avaient une façon de dupliquer les choses à un coût pas trop élevé ; les éditeurs se rémunéraient à côté. Aujourd’hui, on est dans un monde dans lequel le travail habituel des éditeurs n’a plus de sens ; il faut distribuer plus facilement, plus rapidement, mais on a entre temps des entreprises milliardaires qui existent et qui freinent évidemment. Là il y a un changement de modèle économique ; ce changement-là n’a pas été complètement maîtrisé.
+
<b>Roberto Di Cosmo : </b>Or aujourd’hui, avec Internet, cette façon de fonctionner est complètement obsolète ; on peut aller beaucoup plus vite. Mais si vous voulez, avant, l’économie d’avant Internet était une économie dans laquelle tout le monde trouvait son petit bénéfice : les chercheurs y trouvaient la façon la plus efficace de distribuer ; les bibliothèques avaient une façon de dupliquer les choses à un coût pas trop élevé ; les éditeurs se rémunéraient à côté. Aujourd’hui on est dans un monde dans lequel le travail habituel des éditeurs n’a plus de sens ; il faut distribuer plus facilement, plus rapidement, mais on a, entre temps, des entreprises milliardaires qui existent et qui freinent évidemment. Là il y a un changement de modèle économique ; ce changement-là n’a pas été complètement maîtrisé.
  
 
<b>Caroline Lachowsky : </b>Et en même temps, vous qui êtes un ardent défenseur de l’<em>open access</em>, des logiciels libres, pour monter cette extraordinaire bibliothèque universelle du code source, donc pour collecter et partager cette science informatique, vous avez fait une fondation et qui est-ce qu’on retrouve ? Certains de vos « ennemis » entre guillemets des GAFAM, des gros stores, des grosses entreprises informatiques qui, au départ, voulaient tout fermer et qui, en fait, se rendent compte que ce n’est pas possible.
 
<b>Caroline Lachowsky : </b>Et en même temps, vous qui êtes un ardent défenseur de l’<em>open access</em>, des logiciels libres, pour monter cette extraordinaire bibliothèque universelle du code source, donc pour collecter et partager cette science informatique, vous avez fait une fondation et qui est-ce qu’on retrouve ? Certains de vos « ennemis » entre guillemets des GAFAM, des gros stores, des grosses entreprises informatiques qui, au départ, voulaient tout fermer et qui, en fait, se rendent compte que ce n’est pas possible.
  
<b>Roberto Di Cosmo : </b>Et là, si vous voulez, c’est quelque chose de fascinant ; vous avez raison de le rappeler. Il y a 20 ans j’avais écrit un livre<ref>[http://www.dicosmo.org/HoldUp/ <em>Le Hold-up planétaire :la face cachée de Microsoft</em>, Roberto Di Cosmo et Dominique Nora]</ref> qui était un peu au vitriol sur Microsoft. Vous savez des fois on dit « quand le sage indique que la lune, le sot ne voit qu’un doigt ». À l’époque moi j’étais très énervé contre un monopole complet sur la chaîne de l’information et il y a 20 ans, le monopoliste sur la chaîne de l’information s’appelait Microsoft.
+
<b>Roberto Di Cosmo : </b>Et là, si vous voulez, c’est quelque chose de fascinant ; vous avez raison de le rappeler. Il y a 20 ans j’avais écrit un livre<ref>[http://www.dicosmo.org/HoldUp/ <em>Le Hold-up planétaire :la face cachée de Microsoft</em>, Roberto Di Cosmo et Dominique Nora]</ref> qui était un peu au vitriol sur Microsoft. Vous savez des fois on dit : « Quand le sage indique que la lune, le sot ne voit qu’un doigt ». À l’époque j’étais très énervé contre un monopole complet sur la chaîne de l’information et il y a 20 ans, le monopoliste sur la chaîne de l’information s’appelait Microsoft. Si vous regardez, aujourd'hui ce ne sont pas tout à fait les mêmes.
  
<b>Caroline Lachowsky : </b>Aujourd’hui ce sont les GAFA.
+
<b>Caroline Lachowsky : </b>Aujourd’hui ce sont les GAFA.Ce ne sont pas tout à fait les mêmes.
  
<b>Roberto Di Cosmo : </b>Ce ne sont pas tout à fait les mêmes.
+
<b>Roberto Di Cosmo : </b>Donc je ne suis pas très surpris de voir Microsoft qui devient plutôt partenaire en soutien. Je ne dis pas que tout est blanc, mais quand même, le monde n’a pas mal changé. Et effectivement on a besoin de contribuer à ce partage de la connaissance. Je reviens sur la partie science ouverte ; c’est important de partager les articles, c’est important de partager les données et jusque-là on avait un petit peu oublié que c’est bien d’avoir les articles et les données, mais si on n’a pas les logiciels avec lesquels on a fait les analyses, on est toujours incapable de reproduire le résultat scientifique.<br />  
 
+
Donc ce qu’apporte Software Heritage, dans cet éclairage-là, c’est une plateforme internationale pour partager les codes sources des chercheurs, des recherches et, avec ça, on commence à travailler avec le ministère de la Recherche ici en France, on commence à collaborer avec des entités internationales, parce que c’est la même infrastructure qu’on utilise aussi pour le patrimoine culturel, c’est le même tuyau, mais qui a une finalité importante pour le partage des connaissances.
<b>Caroline Lachowsky : </b>Ce ne sont pas tout à fait les mêmes.
 
 
 
<b>Roberto Di Cosmo : </b>Donc je ne suis pas très surpris de voir Microsoft qui devient plutôt partenaire en soutien. Je ne dis pas que tout est blanc, mais quand même, le monde n’a pas mal changé. Et effectivement on a besoin de contribuer à ce partage de la connaissance. Je reviens sur la partie science ouverte ; c’est important de partager les articles, c’est important de partager les données et jusque-là on avait un petit peu oublié que c’est bien d’avoir les articles et les données, mais si on n’a pas le logiciel avec lequel on a fait les analyses, on est toujours incapable de reproduire un résultat scientifique.<br />  
 
Donc ce qu’apporte Software Heritage, cet éclairage-là, c’est une plateforme internationale pour partager les codes sources des chercheurs, des recherches et, avec ça, on commence avec le ministère de la Recherche ici en France, on commence à collaborer avec des entités internationales, parce que c’est la même infrastructure qu’on utilise aussi pour le patrimoine culturel, c’est le même tuyau, mais qui a une finalité importante pour le partage des connaissances.
 
  
 
<b>Caroline Lachowsky : </b>Et qui pourra donc être partagé sur la planète entière ?
 
<b>Caroline Lachowsky : </b>Et qui pourra donc être partagé sur la planète entière ?
Ligne 192 : Ligne 188 :
 
<b>Caroline Lachowsky : </b>Dans le monde entier et réduire cette injustice cognitive dont parlait notre chercheur camerounais.
 
<b>Caroline Lachowsky : </b>Dans le monde entier et réduire cette injustice cognitive dont parlait notre chercheur camerounais.
  
<b>Roberto Di Cosmo : </b>Absolument. Mais il y a une autre partie dans l’injustice cognitive dont il parle c’est effectivement le fait qu’il faut exposer plus souvent les chercheurs des pays émergents à des modèles, des connaissances et des modèles économiques plus avancés, sur lesquels on commence à travailler maintenant.<br />
+
<b>Roberto Di Cosmo : </b>Absolument. Mais il y a une autre partie dans l’injustice cognitive dont il parle c’est effectivement le fait qu’il faut exposer plus souvent les chercheurs des pays émergents à des modèles, des connaissances et à des modèles économiques plus avancés, sur lesquels on commence à travailler maintenant.<br />
Je reviens sur votre question sur Microsoft. Par exemple Microsoft, Oracle, ces entreprises-là, il y a 20 ans, ne juraient que par des logiciels propriétaires, fermés, et maintenant, si vous regardez 20 ans après, petit à petit, ils sont en train de prendre un énorme tournant, ils sont en train d’investir de plus en plus dans le développement des logiciels libres, ils contribuent aux logiciels libres. L’année passée Microsoft était le premier contributeur en logiciels libres sur la plateforme la plus connue qui s’appelle GitHub ; c’est étonnant mais en réalité c’est aussi naturel parce que la complexité des logiciels grandit à une telle vitesse qu’on ne peut plus se permettre de tout refaire tout seul et qu’il est nécessaire d’avoir des ingénieurs, des personnes qui connaissent bien ces logiciels ; et la meilleure façon de les connaître c’est de pouvoir mettre les mains dans le code source. Vous vous rappelez, c’est le code source qu’on peut lire en étant développeur.
+
Je reviens sur votre question sur Microsoft. Par exemple Microsoft, Oracle, ces entreprises-là, il y a 20 ans, ne juraient que par des logiciels propriétaires, fermés, et maintenant, si vous regardez 20 ans après, petit à petit, elles sont en train de prendre un énorme tournant, elles sont en train d’investir de plus en plus dans le développement des logiciels libres, elles contribuent aux logiciels libres. L’année passée Microsoft était le premier contributeur en logiciels libres sur la plateforme la plus connue qui s’appelle GitHub ; c’est étonnant mais en réalité c’est aussi naturel parce que la complexité des logiciels grandit à une telle vitesse qu’on ne peut plus se permettre de tout refaire tout seul et qu’il est nécessaire d’avoir des ingénieurs et des personnes qui connaissent bien ces logiciels ; et la meilleure façon de les connaître c’est de pouvoir mettre les mains dans le code source. Vous vous rappelez, c’est le code source qu’on peut lire en étant développeur.
  
 
<b>Caroline Lachowsky : </b>Donc mettre les mains dans le cambouis du code source, ouvrir le capot de la machine.
 
<b>Caroline Lachowsky : </b>Donc mettre les mains dans le cambouis du code source, ouvrir le capot de la machine.
Ligne 199 : Ligne 195 :
 
<b>Roberto Di Cosmo : </b>Dans le cambouis du code source, ouvrir le capot de la machine. Donc petit à petit les gens sont en train de migrer dans cette direction et c’est le même mouvement que vous voyez aussi dans ce mouvement de science ouverte ; on se rend compte que c’est important de partager parce que, comme ça, on construit plus, on va plus loin. Ce qui n’enlève rien, après, à la difficulté de valoriser la recherche scientifique, mais ça c’est un autre sujet.
 
<b>Roberto Di Cosmo : </b>Dans le cambouis du code source, ouvrir le capot de la machine. Donc petit à petit les gens sont en train de migrer dans cette direction et c’est le même mouvement que vous voyez aussi dans ce mouvement de science ouverte ; on se rend compte que c’est important de partager parce que, comme ça, on construit plus, on va plus loin. Ce qui n’enlève rien, après, à la difficulté de valoriser la recherche scientifique, mais ça c’est un autre sujet.
  
<b>Caroline Lachowsky : </b>C’est un autre sujet. <em>Autour de la question</em>, « comment partager nos logiciels en toute liberté ». On s’interroge depuis la Jamaïque de l’importance de partager avec Capleton sur RFI <em>Never Share</em> ; ça c’est politique !
+
<b>Caroline Lachowsky : </b>C’est un autre sujet. <em>Autour de la question</em>, « comment partager nos logiciels en toute liberté ». On s’interroge depuis la Jamaïque sur l’importance de partager avec Capleton sur RFI <em>Never Share</em> ; ça c’est politique !
  
 
[Pause musicale]
 
[Pause musicale]

Version du 16 mars 2019 à 16:17


Titre : « Pourquoi une bibliothèque universelle des logiciels ? »

Intervenants : Roberto Di Cosmo - Caroline Lachowsky - Thomas Hervé Mboa Nkoudou - François Héran

Lieu : Émission Autour de la question - RFI

Date : septembre 2018

Durée : 48 min 30

Présentation de l'émission - Télécharger le podcast

Licence de la transcription : Verbatim

NB : transcription réalisée par nos soins. Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Statut : Transcrit MO - Corrections de @macousine/MO

Description

Notre invité du jour, le chercheur en informatique Roberto Di Cosmo, s'interrogera autour de la question suivante : « Pourquoi une bibliothèque universelle des logiciels ? » Pourquoi une bibliothèque universelle (une bibliothèque d’Alexandrie) des logiciels ? Comment collecter, préserver et rendre accessible à tous, ce nouveau patrimoine commun de l’humanité ? Comment partager nos logiciels en toute liberté ? Avec Roberto Di Cosmo, chercheur en informatique détaché auprès d'Inria, directeur de l'initiative Software Heritage, professeur d'Informatique de l'Université Paris Diderot, et membre de l'IRIF.

Transcription

Voix off : Autour de la question. D’où ça vient ? Qu’est-ce que ça va changer ? C’est pour qui ? À quoi ça sert ? Caroline Lachowsky.

Caroline Lachowsky : Bonjour. Ravie de vous retrouver chers amis auditeurs pour une nouvelle saison avec Hugo Violasse à la réalisation cette année, autour de toutes les questions qui nous animent. J’en profite pour vous remercier de votre interactivité et de votre curiosité. Nous ferons d’ailleurs encore plus appel à vous pour nourrir nos échanges. Je vous en reparle très vite, car nous sommes concernés et tous contributeurs aujourd’hui et c’est précisément cette réflexion qui a amené notre invité. Le chercheur en informatique Roberto Di Cosmo, ardent défenseur de la diffusion des savoirs, a initié une bibliothèque universelle des logiciels. Une véritable bibliothèque d’Alexandrie pour collecter, préserver et rendre accessibles à tous les codes sources de tous les logiciels disponibles dans le monde. Soutenue par l’Unesco, cette initiative essentielle, Software Heritage[1], arrive à point nommé pour préserver et mettre en commun ce nouveau patrimoine de l’humanité. Autour de la question pourquoi et comment partager nos logiciels en toute liberté ? Bienvenue.
Bonjour Roberto Di Cosmo.

Roberto Di Cosmo : Bonjour Caroline.

Caroline Lachowsky : Merci d’être en direct avec nous. Vous êtes chercheur informaticien, professeur à l’université de Paris Diderot, détaché auprès d’Inria, l’Institut national de recherche en informatique, ardent défenseur des logiciels libres et de la diffusion de tous les savoirs. Vous êtes à l’initiative de ce fantastique projet de grande bibliothèque du code source, Software Heritage, inauguré à l’Unesco en juin dernier : la bibliothèque d’Alexandrie des logiciels a pour mission de collecter, d’organiser, de préserver et de partager tous les logiciels disponibles. C’est une initiative formidable, assez monumentale ; comment vous est venue cette idée Roberto Di Cosmo ?

Roberto Di Cosmo : Tout d’abord je vous remercie beaucoup Caroline de m’accueillir pour parler de ce projet ; c’est quelque chose que je trouve passionnant. Pour comprendre effectivement il faut que je vous dise comment cette idée est née. Je suis un chercheur en informatique, avec les gens qui travaillent avec moi comme Stefano Zacchiroli et d’autres personnes de mon équipe, je travaille sur l’analyse et l’évolution des codes logiciels. Il y a à peu près quatre ans on avait commencé un certain travail d’analyse sur des logiciels, qui avait l’air de fonctionner plutôt bien, et c’était tout naturel de se poser la question et de dire comment on peut faire ce travail-là sur tous les logiciels qui existent ? Donc on a juste commencé à chercher en se disant il doit bien y avoir un endroit dans lequel il y a bien tous les codes sources de tous les logiciels ; il y a sûrement quelqu’un qui y a pensé. Et on a bien cherché, on a bien cherché à droite, à gauche, on n’a rien trouvé et, du coup, on a pris conscience d’un problème qui est quand même incroyable, c’est-à-dire que l’informatique est une discipline qui a changé, transformé, révolutionné notre monde, il y a des logiciels partout, ils sont nécessaires pour communiquer, pour transférer, pour acheter, pour s’entretenir, pour tout faire – et ils sont assez récents, ça fait une cinquantaine d’années que les logiciels ont commencé vraiment à transformer notre monde – et pourtant, personne jusque-là ne s’est soucié de préserver ce nouveau patrimoine des connaissances technologiques.

Caroline Lachowsky : Un nouveau patrimoine de connaissances technologiques. Rappelons, on va y revenir, que les logiciels, les tout premiers sont toujours valables aujourd’hui. J’ai envie de vous poser la question : pourquoi maintenant ? Mais parce que maintenant peut-être qu’on est à une période charnière, justement, entre les débuts de l’informatique et puis cette croissance exponentielle des logiciels ?

Roberto Di Cosmo : Absolument. Donc là, quand on a commencé à regarder – le sujet est immédiatement devenu passionnant quand on s’en est aperçu – on s’est rendu compte qu’on est à un moment vraiment charnière, un moment particulier dans l’histoire de l’informatique, parce que les premiers informaticiens un peu modernes, ceux qui commencé à travailler avec des vrais ordinateurs, datent d’il y a un petit demi-siècle. Un petit demi siècle c’est beaucoup pour la vitesse d’évolution de l’informatique mais c’est très peu par rapport à l’histoire d’une discipline.
Donc on a une opportunité unique de pouvoir encore parler à la plupart des gens qui ont écrit les premiers logiciels, qui savent comment les logiciels qui ont fabriqué Internet, qui ont fabriqué le Web, qui ont fabriqué tout ça, ont été développés, pourquoi ils ont été faits de telle sorte ; ces personnes sont encore vivantes.

Caroline Lachowsky : Donc on peut aller les voir et on peut leur demander comment elles ont fait leur code et récupérer tous ces codes sources. C’est ça ?

Roberto Di Cosmo : On peut aller les voir. Exactement. Et ça c’est une opportunité unique parce que dans d’autres disciplines ! Je parle des mathématiques : moi j’aimerais bien pouvoir parler avec Archimède et lui demander pourquoi il a fait les choses comme ça, mais c’est un peu trop tard, il y a 2000 ans qui sont passés ! J’aimerais bien parler avec Leibnitz, avec Newton, avec Pascal, mais c’est un peu trop tard, ils sont déjà tous partis, alors que dans l’informatique l’essentiel des gens est encore là. Donc il y a cette possibilité de tout récupérer et, en plus, si vous regardez – on a des chiffres, on peut regarder comment ça fonctionne – aujourd'hui on voit que le développement des logiciels explose. Il n’y a jamais eu autant de logiciels qui sont développés. Donc non seulement on peut récupérer le passé, mais on se trouve aussi dans une phase où il est vraiment nécessaire de construire l’infrastructure de préservation pour s’assurer que demain on ne devra pas faire un effort inhumain pour récupérer des choses qu’on perd. Chaque année qui passe, la quantité de logiciels à préserver grandit et il faut s’y mettre tout de suite pour que la tâche ne soit pas infaisable.

Caroline Lachowsky : Pour collecter ce qui est fait et ensuite pour pouvoir les relire, si j’ose dire, sur tous les supports parce que cette question est là aussi, évidement.

Roberto Di Cosmo : Évidemment ! Et c’est très bien qu’on ait parlé de ça parce que vous voyez, on peut se poser la question et savoir : mais d’accord, mais les logiciels, moi je suis pas informaticien pourquoi ça devrait m’intéresser ? D’un côté, il faut savoir que les logiciels arrivent en deux fois : il y a les logiciels exécutables qu’on peut trouver sur son téléphone ou sur son ordinateur, qu’on utilise pour faire une tâche particulière, ça c’est bien, mais ces logiciels exécutables-là ne sortent pas d’un chapeau ; ils ont été écrits, et regardez, on utilise vraiment le terme « écrire un logiciel ». Les logiciels sont écrits par des développeurs, par des êtres humains, qui peuvent être des développeurs, des ingénieurs, des chercheurs, des hobbyistes, des personnes qui ont appris l'informatique toutes seules et qui écrivent ces logiciels dans ce qu’on appelle des langages informatiques. Ces langages informatiques et ces codes sources des logiciels sont une forme de connaissance spéciale parce qu’ils sont faits pour qu’un autre développeur puisse les lire, parce qu’on a besoin de les modifier peut-être dans une semaine, peut-être dans un mois, et peut-être que la personne qui va les modifier ça va être moi-même donc j’ai intérêt à ce que ça soit lisible. Et en même temps, ils sont suffisamment techniquement détaillés pour produire les exécutables qu’on utilise partout.
Donc nous on se focalise sur les codes sources et pourquoi les codes sources ? Parce que justement, comme ils sont faits pour être lus par des êtres humains, ils ont la propriété qu’on pourra toujours les relire et comprendre ce qu’ils font, même quand les machines sur lesquelles ils pouvaient s’exécuter n’existeront plus.

Caroline Lachowsky : Autour de la question. Pourquoi et comment l’heure est venue de collecter et de partager tous ces codes sources de nos logiciels en toute liberté ? Petit rappel historique et chronologique de cette informatisation de notre monde. C’est le mix forcément codé et programmé par Hugo Violasse.

7’ 08

Voix off : Le premier programmeur au monde est une programmeuse. Et ça, c’est l’histoire d’Ada Lovelace[2] ; elle s’est passionnée pour la machine analytique. Dans une de ses notes, elle décrit l’enchaînement d’instructions qu’il faut donner à la machine pour réaliser une suite mathématique, mais pas seulement l’algorithme qui permet de réaliser cette suite, elle décrit jusqu’à la position des rouages. Et ça, traduire un algorithme dans une séquence d’instructions qu’il faut donner à un ordinateur pour qu’il le réalise, c’est de la programmation informatique.

— C’est incroyable ça !

— Ça c’est un ordinateur qui ne peut rien faire comme ça. Ce qu’on fait c’est qu’on prend une cassette et, à partir de là, cette cassette contient des programmes pour l’ordinateur et, vous avez vu, j’ai appuyé sur un bouton, j’appuie sur autre bouton et maintenant on va charger le programme.

— Ah ! Vous êtes le nouveau prof d’informatique, c’est ça ?

Voix off de Richard Stallman : J’ai décidé de porter la liberté aux utilisateurs de l’informatique. Le but est d’éliminer le logiciel pas libre et de le remplacer par du logiciel libre. Le logiciel privateur ne doit pas exister.

b>Voix off : </b>Tant mieux, parce que moi, j’adore ça la liberté !

Voix off de Roberto Di Cosmo : Il n’y a pas un catalogue central de tous les logiciels ; nous utilisons tout le temps des plateformes diverses et variées, pour développer, pour distribuer.

b>Voix off : </b>C’est là, à Alexandrie, qu'il met en place un projet qu’il a imaginé pour la Grèce c’est-à-dire réunir tous les savoirs du monde au même endroit. L’idée est magnifique, il faut juste la réaliser !

— Ouais, il n’y a plus qu’à réunir les gars maintenant.

Caroline Lachowsky : Il n’y a plus qu’à... Roberto Di Cosmo ; c’est vite dit sauf que c’est un travail de titan, monumental. Est-ce qu’on pourrait avoir une idée, après ce résumé de l’informatique au cours de notre siècle – on a même entendu Richard Stallman, celui qui nous met en avant les logiciels libres –, est-ce qu’on peut avoir une idée du volume de données monstrueux que vous avez à traiter pour cette bibliothèque universelle des logiciels ?

Roberto Di Cosmo : Effectivement, c’est une très bonne question : il y a combien de codes sources logiciels informatiques qui sont à l'extérieur. Je peux déjà vous dire ce que nous avons trouvé. Au bout de quatre ans de travail, parce qu’on a quand même commencé à travailler il y a un petit moment pour construire l’infrastructure.

Caroline Lachowsky : L’infrastructure de cette bibliothèque universelle des logiciels et commencé à les collecter ; c’est ça ?

Roberto Di Cosmo : Eh oui, exactement, commencé à les collecter. Parce que si vous voulez, d’une certaine façon, on a besoin de construire une infrastructure, un énorme aspirateur qui se connecte aux différents endroits de la planète dans lesquels on développe les logiciels, en particulier, en premier lieu, les logiciels libres, et qui les récupère avec toute leur histoire de développement. Donc on sait en détail quelle ligne de code a été rajoutée, par qui, à quel moment, pourquoi ; ça c’est vraiment passionnant et fascinant.
Là, aujourd’hui, on a déjà identifié plus de 80 millions d’origines à partir desquelles on récupère ces logiciels et après, en regardant ce qu’il y a là-dedans, on a trouvé plus de 4 milliards et demi de fichiers sources tous différents, parce qu’un même fichier source peut-être réutilisé à plusieurs endroits mais nous on ne le garde qu’une seule fois. Donc il y a plus de 4 milliards et demi de fichiers sources tous différents qui ont été développés. Dans notre bibliothèque, si vous regardez, le logiciel le plus ancien date des années 70, voire un peu avant, et le logiciel le plus moderne date peut-être d’hier, parce qu’on ne collecte pas seulement le passé, mais aussi tout ce qui se développe aujourd’hui.

Caroline Lachowsky : Vous m’avez montré sur votre ordinateur tout à l’heure le code source d’Apollo. Incroyable, avec des commentaires, en plus, Roberto Di Cosmo.

Roberto Di Cosmo : Absolument. Si vous regardez, dans cette énorme bibliothèque on trouve de vrais trésors. Un de ces trésors que j’adore particulièrement c’est le code source du système de commande de l’Apollo 11 qui a plusieurs particularités. Tout d’abord parce qu’effectivement, là on a mentionné Ada Lovelace, mais la personne qui a piloté l’équipe qui a développé ce logiciel s’appelle Margaret Hamilton][3] ; c’est une dame incroyable.

Caroline Lachowsky : Une femme informaticienne.

Roberto Di Cosmo : Une femme informaticienne qui a 82 ans aujourd’hui. J’ai eu la chance de la rencontrer il y a quelques mois lors d’une conférence internationale ; elle est toujours aussi brillante, aussi géniale que ce qu’elle était à l’époque où elle développait ces codes-là.
Donc on trouve de vrais trésors, parce que vous voyez, à l’époque, l’ordinateur de l’Apollo 11 c’était un ordinateur qui était très avancé pour l’époque mais qu’on programmait avec des langages informatiques qui étaient de très bas niveau, très proches de la machine. On souffrait beaucoup pour programmer tout ça donc on mettait énormément de commentaires. Les commentaires sont faits pour des êtres humains, pour leur dire « regarde, l'instruction suivante va faire telle ou telle autre chose ». Et dans ce qu’on a regardé ensemble tout à l’heure, il y avait justement un fragment du programme d’allumage des réacteurs de l’Apollo 11 qui est développé d’une façon un peu particulière. Du coup, les commentaires des développeurs sont géniaux parce qu’il y a un des développeurs qui écrit, qui reprend l’ancienne devise honni soit qui mal y pense, c’est-à-dire « ne pensez pas mal ; si on a codé comme ça c'est qu'on n’avait pas le moyen de faire mieux » et plus tard un autre qui écrit noli me tangere, « ne pas toucher si vous ne savez pas ce que vous faites ». Ça c’est une partie qui est super délicate dans les commandes de l’Apollo 11.

Caroline Lachowsky : Que ce soit pour l’Apollo ou que ce soit pour les commandes d’un avion, il vaut mieux ne pas toucher au code source !

Roberto Di Cosmo : Il vaut mieux ne pas toucher si on ne sait pas ce qu’on fait. D’accord ! Il faut un peu regarder.
Donc on peut encore relire tout ça et, en relisant ces codes, on voit vraiment une histoire passionnante. Et vous voyez, les instructions pour l’ordinateur vont finir dans l’ordinateur, mais les commentaires ne disent rien à l’ordinateur ; ils nous parlent à nous, ils nous racontent une histoire humaine. L’histoire de l’informatique est une histoire d’êtres humains, d’hommes et de femmes qui ont travaillé ensemble, qui ont passé des nuits et des jours de passion pour construire cette infrastructure logique qui change le monde d’aujourd’hui.

Caroline Lachowsky : Qui change le monde d’aujourd’hui !

Roberto Di Cosmo : Et c’est cette histoire qu’on veut construire.

Caroline Lachowsky : Voilà. Vous voulez construire cette histoire et vous nous montrez aussi que ces logiciels, ces codes sources, sont quoi ? Des sortes d’objets vivants, enfin sur lesquels on peut aussi travailler aujourd’hui encore.

Roberto Di Cosmo : Absolument. C’est tout à fait ça. C’est important de comprendre que les codes sources des logiciels sont des objets nobles. Ce sont des créations de l’esprit humain ; ils sont développés par des êtres humains et maintenant, comme la complexité technologique grandit énormément, très souvent ce sont des gros logiciels. Prenez les navigateurs internet comme Firefox, prenez des systèmes de base de données comme PostgreSQL ou d’autres, du traitement d’images comme Gimp, ce sont des logiciels qui font des centaines, des milliers, voire des millions de lignes de code. Une seule personne ne peut pas se permettre d’écrire tout ça toute seule, donc on écrit de façon collaborative et on travaille ensemble sur cet objet, sur des plateformes qu’on appelle souvent des forges logicielles pour travailler ensemble. Et c’est fascinant. Par exemple, si on veut comparer avec la littérature, le code source on l’écrit, on l’écrit comme on écrirait un texte, et là aussi c’est important de savoir pourquoi tel texte a été écrit de telle façon. Dans notre approche traditionnelle à la littérature, d’abord on sélectionne les livres qui sont importants et, une fois qu’on a trouvé un livre qui est important, je ne sais pas, de Zola, de Hugo, eh bien on passe des nuits et des semaines et des années avec des étudiants dans les bibliothèques à chercher les lettres, les notes, les brouillons de ces écrivains.

Caroline Lachowsky : Comment ont été écrits ces chefs-d’œuvres.

Roberto Di Cosmo : Pourquoi ils ont décidé d’écrire comme ça, etc. Dans le monde de l’informatique, pour les besoins de l’informatique, on garde la trace de tous ces développements au moment où on développe. Du coup, il y a peut-être des logiciels qui ne sont pas très intéressants, ce n’est pas grave, mais quand on a un logiciel intéressant, on a toute cette trace. Donc nous ne gardons pas seulement des codes sources mais aussi toute la trace de développement.

Caroline Lachowsky : La trace humaine derrière ! On reconnaît bien l’humaniste et informaticien que vous êtes, Roberto Di Cosmo, et vous avez choisi évidemment d’écouter Birdy sur RFI People Help The People.

[Pause musicale]

16’ 55

Caroline Lachowsky : Birdy sur RFI, People Help The People. C’est votre choix Roberto Di Cosmo et pour cause, l’entraide, le partage, c’est la source même de cette bibliothèque universelle des codes sources.

Roberto Di Cosmo : Vous avez raison Caroline, c’est un de mes moteurs intérieurs depuis très longtemps. À la fois comme enseignant en informatique, comme professeur d’université, comme chercheur, ma mission a toujours été de partager à la fois la connaissance et la passion pour la connaissance. Il ne suffit pas juste de partager les notions, il faut aussi partager la passion. Et là c’est une vraie passion de partager un peu cette histoire de l’informatique parce que, autant la plupart des personnes qui nous écoutent ne sont pas directement capables de lire un programme informatique aujourd’hui, autant dans quelques années — le travail qu’on fait c’est sur le long terme — la plupart d’entre nous seront capables de lire un peu le code informatique de la même façon que la plupart de nous sont capables, aujourd’hui, de faire un peu de maths, de faire un peu d’histoire, de faire un peu de philosophie ; petit à petit l’informatique entre dans les écoles.
Donc on construit cette infrastructure pas seulement pour aujourd’hui mais vraiment pour le futur, pour les générations futures.

Caroline Lachowsky : Pour les générations futures, pour qu’elles soient capables de revenir à la source, justement, de tous ces logiciels que nous utilisons et pour les générations futures sur tous les coins de la planète parce que vous qui êtes très sensible à ces questions de partage, de transfert, de diffusion des savoirs, comment faire pour que cette bibliothèque universelle des logiciels puisse être accessible à ceux qui en ont le plus besoin et je pense notamment au grand Sud, à nos auditeurs sur le contient africain, en Amérique latine, ailleurs que là où on pense qu’ils sont fabriqués ces logiciels.

Roberto Di Cosmo : Effectivement. Ça c’est vraiment la question de l’universitaire. Un des aspects magiques de l’information et de l’informatique, de l’Internet d’aujourd’hui, c’est qu’effectivement une infrastructure comme celle-ci, peu importe où elle est fabriquée, elle peut rendre un service à tout le monde sur la planète et il ne faut pas oublier qu’il y a quand même des tuyaux, des fois, qui ne sont pas si grands que ça donc c’est très important qu’il n’y ait pas une seule copie de cette bibliothèque.
Nous construisons ici, à Paris, ce projet magnifique de Software Heritage, mais dès le départ, dans notre tête, il y a eu cette idée de faire en sorte que, à terme, on arrive à avoir un grand réseau international de miroirs pour faire en sorte qu’il y ait une copie de tous ces contenus à différents endroits sur la planète. Pourquoi ? Pour rendre plus facilement accessible de l'endroit où l'on se trouve et aussi, éventuellement, pour adapter la présentation aux besoins des différentes personnes. Il y a des gens qui veulent faire de la recherche très avancée sur les contenus, ils ont une certaine infrastructure ; d’autres veulent juste le réutiliser ailleurs. Et il y a aussi un autre aspect, je vous le disais tout à l’heure : 80 millions de ressources en logiciels.

Caroline Lachowsky : C’est monstrueux.

Roberto Di Cosmo : C’est énorme ! Comment chercher dedans ce qui est intéressant. Donc là on essaie de nouer des partenariats avec des équipes de recherche, avec des entreprises, par exemple avec Qwant[4] récemment, pour construire un moteur de recherche qui soit adapté au code source, qui facilite l’accès aux contenus pour tout le monde.

Caroline Lachowsky : Pour tout le monde et qui permette aussi — ce dont on parle beaucoup aujourd’hui ce sont les questions de science ouverte — que tous les chercheurs aient accès à cela. À ce sujet je vous propose, Roberto Di Cosmo, d’écouter l’éclairage d’un chercheur camerounais, Thomas Hervé Mboa Nkoudou. Il est doctorant en communication publique à l’université de Laval au Québec ; il est président de l’APSOHA, l’Association pour la promotion de la science ouverte en Haïti et en Afrique francophone ; il a beaucoup travaillé sur toutes ces questions de libre accès, sur les obstacles aussi à l’adoption de la science ouverte par les étudiants africains. Il réagit depuis Yaoundé, au Cameroun, à la création de cette bibliothèque universelle des codes sources de logiciels.

Thomas Hervé Mboa Nkoudou : En fait, pour moi, ça a toujours été très important cette idée d’ouverture et de partage de l’information et du code source ou de design qui existe. En tant qu’Africain et pensant à partir de l’Afrique, je dirais que c’est une grosse chance pour nous de pouvoir avoir accès à toutes ces données, de façon libre et de façon ouverte, parce que ça nous permet de contourner un certain nombre de barrières notamment financières. Pour moi c’est d’une importance capitale d’avoir accès aux codes.

Caroline Lachowsky : Vous avez même mené une enquête sur les obstacles, finalement, à l’adoption de l’open science notamment chez les étudiants en Afrique, en Haïti. Quels sont ces obstacles ?

Thomas Hervé Mboa Nkoudou : En fait, le projet SOHA[5] est né du financement, d’aide du Canada qui visait justement à documenter l’invisibilité des chercheurs d’Afrique francophone et Haïtiens sur le Web scientifique. On se posait la question de savoir pourquoi avec tous les outils open qui existent aujourd’hui, ces Africains et Haïtiens sont toujours autant absents sur la scène internationale du savoir. Alors on a mené cette enquête-là qui nous a amenés vers neuf injustices cognitives. Nous les avons appelées des injustices cognitives, c’est-à-dire des obstacles qui nous empêchent de penser en tant qu’Africains parce qu’elle n’est pas forcément liée à nous, elle est quelquefois liée à la barrière linguistique, elle est liée à la barrière infra-structurelle, elle est liée à la barrière pédagogique... ; en tout cas il y en a neuf ; nous avons sorti un livre là-dessus avec mes collègues.

Caroline Lachowsky : Et vous avez l’impression que justement ces bibliothèques universelles du code source, cette manière de partager le patrimoine logiciel de l’humanité, ça peut être particulièrement utile pour lever ces obstacles, les injustices cognitives pour les chercheurs africains ou pour les étudiants africains et haïtiens ?

Thomas Hervé Mboa Nkoudou : C’est déjà un bon début, mais il faut se poser la question de savoir aussi dans quel sens ? Parce que le libre accès et l’ouverture aussi est un couteau à double sens. Parce s’il faut faire u peu une écologie du savoir sur le Web, on se rend compte que la majorité des savoirs disponibles proviennent d’une région du monde, notamment du Nord. Il faut donner aux Africains, donner aux universités africaines, aux institutions supérieures africaines, les infrastructures qui permettront aux chercheurs africains ou bien aux savants africains de générer la connaissance endogène.

Caroline Lachowsky : Merci infiniment. On va en reparler avec vous certainement sur notre antenne Thomas Hervé Mboa Nkoudou. Est-ce que vous auriez, pour terminer, une question à poser à notre invité, en studio avec nous, Roberto Di Cosmo ?

Thomas Hervé Mboa Nkoudou : Je ne sais pas quelles mesures ont été prises au niveau local, parce que l’Unesco c'est quand même une vraie puissance politique, ils peuvent vraiment faire avancer les choses au niveau africain. Donc j’aimerais bien savoir sur une structure au niveau du Cameroun, au niveau d’autres pays africains, quelles sont les dispositions qui ont été prises ? Parce qu’il est aussi vrai que l’Unesco, en tant que force politique, va peut-être s’arrêter au niveau étatique, au niveau exécutif, et l’information n’arrive jamais où ça devrait arriver, c’est-à-dire au niveau des étudiants par exemple, qui pour moi est la chose qui ferait changer les choses. Lors de sa présentation, qu’il nous présente un peu les dispositions pour qu’un étudiant qui n’est pas le neveu de tel ministre soit autant informé, autant impliqué dans la chose. C’est compliqué comme question, mais ce sont nos réalités.

24’ 23

Caroline Lachowsky : Que pouvez-vous répondre, Roberto Di Cosmo, à cette question compliquée mais bien réelle de Thomas Hervé Mboa Nkoudou au Cameroun ?

Roberto Di Cosmo : Effectivement. Il a soulevé tout un tas de questions. J’aimerais bien les reprendre dans un autre ordre.

Caroline Lachowsky : Volontiers.

Roberto Di Cosmo : Tout d’abord, ce qu’on appelle la science ouverte aujourd’hui m’appelle une petite réflexion. Vous voyez, à l’époque où moi j’étais étudiant, par exemple, je n’aurais jamais pensé à de la science fermée ; la science était naturellement ouverte. J’ai étudié à Pise qui était la patrie de Galileo Galilei qui est celui qui a créé la méthode scientifique – c’est ce que nous disons en Italie, je sais bien qu’en France on dit autre chose, mais l’important c’est que la méthode scientifique est là – et une partie essentielle de la méthode scientifique c’est la capacité pour d’autres de vérifier, indépendamment, ce que nous avons trouvé, nous, dans notre recherche.

Caroline Lachowsky : Donc la science, pour vous, était essentiellement, fondamentalement ouverte.

Roberto Di Cosmo : Fondamentalement ouverte parce que sinon ce n’est pas de la science. Comme disait Karl Popper qui est un épistémologue très influent du début du siècle passé, les occurrences non reproductibles n’ont pas d’intérêt pour la science. C’est nécessaire de pouvoir reproduire ces connaissances. Pour reproduire ces connaissances il faut regarder le monde d’aujourd’hui qui est un monde beaucoup plus complexe que celui de nos ancêtres il y a quatre ou cinq siècles. Vous avez des articles scientifiques qui décrivent ce qu’on a trouvé quand on fait de la recherche mais, très souvent aujourd’hui, quand vous regardez ces articles, un article vous dit que vous avez analysé un certain nombre de données, un certain jeu de données, que vous avez fait un certain type de calcul et que ce calcul a donné un certain résultat qui est le résultat scientifique. Je ne sais pas, par exemple 42. Eh bien si vous avez seulement l’article, vous n’avez pas les données, vous n’avez pas les logiciels avec lesquels on a fait les calculs, comment je peux bien vérifier, moi, que le résultat est bien 42 et comment je peux jouer avec pour apprendre des choses nouvelles, changer un peu les données, voir si le résultat reste toujours 42 ou si c’était un hasard, etc. ? Donc c’est vraiment nécessaire de rendre les articles scientifiques librement accessibles. Et là il y a une véritable barrière entre le Nord et le Sud qui vient du modèle de publication scientifique actuel qui est complètement inadapté au mode de transmission moderne dans lequel Internet permet de rendre les choses disponibles immédiatement, alors qu’on a bloqué tout ça derrière des barrières financières sur lesquelles il faudrait passer une émission entière.

Caroline Lachowsky : Oui, il faudrait passer une émission entière. Rappelons quand même que vous êtes un ardent défenseur des logiciels libres.

Roberto Di Cosmo : Et de l’open access.

Caroline Lachowsky : Et de l’open access et que vous avez tout de suite senti ces obstacles, ces dangers, cette fermeture.

Roberto Di Cosmo : Immédiatement.

Caroline Lachowsky : Une fermeture on va dire quoi ? Économique, du savoir, enfin vraiment on a fermé un outil qui était totalement ouvert.

Roberto Di Cosmo : Qui était totalement ouvert. Qui était censé être ouvert. Pour résumer en quelques lignes ma vision de ce qui s’est passé ; je suis suffisamment âgé pour avoir vécu la période avant Internet. Avant Internet, le mécanisme le plus efficace pour diffuser le savoir c’était effectivement de publier dans des journaux papier qui, après, étaient redistribués dans toutes les bibliothèques sur le monde ; il n’y avait pas d’autre solution.

Caroline Lachowsky : Or aujourd’hui, avec Internet…

Roberto Di Cosmo : Or aujourd’hui, avec Internet, cette façon de fonctionner est complètement obsolète ; on peut aller beaucoup plus vite. Mais si vous voulez, avant, l’économie d’avant Internet était une économie dans laquelle tout le monde trouvait son petit bénéfice : les chercheurs y trouvaient la façon la plus efficace de distribuer ; les bibliothèques avaient une façon de dupliquer les choses à un coût pas trop élevé ; les éditeurs se rémunéraient à côté. Aujourd’hui on est dans un monde dans lequel le travail habituel des éditeurs n’a plus de sens ; il faut distribuer plus facilement, plus rapidement, mais on a, entre temps, des entreprises milliardaires qui existent et qui freinent évidemment. Là il y a un changement de modèle économique ; ce changement-là n’a pas été complètement maîtrisé.

Caroline Lachowsky : Et en même temps, vous qui êtes un ardent défenseur de l’open access, des logiciels libres, pour monter cette extraordinaire bibliothèque universelle du code source, donc pour collecter et partager cette science informatique, vous avez fait une fondation et qui est-ce qu’on retrouve ? Certains de vos « ennemis » entre guillemets des GAFAM, des gros stores, des grosses entreprises informatiques qui, au départ, voulaient tout fermer et qui, en fait, se rendent compte que ce n’est pas possible.

Roberto Di Cosmo : Et là, si vous voulez, c’est quelque chose de fascinant ; vous avez raison de le rappeler. Il y a 20 ans j’avais écrit un livre[6] qui était un peu au vitriol sur Microsoft. Vous savez des fois on dit : « Quand le sage indique que la lune, le sot ne voit qu’un doigt ». À l’époque j’étais très énervé contre un monopole complet sur la chaîne de l’information et il y a 20 ans, le monopoliste sur la chaîne de l’information s’appelait Microsoft. Si vous regardez, aujourd'hui ce ne sont pas tout à fait les mêmes.

Caroline Lachowsky : Aujourd’hui ce sont les GAFA.Ce ne sont pas tout à fait les mêmes.

Roberto Di Cosmo : Donc je ne suis pas très surpris de voir Microsoft qui devient plutôt partenaire en soutien. Je ne dis pas que tout est blanc, mais quand même, le monde n’a pas mal changé. Et effectivement on a besoin de contribuer à ce partage de la connaissance. Je reviens sur la partie science ouverte ; c’est important de partager les articles, c’est important de partager les données et jusque-là on avait un petit peu oublié que c’est bien d’avoir les articles et les données, mais si on n’a pas les logiciels avec lesquels on a fait les analyses, on est toujours incapable de reproduire le résultat scientifique.
Donc ce qu’apporte Software Heritage, dans cet éclairage-là, c’est une plateforme internationale pour partager les codes sources des chercheurs, des recherches et, avec ça, on commence à travailler avec le ministère de la Recherche ici en France, on commence à collaborer avec des entités internationales, parce que c’est la même infrastructure qu’on utilise aussi pour le patrimoine culturel, c’est le même tuyau, mais qui a une finalité importante pour le partage des connaissances.

Caroline Lachowsky : Et qui pourra donc être partagé sur la planète entière ?

Roberto Di Cosmo : Sur la planète entière.

Caroline Lachowsky : Dans le monde entier et réduire cette injustice cognitive dont parlait notre chercheur camerounais.

Roberto Di Cosmo : Absolument. Mais il y a une autre partie dans l’injustice cognitive dont il parle c’est effectivement le fait qu’il faut exposer plus souvent les chercheurs des pays émergents à des modèles, des connaissances et à des modèles économiques plus avancés, sur lesquels on commence à travailler maintenant.
Je reviens sur votre question sur Microsoft. Par exemple Microsoft, Oracle, ces entreprises-là, il y a 20 ans, ne juraient que par des logiciels propriétaires, fermés, et maintenant, si vous regardez 20 ans après, petit à petit, elles sont en train de prendre un énorme tournant, elles sont en train d’investir de plus en plus dans le développement des logiciels libres, elles contribuent aux logiciels libres. L’année passée Microsoft était le premier contributeur en logiciels libres sur la plateforme la plus connue qui s’appelle GitHub ; c’est étonnant mais en réalité c’est aussi naturel parce que la complexité des logiciels grandit à une telle vitesse qu’on ne peut plus se permettre de tout refaire tout seul et qu’il est nécessaire d’avoir des ingénieurs et des personnes qui connaissent bien ces logiciels ; et la meilleure façon de les connaître c’est de pouvoir mettre les mains dans le code source. Vous vous rappelez, c’est le code source qu’on peut lire en étant développeur.

Caroline Lachowsky : Donc mettre les mains dans le cambouis du code source, ouvrir le capot de la machine.

Roberto Di Cosmo : Dans le cambouis du code source, ouvrir le capot de la machine. Donc petit à petit les gens sont en train de migrer dans cette direction et c’est le même mouvement que vous voyez aussi dans ce mouvement de science ouverte ; on se rend compte que c’est important de partager parce que, comme ça, on construit plus, on va plus loin. Ce qui n’enlève rien, après, à la difficulté de valoriser la recherche scientifique, mais ça c’est un autre sujet.

Caroline Lachowsky : C’est un autre sujet. Autour de la question, « comment partager nos logiciels en toute liberté ». On s’interroge depuis la Jamaïque sur l’importance de partager avec Capleton sur RFI Never Share ; ça c’est politique !

[Pause musicale]

33’ 00

Caroline Lachowsky : Capleton sur RFI, Never Share. Et si on partageait justement, Roberto Di Cosmo, nos logiciels et nos codes sources dans cette formidable initiative que vous avez lancée, Software Heritage, la bibliothèque universelle, la bibliothèque d’Alexandrie des logiciels. Au fond c’est un peu la question des communs, du patrimoine commun que vous relancez là. Je ne sais pas si c’est une forme de résistance, mais en tout cas c’est une manière d’organisation de nos communs et de ce nouveau patrimoine commun de l’humanité.

Roberto Di Cosmo : Absolument. Le cas des logiciels est vraiment fascinant. D’un côté ils sont relativement récents, de l’autre côté ils ont changé toute notre vie et d’un autre côté, si vous regardez, même les modèles économiques dans le monde des logiciels ont évolué avec l’arrivée du logiciel libre. On est train d’apprendre petit à petit, ça prend du temps ; la définition du logiciel libre de Stallman date des années 80, donc on a une petite trentaine d’années de recul, pas plus, mais ça change vraiment, et on se rend compte que, des fois, il y a des biens communs, qu’il faut nourrir le modèle économique qu’on a construit au-dessus et pas en violant les biens communs ; il faut les soigner.

Caroline Lachowsky : Ça veut dire qu’après il faut réfléchir ; il faut vraiment changer de regard et commencer par voir ce qui se passe, et ensuite réfléchir : quel modèle économique est approprié à ces logiciels libres, à cette ouverture ?

Roberto Di Cosmo : Il faut changer de regard. Ça serait long à expliquer, mais disons que les dernières quarante années de l’histoire l’informatique ont été construites sur un modèle économique qui était basé sur la notion de vente de licences qui est une façon très bizarre de créer de la rareté. Une licence, c’est juste l’autorisation de faire une copie d’un logiciel qui existe déjà, qui a été déjà développé. Alors qu’en informatique il n’y a rien de plus facile que de faire une copie d’un logiciel et le recopier exactement identique à l’original, comme dans tout le patrimoine immatériel.

Caroline Lachowsky : C’est-à-dire que le modèle économique n’est absolument pas adapté ?

Roberto Di Cosmo : Ce n’est pas là qu’il y a la rareté. La rareté c’est la capacité de créer, de modifier, d’adapter, d’évoluer, d’installer, de tester, de fabriquer, de former, etc. Il y a plein d’autres raretés. C’est autour de ça qu’on a conçu des modèles économiques beaucoup plus avancés, beaucoup plus modernes, beaucoup plus efficaces aujourd’hui ; mais ça demande vraiment un changement copernicien de regard sur les modèles économiques.

Caroline Lachowsky : À propos de ce changement, changement de regard, et puisque nous sommes une émission de science, on le sait bien la science avance beaucoup plus par collaboration qu’autre chose, mais enfin le fil est un peu tendu entre compétition et collaboration en sciences. À ce sujet, je vous propose un nouvel éclairage de chercheur ; c’est celui du démographe François Héran, professeur au Collège de France sur la chaire migration et sociétés.

François Héran : Ma position a toujours été d’ouvrir les données, le plus possible. Effectivement, il y a un problème de propriété intellectuelle, c’est-à-dire que des gens qui se sont fatigués à répondre à des appels d’offre internationaux extrêmement complexes et qui ont eu du mal à nettoyer les données – c’est un gros travail – méritent effectivement, pendant quelques mois, d’avoir une priorité sur l’exploitation des données. Mais enfin, cette durée qui leur est accordée ne doit pas dépasser six mois, peut-être un an dans certains cas et, au-delà de ce délai, il faut vraiment que les données d’enquête – là je parle des données d’enquête qui est un domaine que je connais bien – soient ouvertes, soient accessibles. C’est important pour deux raisons parce que, d’une part, c’est de l’argent public la plupart du temps donc il faut que toute la communauté puisse en profiter et, de l’autre, il y a un grand principe en sciences, c’est la réplication des expériences. Il faut qu’à partir des mêmes données une autre équipe ait la possibilité de refaire des calculs, d’appliquer d’autres modèles pour vérifier si on obtient ou pas les mêmes résultats.
C’est absolument fondamental qu’une expérience scientifique – et une enquête est une expérience – puisse être répliquée librement sans quoi il n’y a pas de science.
Mais c’est vrai que la propriété intellectuelle, dans certaines limites, doit aussi, bien sûr, être respectée.

Caroline Lachowsky : Est-ce qu’on peut justement respecter cette propriété intellectuelle en science quand on monte, comme vous, quand on collecte, quand on organise comme vous, Roberto Di Cosmo, une bibliothèque universelle du code source en marche, enfin qui fonctionne pour les codes sources actuels aussi ?

Roberto Di Cosmo : Oui, effectivement. C’est une question qu’on s’est évidemment posée au moment de la création du projet. Software Heritage. Le titre de Software Heritage c’est vraiment Software Heritage, tout notre patrimoine logiciel, tout, tout, y compris les logiciels qui sont potentiellement maintenant encore couverts par des propriétés intellectuelles particulières, des droits d’auteur qui empêchent de les distribuer.
On s’est posé la question de comment faire. Si on veut tout collecter, on a regardé et effectivement il y a deux types de difficultés : il y a des difficultés techniques, c’est-à-dire qu’il y a des logiciels qui sont difficiles à trouver, des logiciels qui sont faciles à trouver. Les logiciels les plus faciles à trouver ce sont ceux qu’on retrouve sur Internet ; les plus difficiles à trouver ce sont ceux qu’on retrouve dans des tiroirs, dans ces cartes perforées des années 50, voire sur un disque qu’on n’arrive plus à relire, donc il y a ces difficultés-là, ces difficultés techniques.

Caroline Lachowsky : Ce sont des difficultés techniques, mais il y a des difficultés juridiques aussi.

Roberto Di Cosmo : Il y a des difficultés juridiques, évidemment. La plupart de ceux qu’on a c’est dans cette catégorie qui ont des licences, des droits d’auteur qui permettent de les copier, de les rendre disponibles, donc là-dedans vous avez les logiciels libres, mais aussi d’autres types de logiciels et après vous avez des logiciels qu’on appelle propriétaires, dans lesquels on vous empêche d’avoir accès au code source : on ne peut pas les lire, on ne peut pas les copier, on ne peut pas les réutiliser ; mais on aimerait bien avoir ça aussi, alors comment on fait ?

Caroline Lachowsky : Et vous allez pouvoir l’avoir ? On pense à certaines grosses entreprises, aller Apple, pour ne pas les citer, qui sont quand même les plus fermées du monde.

Roberto Di Cosmo : Mais là effectivement, on met en place des stratégies et c'est un peu la complexité de tout le projet qu’on mène qui n’est pas seulement une complexité technique. Donc pour tout ce qui est ouvert, facilement accessible, on veut tout automatiser, c’est ce qu’on en train de faire. Pour des choses qui sont encore couvertes par des droits d’auteur, on a besoin de parler avec des gens qui ont cette propriété et de les convaincre petit à petit de les rendre disponibles.

Caroline Lachowsky : De l’importance de ce patrimoine de l’humanité et de pouvoir le relire, s’en servir, le réutiliser, le développer autrement ensuite.

Roberto Di Cosmo : Exactement. Faire en sorte qu’au moins il n’y ait plus la nécessité impérieuse de maintenir le code source secret, pour des raisons de business ou pour des raisons que vient d’évoquer votre invité maintenant, qui est le fait que pendant une période on a besoin de le garder secret pour le temps de travailler correctement dessus. Une fois que ce besoin a disparu, il faut que le code soit disponible. Là c’est un travail énorme, on ne le mène pas nous directement, mais on travaille avec des entités comme le Computer History Museum et d’autres qui vont faire un travail vraiment ponctuel d’aller discuter avec les entreprises pour rendre ce code disponible.
Une fois que le code est devenu disponible d'un point de vue juridique, on va l’insérer dans cette bibliothèque pour que tout le monde puisse y avoir accès. Et ce qui est important dans cette bibliothèque-là, qu’on est en train de construire maintenant, et à la différence avec les autres bibliothèques traditionnelles c’est que même si on veut que notre bibliothèque soit répartie un peu sur toute la planète, on veut que l’interface pour les utilisateurs soit toujours la même. C’est-à-dire qu’on puisse trouver le même catalogue, qu’on puisse utiliser le même outil de recherche.

Caroline Lachowsky : Où qu’on soit sur la planète ?

Roberto Di Cosmo : Où qu’on soit sur la planète, peu importe à quel miroir on puisse se connecter, pour donner une vision uniforme de l’ensemble du développement.

Caroline Lachowsky : Autour de la question comment partager nos logiciels en toute liberté, aller un petit clin d’œil à votre Italie natale, Roberto Di Cosmo, entre tradition et extrême modernité dans le patrimoine, du côté des Pouilles, la tarentelle est revisitée électro par le groupe Mascarimirì.

[Pause musicale]

42’ 50

Caroline Lachowsky : Mascarimirì sur RFI, quand la tarentelle, danse traditionnelle des Pouilles, nous met en transe électro sur RFI. Nous sommes en votre compagnie, Roberto Di Cosmo, autour de cette bibliothèque universelle des logiciels. Là aussi on est quand même entre, comment dire, entre tradition et modernité parce que l’analogie avec la bibliothèque d’Alexandrie a vraiment quelque chose à voir.
Vous l’avez dit au début de cette émission, nous sommes dans une période charnière où l’on peut retrouver, collecter, faire parler les premiers informaticiens, collecter tous les codes sources. La démarche fait aussi que vous devez parler à des informaticiens, à des bibliothécaires, à des industriels ; on a parlé de code source ouvert, open source, finalement c’est extrêmement large, mais il y a un lien entre ce qui se passait autrefois à Alexandrie et ce qui se passe aujourd’hui dans votre Software Heritage.

Roberto Di Cosmo : Effectivement. C’est bien de revenir sur l’analogie de la bibliothèque d’Alexandrie ; je l’aime beaucoup parce que très souvent les gens pensent à la bibliothèque d’Alexandrie comme à un endroit mythique qui, malheureusement, a brûlé. Nous on va faire en sorte que la nôtre ne brûle pas. On a fait des copies partout.

Caroline Lachowsky : Vous avez des copies partout dans le monde.

Roberto Di Cosmo : C’est sûr que si vous copiez, il en reste quand même à un endroit. Une image que les gens n’ont peut-être pas, c’est qu’à l’époque de la bibliothèque d’Alexandrie ce qui se passait vraiment c’est qu’il y avait des savants qui étaient dispatchés aux quatre coins de la planète pour aller chercher les nouveautés, les papiers les plus importants, les copier, les ramener à cet endroit unique. C’est ça l’analogie que j’aime bien parce qu’en réalité on construit cet endroit dans lequel on rapatrie les nouvelles connaissances, les nouveaux codes sources qui sont développés un peu partout. C’est un peu le rêve : avoir cet objet central unique, mais qui est juste une archive, d’accord ? Pour développer on le fait ailleurs, mais dès qu’il y a quelque chose de nouveau, d’intéressant qui est développé, il faudrait qu’il arrive dans cet endroit central où on peut chercher, où on peut observer. C’est une sorte de grande infrastructure, un grand télescope qui nous permet d’observer la galaxie des logiciels et du développement des logiciels.

Caroline Lachowsky : La galaxie du savoir. Vous avez parlé d’utopie, Roberto Di Cosmo. En même temps c’est une utopie que vous êtes en train de réaliser. Mais c’est compliqué, il faut du financement.

Roberto Di Cosmo : Absolument !

Caroline Lachowsky : C’est un projet très complexe, vous-même vous y passez votre vie, vos jours et vos nuits ; vous n’êtes pas le seul. Comment est-ce que vous avez fait pour convaincre des industriels, des informaticiens, des bibliothécaires, pour rassembler tout ça, pour monter ce projet et qu’est-ce qu’il vous faudrait aujourd’hui ?

Roberto Di Cosmo : Merci super ! Effectivement, au moment où on a trouvé l’opportunité de créer ce projet-là, c’était tellement passionnant qu’on ne pouvait pas ne pas y aller. Donc il fallait absolument y aller, mais comment faire ? Comment démarrer quelque chose comme ça ? C’était clair qu’à long terme ce qu’on veut créer c’est une fondation internationale indépendante qui a comme seule et unique mission de maintenir cette infrastructure au service de tout le monde. Donc ce n’est pas une start-up, ce n’est pas une entreprise, ce n’est pas un projet de recherche qui dure quatre ans et après on passe à autre chose. Vous pouvez vraiment imaginer ça comme la création des réseaux des bibliothèques publiques à l’époque de Thomas Jefferson.

Caroline Lachowsky : Aux États-Unis.

Roberto Di Cosmo : Dans les années 1700, aux États-Unis, à cette époque-là. C’est passionnant mais comment démarrer ? Là je dois dire que j’ai eu, que tous les gens qui se passionnent pour le projet ont eu énormément de chance jusque-là. La première chose ça a été de rencontrer l’Inria ; je suis professeur à l’université de Paris Diderot, mais j’ai rencontré l’Inria qui est l’Institut national de recherche en informatique ; j’ai rencontré son PDG, Antoine Petit, qui est aujourd’hui président du CNRS. Et au moment où il assumait cette fonction, je lui ai proposé cette initiative en disant « l’Inria, si elle veut avoir un impact sur la société, ça c’est une piste ». Et là, il a eu la capacité de décision, je ne saurais jamais comment le remercier assez, il a décidé d’y aller.

Caroline Lachowsky : On y va ! C’est monstrueux, c’est énorme, mais on y va !

Roberto Di Cosmo : Avec après toute l’évaluation qu’il faut, etc. Et effectivement, avec des moyens qui ne sont pas grands comme les grandes entreprises.
Ça c’était la première étape pour donner un socle qui est stable. Mais dès le départ la mission était de réunir sans exception le maximum de partenaires, parce que pour avoir du succès à long terme il faut trois éléments essentiels :

  • d’un côté de la bonne science, de la bonne technologie ; donc être en relation avec l’Inria et avec les autres académiques c’est important ;
  • deux, les financements parce que ça coûte ; on a besoin de financements et ces financements doivent venir des entreprises comme celles qu’on a là, des mécènes qu’on n’a pas encore trouvés pour l’instant, je pense qu’ils vont venir bientôt, des institutions publiques, de l’État, des gouvernements, un peu de toute la société civile ;
  • mais après on a aussi besoin, et ça c’est le troisième pilier qui est important, de la reconnaissance de l’importance du code source des logiciels dans notre patrimoine. Et ça c’est un travail qu’on fait vraiment au jour le jour avec l’Unesco pour rendre cet objet culturel qu’est le code source, noble, reconnu au niveau international.

Caroline Lachowsky : Merci infiniment Roberto Di Cosmo d’être venu en direct pour partager, justement, cette initiative incroyable, phénoménale, essentielle. Je rappelle que nous sommes tous concernés et au fond, tous contributeurs potentiels : Software Heritage, la grande bibliothèque universelle du code source des logiciels disponibles. Le lien est évidemment sur notre site et vous revenez, Roberto Di Cosmo, nous en parler, nous dire où en est ce projet. Merci à vous.

Roberto Di Cosmo : Merci à vous.

Voix off : Autour de la question sur Internet www.rfi.fr.

Caroline Lachowsky : Autour de la question c’est fini pour aujourd’hui. N’hésitez pas à nous réécouter, à nous podcaster à volonté sur le site de RFI et sur l’appli RFI Pure radio. Au plaisir de vous retrouver demain « Au-dessus du volcan » pour changer de regard sur les activités telluriques de la terre vues de l’espace avec Hugo Violasse à la réalisation et Caroline Fillette en coulisses. Merci de votre curiosité amis auditeurs. À demain. Dans quelques instants l’heure d’un nouveau journal.
  1. Software Heritage
  2. Ada Lovelace
  3. Margaret Hamilton
  4. Qwant
  5. Projet SOHA - Science ouverte Haïti Afrique
  6. Le Hold-up planétaire :la face cachée de Microsoft, Roberto Di Cosmo et Dominique Nora