Différences entre les versions de « Pourquoi une bibliothèque universelle des logiciels - Software Heritage - Roberto Di Cosmo »

De April MediaWiki
Aller à la navigationAller à la recherche
Ligne 112 : Ligne 112 :
 
==16’ 55==
 
==16’ 55==
  
<b>Caroline Lachowsky : </b>Birdy sur RFI, <em>People Help The People</em>.
+
<b>Caroline Lachowsky : </b>Birdy sur RFI, <em>People Help The People</em>. C’est votre choix Roberto Di Cosmo et pour cause, l’entraide, le partage, c’est la source même de cette bibliothèque universelle des codes sources.
 +
 
 +
<b>Roberto Di Cosmo : </b>Vous avez raison Caroline, c’est un de mes moteurs intérieurs depuis très longtemps. C’est-à-dire à la fois comme enseignant en informatique, comme professeur d’université, comme chercheur, ma mission a toujours été de partager à la fois la connaissance et la passion pour la connaissance. Il ne suffit pas juste de partager les notions, il faut aussi partager la passion. Donc là c’est une vraie passion de partager un peu cette histoire de l’informatique parce que autant la plupart des personnes qui nous écoutent au aujourd’hui ne sont pas directement capables de lire un programme informatique, autant dans quelques années, vous voyez le travail qu’on fait c’est sur le long terme, la plupart d’entre nous seront capables de lire un peu le code informatique de la même façon que la plupart de nous sont capables aujourd’hui de faire un peu de maths, de faire un peu d’histoire, de faire un peu de philosophie ; petit à petit l’informatique entre dans les écoles.<br />
 +
Donc on construit cette infrastructure pas seulement pour aujourd’hui mais vraiment pour le futur, pour les générations futures.
 +
 
 +
<b>Caroline Lachowsky : </b>Pour les générations futures, pour qu’elles soient capables de revenir à la source justement de tous ces logiciels que nous utilisons et pour les générations futures sur tous les coins de la planète parce que vous qui êtes très sensible à ces questions de partage, de transfert, de diffusion des savoirs, comment faire pour que cette bibliothèque universelle des logiciels puisse être accessible à ceux qui en ont le plus besoin et je pense notamment au grand Sud, à nos auditeurs sur le contient africain, en Amérique latine, ailleurs que là où on pense qu’ils sont fabriqués ces logiciels.
 +
 
 +
<b>Roberto Di Cosmo : </b>Effectivement. Ça c’est vraiment la question de l’université : un des aspects magiques de l’information et de l’informatique de l’Internet d’aujourd’hui c’est qu’effectivement une infrastructure comme celle-ci, peu importe où elle est fabriquée, elle peut rendre un service à tout le monde sur la planète et il ne faut pas publier qu’il y a quand même des tuyaux des fois qui ne sont pas si grands que ça donc c’est très important qu’il n’y ait pas une seule copie de cette bibliothèque.<br />
 +
Nous construisons ici à Paris ce projet magnifique de Software Heritage, mais dès le départ dans notre tête il y a eu cette idée de faire en sorte que à terme nous arrive à avoir un grand réseau international de miroirs pour faire en sorte qu’il y ait une copie de tous ces contenus à différents endroits sur la planète. Pourquoi ? Pour rendre plus facilement accessible de l’endroit où on se trouve et aussi, éventuellement, pour adapter la présentation aux besoins des différentes personnes. Il y a des gens qui veulent faire de la recherche très avancée sur les contenus, ils ont une certaine infrastructure ; d’autres veulent juste le réutiliser ailleurs.<br />
 +
Et il y a aussi un autre aspect, on veut aussi, je vous le disais tout à l’heure 80 millions de ressources en logiciels.
 +
 
 +
<b>Caroline Lachowsky : </b>C’est monstrueux.
 +
 
 +
<b>Roberto Di Cosmo : </b>C’est énorme ! Comment chercher dedans ce qui est intéressant. Donc là on essaie de nouer des partenariats avec des équipes de recherche, avec des entreprises, par exemple avec Qwant récemment pour construire un moteur de recherche qui soit adapté au code source, qui facilite l’accès aux contenus pour tout le monde.
 +
 
 +
<b>Caroline Lachowsky : </b>Pour tout le monde et qui permette aussi, ce dont on parle beaucoup aujourd’hui, ce sont les questions de science ouverte, que tous les chercheurs aient accès à cela. À ce sujet je vous propose, Roberto Di Cosmo, d’écouter l’éclairage d’un chercheur camerounais Thomas Hervé Mboa Nkoudou. Il est doctorant en communication publique à l’université de Laval au Québec ; il est président de l’APSOHA, l’Association pour la promotion de la science ouverte en Haïti et en Afrique francophone ; il a beaucoup travaillé sur toutes ces questions de libre accès, sur les obstacles aussi à l’adoption de la science ouverte par les étudiants africains. Il réagit depuis Yaoundé au Cameroun à la création de cette bibliothèque universelle des codes sources de logiciels.
 +
 
 +
<b>Thomas Hervé Mboa Nkoudou : </b>En fait, pour moi ça a toujours été très important cette idée d’ouverture et de partage de l’information et du code source pour le design qui existe. C’est juste parce que, en tant qu’Africain et pensant à partir de l’Afrique, je dirais c’est une grosse chance pour nous de pouvoir avoir fait toutes ces données de façon libre et de façon ouverte, parce que ça nous permet de contourner un certain nombre de barrières notamment financières. Pour moi c’est d’une importance capitale d’avoir accès aux codes.
 +
 
 +
<b>Caroline Lachowsky : </b>Vous avez même mené une enquête sur les obstacles, finalement, à l’adoption de l’open science notamment chez les étudiants en Afrique, en Haïti. Quels sont ces obstacles ?
 +
 
 +
<b>Thomas Hervé Mboa Nkoudou : </b>En fait le projet SOHA est né du financement d’aide du Canada qui visait justement à documenter l’invisibilité des chercheurs d’Afrique francophone et Haïtiens sur le Web scientifique. On se posait la question de savoir pourquoi avec tous les outils <em>open</em> qui existent aujourd’hui, ces Africains et Haïtiens sont toujours autant absents sur la scène internationale du savoir. Alors on a mené cette enquête-là qui nous a amenés vers neuf injustices cognitives. Nous les avons appelées des injustices cognitives, c’est-à-dire des obstacles qui nous empêchent de penser en tant qu’Africains parce qu’elle n’est pas forcément liée à nous, elle est quelquefois liée à la barrière linguistique, elle est liée à la barrière infra-structurelle, elle est liée à la barrière pédagogique et elle est liée… on en a neuf ; en tout cas nous avons sorti tout un livre là-dessus avec mes collègues.
 +
 
 +
<b>Caroline Lachowsky : </b>Et vous avez l’impression que justement ces bibliothèques universelles du code source, cette manière de partager le patrimoine logiciel de l’humanité, ça peut être particulièrement utile pour lever ces obstacles, les injustices cognitives pour les chercheurs africains ou pour les étudiants africains et haïtiens ?
 +
 
 +
<b>Thomas Hervé Mboa Nkoudou : </b>C’est déjà un bon début, mais il faut se poser la question de savoir aussi dans quel sens. Parce que le libre accès et l’ouverture aussi est un couteau à double sens. Parce s’il faut faire une écologie du savoir sur le Web on se rend compte que la majorité des savoirs disponibles proviennent d’une région du monde, notamment du Nord. Il faut donner aux Africains, donner aux universités africaines, aux institutions supérieures africaines, les infrastructures qui permettront aux chercheurs africains ou bien aux savants africains de générer la connaissance endogène.
 +
 
 +
<b>Caroline Lachowsky : </b>Merci infiniment. On va en reparler avec vous certainement sur notre antenne Thomas Hervé Mboa Nkoudou. Est-ce que vous auriez, pour terminer, une question à poser à notre invité, en studio avec nous, Roberto Di Cosmo ?
 +
 
 +
<b>Thomas Hervé Mboa Nkoudou : </b>Je ne sais pas quelles mesures ont été prises au niveau local, parce que l’Unesco quand même a une puissance politique ; ils peuvent facilement faire avancer les choses au niveau africain. Donc j’aimerais bien savoir sur la structure au niveau du Cameroun, au niveau d’autres pays africains, quelles sont les dispositions qui ont été prises ? Parce qu’il est aussi vrai que l’Unesco en tant que force politique peut-être va s’arrêter au niveau étatique, au niveau exécutif, mais l’information n’arrive jamais où ça devrait arriver c’est-à-dire au niveau des étudiants. Par exemple pour moi la chose qui ferait changer les choses lors de sa présentation qu’il nous présente un peu les dispositions pour qu’un étudiant qui n’est pas le neveu de tel ministre soit autant informé, autant impliqué dans la chose. C’est compliqué comme question, mais ce sont nos réalités.
 +
 
 +
==24’ 23==
 +
 
 +
<b>Caroline Lachowsky : </b>Que pouvez-vous répondre Roberto Di Cosmo

Version du 14 septembre 2018 à 07:15


Titre : « Pourquoi une bibliothèque universelle des logiciels ? »

Intervenants : Roberto Di Cosmo - Caroline Lachowsky

Lieu : Émission Autour de la question - RFI

Date : septembre 2018

Durée : 48 min 30

Écouter ou télécharger le podcast

Licence de la transcription : Verbatim

NB : transcription réalisée par nos soins. Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Statut : Transcrit MO

Description

Notre invité du jour, le chercheur en informatique Roberto Di Cosmo, s'interrogera autour de la question suivante : « Pourquoi une bibliothèque universelle des logiciels ? » Pourquoi une bibliothèque universelle (une bibliothèque d’Alexandrie) des logiciels ? Comment collecter, préserver et rendre accessible à tous, ce nouveau patrimoine commun de l’humanité ? Comment partager nos logiciels en toute liberté ? Avec Roberto Di Cosmo, chercheur en informatique détaché auprès d'Inria, directeur de l'initiative Software Heritage, professeur d'Informatique de l'Université Paris Diderot, et membre de l'IRIF.

Transcription

Voix off : Autour de la question. D’où ça vient ? Qu’est-ce que ça va changer ? C’est pour qui ? À quoi ça sert ? Caroline Lachowsky.

Caroline Lachowsky : Bonjour. Ravie de vous retrouver chers amis auditeurs pour une nouvelle saison avec ??? à la réalisation cette année, autour de toutes les questions qui nous animent. J’en profite pour vous remercier de votre interactivité et de votre curiosité. Nous ferons d’ailleurs encore plus appel à vous pour nourrir nos échanges. Je vous en reparle très vite, car nous sommes concernés et tous contributeurs aujourd’hui et c’est précisément cette réflexion qui a amené notre invité. Le chercheur en informatique Roberto Di Cosmo, ardent défenseur de la diffusion des savoirs, a initié une bibliothèque universelle des logiciels. Une véritable bibliothèque d’Alexandrie pour collecter, préserver et rendre accessibles à tous les codes sources de tous les logiciels disponibles dans le monde. Soutenue par l’Unesco, cette initiative essentielle, Software Heritage, arrive à point nommé pour préserver et mettre en commun ce nouveau patrimoine de l’humanité. Autour de la question pourquoi et comment partager nos logiciels en toute liberté ? Bienvenue.
Bonjour Roberto Di Cosmo.

Roberto Di Cosmo : Bonjour Caroline.

Caroline Lachowsky : Merci d’être en direct avec nous. Vous êtes chercheur informaticien, professeur à l’université de Paris Diderot, détaché auprès d’Inria, l’Institut national de recherche en informatique, ardent défenseur des logiciels libres et de la diffusion de tous les savoirs, vous êtes donc à l’initiative de ce fantastique projet de grande bibliothèque du code source, Software Heritage, inauguré à l’Unesco en juin dernier ; la bibliothèque d’Alexandrie des logiciels a pour mission de collecter, d’organiser, de préserver et de partager tous les logiciels disponibles. C’est une initiative formidable, assez monumentale ; comment vous est venu cette idée Roberto Di Cosmo ?

Roberto Di Cosmo : Tout d’abord je vous remercie beaucoup Caroline de m’accueillir pour parler de ce projet ; c’est quelque chose que je trouve passionnant. Pour comprendre effectivement comment cette idée est née, il faut que je vous dise : je suis un chercheur en informatique, je travaille avec les gens qui travaillent avec moi comme Stefano Zacchiroli et d’autres personnes de mon équipe, sur l’analyse et l’évolution des codes logiciels, et il y a quatre ans à peu près, on avait commencé un certain travail d’analyse sur des logiciels, qui avait l’air de fonctionner plutôt bien, et c’était tout naturel de se poser la question et de dire comment on peut faire ce travail-là sur tous les logiciels qui existent ? Donc on a juste commencé à chercher en se disant il doit bien y avoir un endroit dans lequel il y a bien tous les codes sources de tous les logiciels ; il y a sûrement quelqu’un qui y a pensé. Et là on a bien cherché, on a bien cherché à droite, à gauche, on n’a rien trouvé et, du coup, on a pris conscience d’un problème qui est quand mème incroyable, c’est-à-dire l’informatique est une discipline qui a changé, transformé, révolutionné notre monde, il y a des logiciels partout, ils sont nécessaires pour communiquer, pour transférer, pour acheter, pour s’entretenir, pour tout faire – et ils sont assez récents ça fait une cinquantaine d’années que les logiciels ont commencé vraiment à transformer notre monde – et pourtant personne jusque-là ne s’est soucié de préserver ce nouveau patrimoine des connaissances technologiques.

Caroline Lachowsky : Un nouveau patrimoine de connaissances technologiques. Rappelons, on va y revenir, que les logiciels, les tout premiers sont toujours valables aujourd’hui et qu’en plus, j’ai envie de vous poser la question pourquoi maintenant ? Mais parce que maintenant peut-être qu’on est à une période charnière justement entre les débuts de l’informatique et puis cette croissance exponentielle des logiciels ?

Roberto Di Cosmo : Absolument. Donc là, quand on a commencé à regarder – le sujet est immédiatement devenu passionnant quand on s’en est aperçus – on s’est rendu compte qu’on est à un moment vraiment charnière, un moment particulier dans l’histoire de l’informatique, parce que les premiers informaticiens un peu modernes, ceux qui commencé à travailler avec des vrais ordinateurs datent d’il y a un petit demi-siècle. Un petit demi siècle c’est beaucoup pour la vitesse d’évolution de l’informatique mais c’est très peu par rapport à l’histoire d’une discipline.
Donc on a une opportunité unique de pouvoir encore parler à la plupart des gens qui ont écrit les premiers logiciels, qui savent comment les logiciels qui ont fabriqué Internet, qui ont fabriqué le Web, qui ont fabriqué tout ça, ont été développés, pourquoi ils ont été faits de telle sorte ; ces personnes sont encore vivantes.

Caroline Lachowsky : Donc on peut aller les voir et on peut leur demander comment elles ont fait leur code et récupérer tous ces codes sources. C’est ça ?

Roberto Di Cosmo : On peut aller les voir. Exactement et ça c’est une opportunité unique parce que dans d’autres disciplines, je parle des mathématiques moi j’aimerais bien parler avec Archimède et lui demander pourquoi il a fait les chose comme ça, mais c’est un peu trop tard, il y a 2000 ans qui sont passées. J’aimerais bien passer avec Leibnitz, avec Newton, avec Pascal mais c’est un peu trop tard, ils sont déjà tous partis, alors que dans l’informatique l’essentiel des gens est encore là. Donc il y a cette possibilité de tout récupérer et, en plus, si vous regardez – et on a des chiffres on peut regarder comment ça fonctionne – on voit que le développement des logiciels explose. Il n’y a jamais eu autant de logiciels qui sont développés, donc non seulement on peut récupérer le passé, mais on se trouve aussi dans une phase où il est vraiment nécessaire de construire l’infrastructure de préservation pour s’assurer que demain on ne devra pas faire pas faire un effort inhumain pour récupérer des choses qu’on perd. Chaque année qui passe la quantité de logiciels à préserver grandit et il faut s’y mettre tout de suite pour que la tâche ne soit pas infaisable.

Caroline Lachowsky : Pour collecter ce qui est fait et ensuite pour pouvoir les relire, si j’ose dire, sur tous les supports parce que cette question est là aussi évidement.

Roberto Di Cosmo : Évidemment, et c’est très bien qu’on ait parlé de ça parce que vous voyez, on peut se poser la question et savoir, mais d’accord, mais les logiciels, moi je suis pas informaticien pourquoi ça devrait m’intéresser ? D’un côté, il faut savoir que les logiciels arrivent en deux fois : il y a les logiciels exécutables qu’on peut trouver sur son téléphone ou sur son ordinateur, qu’on utilise pour faire une tâche particulière, ça c’est bien, mais ces logiciels exécutables-là ne sortent pas d’un chapeau ils ont été écrits, et regardez, on utilise vraiment le terme écrire un logiciel, les logiciels sont écrits par des développeurs, par des êtres humains, qui peuvent être des développeurs, des ingénieurs, des chercheurs, des hobbyistes, des personnes qui ont appris informatique toutes seules et qui écrivent ces logiciels dans ce qu’on appelle des langages informatiques, mais ces langages informatiques et ces codes sources des logiciels sont une forme de connaissance spéciale parce qu’ils sont faits pour qu’un autre développeur puisse les lire, parce qu’on a besoin de les modifier peut-être dans une semaine, peut-être dans un mois, et peut-être que la personne qui va les modifier ça va être moi-même donc j’ai intérêt à ce que ça soit relisible. Et en même ils sont suffisamment techniquement détaillés pour produire les exécutables qu’on utilise partout.
Donc nous on se focalise sur les codes sources et pourquoi les codes sources ? Parce que justement, comme ils sont faits pour être lus par des êtres humains, ils ont la propriété qu’on pourra toujours les relire et comprendre ce qu’ils font, même quand les machines sur lesquelles ils pouvaient s’exécuter n’existeront plus.

Caroline Lachowsky : Autour de la question, pourquoi et comment l’heure est venue de collecter et de partager tous ces codes sources de nos logiciels en toute liberté, petit rappel historique et chronologique de cette informatisation de notre monde. C’est le mix forcément codé et programmé par ???

7’ 08

Diverses voix off : Le premier programmeur au monde est une programmeuse. Et ça, c’est l’histoire d’Anna Lovelace ; elle s’est passionnée pour la machine analytique. Dans une de ses notes, elle décrit l’enchaînement d’instructions qu’il faut donner à la machine pour réaliser une suite mathématique, mais pas seulement l’algorithme qui permet de réaliser cette suite, elle décrit jusqu’à la position des rouages. Et ça, traduire un algorithme dans une séquence d’instructions qu’il faut donner à un ordinateur pour qu’il le réalise, c’est de la programmation informatique.

C’est incroyable ça !

Là c’est un ordinateur qui ne peut rien faire comme ça. Ce qu’on fait c’est qu’on prend une cassette et, à partir de là, cette cassette contient des programmes pour l’ordinateur et, vous avez vu, j’ai appuyé sur un bouton, j’appuie sur autre bouton et on va charger le programme.

Ah vous êtes le nouveau prof d’informatique, c’est ça ?

J’ai décidé de porter la liberté aux utilisateurs de l’informatique. Le but est d’éliminer le logiciel pas libre et de le remplacer par du logiciel libre. Le logiciel privateur ne doit pas exister.

Tant mieux, parce que moi j’adore ça la liberté !

Il n’y a pas un catalogue central de tous les logiciels nous utilisons tous des plateformes diverses et variées, pour développer, pour distribuer.

C’est là Alexandrie, qui met en place un projet qu’il a imaginé pour la Grèce c’est-à-dire réunir tous les savoirs du monde au même endroit. L’idée est magnifique, il faut juste la réaliser !

Ouais, il n’y a plus qu’à réunir les gars maintenant.

Caroline Lachowsky : Il n’y a plus qu’à, Roberto Di Cosmo, c’est vite dit sauf que c’est un travail de titan, monumental. Est-ce qu’on pourrait avoir une idée, après ce résumé de l’informatique au cours de notre siècle – on a même entendu Richard Stallman, celui qui nous met en avant les logiciels libres –, est-ce qu’on peut avoir une idée du volume de données monstrueux que vous avez à traiter pour cette bibliothèque universelle des logiciels ?

Roberto Di Cosmo : En réalité, effectivement, c’est une très bonne question : il y a combien de codes sources logiciels informatiques ??? Je peux vous dire déjà ce que nous avons trouvé. Au bout de quatre ans de travail, parce qu’on a quand même commencé à travailler il y a un petit moment pour construire l’infrastructure.

Caroline Lachowsky : L’infrastructure de cette bibliothèque universelle des logiciels et commencé à les collecter ; c’est ça ?

Roberto Di Cosmo : Eh oui, exactement, commencé à les collecter. Parce que si vous voulez, d’une certaine façon on a besoin de construire une infrastructure, un énorme aspirateur qui se connecte aux différents endroits sur la planète dans lesquels on développe les logiciels, en particulier, en premier lieu, les logiciels libres et qui les récupèrent avec toute leur histoire de développement. Donc on sait en détail quelle ligne de code a été rajoutée par qui, à quel moment, pourquoi ; ça c’est vraiment passionnant et fascinant. Là, aujourd’hui, on a déjà identifié plus de 80 millions d’origines à partir desquelles on récupère ces logiciels et après, en regardant ce qu’il y a là-dedans, on a trouvé plus de 4 milliards et demi de fichiers sources tous différents, parce qu’un même fichier source peut-être réutilisé à plusieurs endroits mais nous on ne le garde qu’une seule fois ; donc il y a plus de 4 milliards et demi de fichiers sources tous différents qui ont été développés. Dans notre bibliothèque, si vous regardez, le logiciel le plus ancien date des années 70, voire un peu avant, et le logiciel le plus moderne date peut-être d’hier, parce qu’on ne collecte pas seulement le passé, mais aussi tout ce qui se développe aujourd’hui.

Caroline Lachowsky : Vous m’avez montré sur votre ordinateur tout à l’heure le code source d’Apollo. Incroyable, avec des commentaires en plus, Roberto Di Cosmo.

Roberto Di Cosmo : Absolument. Si vous regardez, dans cette énorme bibliothèque on trouve de vrais trésors. Un de ces trésors que j’adore particulièrement c’est le code source du système de commande de l’Apollo 11 qui a plusieurs particularités. Tout d’abord parce qu’effectivement, là on a mentionné Ada Lovelace, mais la personne qui a piloté l’équipe qui a développé ce logiciel s’appelle Margaret Hamilton ; c’est une dame incroyable.

Caroline Lachowsky : Une femme informaticienne.

Roberto Di Cosmo : Une femme informaticienne qui a 82 ans aujourd’hui. J’ai eu la chance de la rencontrer il y a quelques mois lors d’une conférence internationale ; elle est toujours aussi brillante, aussi géniale que ce qu’elle était à l’époque où elle développait ces codes-là.
Donc on trouve de vrais trésors, parce que vous voyez, à l’époque, l’ordinateur de l’Apollo 11 c’était un ordinateur qui était très avancé pour l’époque mais qu’on programmait avec des langages informatiques qui étaient de très bas niveau, très proches de la machine donc on souffrait beaucoup pour programmer tout ça et donc on mettait énormément de commentaires. Les commentaires sont faits pour des êtres humains, pour leur dire « regarde les instructions suivante va faire telle ou telle autre chose ». Et ce qu’on a regardé ensemble tout à l’heure, justement il y avait un fragment du programme d’allumage des réacteurs de l’Apollo 11 qui est développé d’une façon un peu particulière ; du coup les commentaires des développeurs sont géniaux parce qu’il y a un des développeurs qui écrit, qui reprend l’ancienne devise honni soit qui mal y pense, c’est-à-dire « ne pensez pas mal ; si on a codé comme ça on n’avait pas le moyen de faire mieux » et plus tard un ??? qui écrit no ???, « ne pas toucher si vous ne savez pas ce que vous faites ». Ça c’est une partie qui est super délicate dans les commandes de l’Apollo 11.

Caroline Lachowsky : Que ce soit pour l’Apollo ou pour les commandes d’un avion, il ne vaut pas toucher le code source.

Roberto Di Cosmo : Il vaut mieux ne pas toucher si on ne sait pas ce qu’on fait. D’accord ! Il faut un peu regarder. Donc on peut encore relire tout ça et en révisant ces codes on voit vraiment une histoire passionnante et, vous voyez, les instructions pour l’ordinateur vont finir dans l’ordinateur, mais les commentaires ne disent rien à l’ordinateur ; ils nous parlent à nous, ils nous racontent une histoire humaine. L’histoire de l’informatique est une histoire d’êtres humains, d’hommes et de femmes qui ont travaillé ensemble, qui ont passé des nuits et des jours de passion pour construire cette ??? logique qui change le monde d’aujourd’hui.

Caroline Lachowsky : Qui change le monde d’aujourd’hui.

Roberto Di Cosmo : Et c’est cette histoire qu’on veut construire.

Caroline Lachowsky : Voilà. Vous voulez construire cette histoire et vous nous montrez aussi que ces logiciels, ces codes sources, sont quoi ? Des sortes d’objets vivants, enfin sur lesquels on peut travailler aussi aujourd’hui encore.

Roberto Di Cosmo : Absolument. C’est tout à fait ça. C’est important de comprendre que les codes sources des logiciels sont des objets nobles. Ce sont des créations de l’esprit humain ; ils sont développés par des êtres humains et maintenant, comme la complexité technologique grandit énormément, très souvent ce sont des gros logiciels. Prenez les navigateurs internet comme Firefox, prenez des systèmes de base de données comme PostgreSQL ou d’autres, du traitement d’images comme Gimp, ce sont des logiciels qui font des centaines, des milliers, voire des millions de lignes de code, et une seule personne ne peut pas se permettre d’écrire tout ça toute seule, donc on écrit de façon collaborative et on travaille ensemble sur cet objet, sur des plateformes qu’on appelle souvent des forges logicielles pour travailler ensemble. Et c’est fascinant. Par exemple, si on veut comparer avec la littérature. Le code source on l’écrit, on l’écrit comme on écrirait un texte, et là aussi c’est important de savoir pourquoi tel texte a été écrit de telle façon. Dans notre approche traditionnelle à la littérature, d’abord on sélectionne les livres qui sont importants et une fois qu’on a trouvé un livre qui est important, je ne sais pas, de Zola, de Hugo, eh bien on passe des nuits et des semaines et des années avec des étudiants dans les bibliothèques à chercher les lettres, les notes, les brouillons de ces écrits.

Caroline Lachowsky : Comment ont été écrits ces chefs-d’œuvres.

Roberto Di Cosmo : Pourquoi ils ont décidé d’écrire comme ça, etc. Alors dans le monde de l’informatique, pour les besoins de l’informatique, on garde la trace de tous ces développements au moment où on développe. Du coup, il y a peut-être des logiciels qui ne sont pas très intéressants, ce n’est pas grave, mais quand on a un logiciel intéressant, on a toute cette trace. Donc nous gardons non pas seulement des codes sources mais aussi toute la trace de développement.

Caroline Lachowsky : La trace humaine derrière ! On reconnaît bien l’humaniste et informaticien que vous êtes, Roberto Di Cosmo, et vous avez choisi évidemment d’écouter Birdy sur RFI People Help The People.

[Pause musicale]

16’ 55

Caroline Lachowsky : Birdy sur RFI, People Help The People. C’est votre choix Roberto Di Cosmo et pour cause, l’entraide, le partage, c’est la source même de cette bibliothèque universelle des codes sources.

Roberto Di Cosmo : Vous avez raison Caroline, c’est un de mes moteurs intérieurs depuis très longtemps. C’est-à-dire à la fois comme enseignant en informatique, comme professeur d’université, comme chercheur, ma mission a toujours été de partager à la fois la connaissance et la passion pour la connaissance. Il ne suffit pas juste de partager les notions, il faut aussi partager la passion. Donc là c’est une vraie passion de partager un peu cette histoire de l’informatique parce que autant la plupart des personnes qui nous écoutent au aujourd’hui ne sont pas directement capables de lire un programme informatique, autant dans quelques années, vous voyez le travail qu’on fait c’est sur le long terme, la plupart d’entre nous seront capables de lire un peu le code informatique de la même façon que la plupart de nous sont capables aujourd’hui de faire un peu de maths, de faire un peu d’histoire, de faire un peu de philosophie ; petit à petit l’informatique entre dans les écoles.
Donc on construit cette infrastructure pas seulement pour aujourd’hui mais vraiment pour le futur, pour les générations futures.

Caroline Lachowsky : Pour les générations futures, pour qu’elles soient capables de revenir à la source justement de tous ces logiciels que nous utilisons et pour les générations futures sur tous les coins de la planète parce que vous qui êtes très sensible à ces questions de partage, de transfert, de diffusion des savoirs, comment faire pour que cette bibliothèque universelle des logiciels puisse être accessible à ceux qui en ont le plus besoin et je pense notamment au grand Sud, à nos auditeurs sur le contient africain, en Amérique latine, ailleurs que là où on pense qu’ils sont fabriqués ces logiciels.

Roberto Di Cosmo : Effectivement. Ça c’est vraiment la question de l’université : un des aspects magiques de l’information et de l’informatique de l’Internet d’aujourd’hui c’est qu’effectivement une infrastructure comme celle-ci, peu importe où elle est fabriquée, elle peut rendre un service à tout le monde sur la planète et il ne faut pas publier qu’il y a quand même des tuyaux des fois qui ne sont pas si grands que ça donc c’est très important qu’il n’y ait pas une seule copie de cette bibliothèque.
Nous construisons ici à Paris ce projet magnifique de Software Heritage, mais dès le départ dans notre tête il y a eu cette idée de faire en sorte que à terme nous arrive à avoir un grand réseau international de miroirs pour faire en sorte qu’il y ait une copie de tous ces contenus à différents endroits sur la planète. Pourquoi ? Pour rendre plus facilement accessible de l’endroit où on se trouve et aussi, éventuellement, pour adapter la présentation aux besoins des différentes personnes. Il y a des gens qui veulent faire de la recherche très avancée sur les contenus, ils ont une certaine infrastructure ; d’autres veulent juste le réutiliser ailleurs.
Et il y a aussi un autre aspect, on veut aussi, je vous le disais tout à l’heure 80 millions de ressources en logiciels.

Caroline Lachowsky : C’est monstrueux.

Roberto Di Cosmo : C’est énorme ! Comment chercher dedans ce qui est intéressant. Donc là on essaie de nouer des partenariats avec des équipes de recherche, avec des entreprises, par exemple avec Qwant récemment pour construire un moteur de recherche qui soit adapté au code source, qui facilite l’accès aux contenus pour tout le monde.

Caroline Lachowsky : Pour tout le monde et qui permette aussi, ce dont on parle beaucoup aujourd’hui, ce sont les questions de science ouverte, que tous les chercheurs aient accès à cela. À ce sujet je vous propose, Roberto Di Cosmo, d’écouter l’éclairage d’un chercheur camerounais Thomas Hervé Mboa Nkoudou. Il est doctorant en communication publique à l’université de Laval au Québec ; il est président de l’APSOHA, l’Association pour la promotion de la science ouverte en Haïti et en Afrique francophone ; il a beaucoup travaillé sur toutes ces questions de libre accès, sur les obstacles aussi à l’adoption de la science ouverte par les étudiants africains. Il réagit depuis Yaoundé au Cameroun à la création de cette bibliothèque universelle des codes sources de logiciels.

Thomas Hervé Mboa Nkoudou : En fait, pour moi ça a toujours été très important cette idée d’ouverture et de partage de l’information et du code source pour le design qui existe. C’est juste parce que, en tant qu’Africain et pensant à partir de l’Afrique, je dirais c’est une grosse chance pour nous de pouvoir avoir fait toutes ces données de façon libre et de façon ouverte, parce que ça nous permet de contourner un certain nombre de barrières notamment financières. Pour moi c’est d’une importance capitale d’avoir accès aux codes.

Caroline Lachowsky : Vous avez même mené une enquête sur les obstacles, finalement, à l’adoption de l’open science notamment chez les étudiants en Afrique, en Haïti. Quels sont ces obstacles ?

Thomas Hervé Mboa Nkoudou : En fait le projet SOHA est né du financement d’aide du Canada qui visait justement à documenter l’invisibilité des chercheurs d’Afrique francophone et Haïtiens sur le Web scientifique. On se posait la question de savoir pourquoi avec tous les outils open qui existent aujourd’hui, ces Africains et Haïtiens sont toujours autant absents sur la scène internationale du savoir. Alors on a mené cette enquête-là qui nous a amenés vers neuf injustices cognitives. Nous les avons appelées des injustices cognitives, c’est-à-dire des obstacles qui nous empêchent de penser en tant qu’Africains parce qu’elle n’est pas forcément liée à nous, elle est quelquefois liée à la barrière linguistique, elle est liée à la barrière infra-structurelle, elle est liée à la barrière pédagogique et elle est liée… on en a neuf ; en tout cas nous avons sorti tout un livre là-dessus avec mes collègues.

Caroline Lachowsky : Et vous avez l’impression que justement ces bibliothèques universelles du code source, cette manière de partager le patrimoine logiciel de l’humanité, ça peut être particulièrement utile pour lever ces obstacles, les injustices cognitives pour les chercheurs africains ou pour les étudiants africains et haïtiens ?

Thomas Hervé Mboa Nkoudou : C’est déjà un bon début, mais il faut se poser la question de savoir aussi dans quel sens. Parce que le libre accès et l’ouverture aussi est un couteau à double sens. Parce s’il faut faire une écologie du savoir sur le Web on se rend compte que la majorité des savoirs disponibles proviennent d’une région du monde, notamment du Nord. Il faut donner aux Africains, donner aux universités africaines, aux institutions supérieures africaines, les infrastructures qui permettront aux chercheurs africains ou bien aux savants africains de générer la connaissance endogène.

Caroline Lachowsky : Merci infiniment. On va en reparler avec vous certainement sur notre antenne Thomas Hervé Mboa Nkoudou. Est-ce que vous auriez, pour terminer, une question à poser à notre invité, en studio avec nous, Roberto Di Cosmo ?

Thomas Hervé Mboa Nkoudou : Je ne sais pas quelles mesures ont été prises au niveau local, parce que l’Unesco quand même a une puissance politique ; ils peuvent facilement faire avancer les choses au niveau africain. Donc j’aimerais bien savoir sur la structure au niveau du Cameroun, au niveau d’autres pays africains, quelles sont les dispositions qui ont été prises ? Parce qu’il est aussi vrai que l’Unesco en tant que force politique peut-être va s’arrêter au niveau étatique, au niveau exécutif, mais l’information n’arrive jamais où ça devrait arriver c’est-à-dire au niveau des étudiants. Par exemple pour moi la chose qui ferait changer les choses lors de sa présentation qu’il nous présente un peu les dispositions pour qu’un étudiant qui n’est pas le neveu de tel ministre soit autant informé, autant impliqué dans la chose. C’est compliqué comme question, mais ce sont nos réalités.

24’ 23

Caroline Lachowsky : Que pouvez-vous répondre Roberto Di Cosmo