Différences entre les versions de « Libre à vous ! Radio Cause Commune - Transcription de l'émission du 12 février 2019 »

De April MediaWiki
Aller à la navigationAller à la recherche
(Contenu remplacé par « Catégorie:Transcriptions Publié [https://www.april.org/libre-a-vous-radio-cause-commune-transcription-de-l-emission-du-12-fevrier-2019 ici] - Février 2019 »)
 
(19 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
 
[[Catégorie:Transcriptions]]
 
[[Catégorie:Transcriptions]]
  
'''Titre :''' <em>Émission Libre à vous !</em> diffusée mardi 12 février 2019 sur radio Cause Commune
+
Publié [https://www.april.org/libre-a-vous-radio-cause-commune-transcription-de-l-emission-du-12-fevrier-2019 ici] - Février 2019
 
 
'''Intervenants :'''
 
 
 
'''Lieu :''' Radio Cause commune
 
 
 
'''Date :''' 12 février 2019
 
 
 
'''Durée :''' 1 h 30 min
 
 
 
'''[https://media.april.org/audio/radio-cause-commune/libre-a-vous/emissions/20190212/libre-a-vous-20190212.ogg Écouter ou télécharger le podcast]'''
 
 
 
[https://www.april.org/emission-libre-a-vous-diffusee-mardi-12-fevrier-2019-sur-radio-cause-commune Page des références utiles concernant cette émission]
 
 
 
'''Licence de la transcription :''' [http://www.gnu.org/licenses/licenses.html#VerbatimCopying Verbatim]
 
 
 
'''Illustration :'''
 
 
 
'''NB :''' <em>transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.<br />
 
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.</em>
 
 
 
==Transcription==
 
 
 
<b>Voix off : </b><em>Libre à vous !</em>, l’émission pour comprendre et agir avec l’April, l’association de promotion et de défense du logiciel libre.
 
 
 
<b>Frédéric Couchet : </b>Bonjour à toutes. Bonjour à tous. Vous êtes sur la radio Cause Commune 93.1 en Île-de-France et partout ailleurs sur le site causecommune.fm. La radio dispose d’un <em>webchat</em>, donc utilisez votre navigateur web, connectez-vous sur le site de la radio, cliquez sur « chat » et rejoignez-nous sur le salon web.<br/>
 
Nous sommes mardi 12 février 2019, nous diffusons en direct, mais vous écoutez peut-être une rediffusion ou un podcast.
 
 
 
Soyez les bienvenus pour cette nouvelle édition de <em>Libre à vous !</em>, l’émission pour comprendre et agir avec l’April, l’association de promotion et de défense du logiciel libre. Je m’appelle Frédéric Couchet, je suis le délégué général de l’April.<br/>
 
Le site web de l’April est april.org, a, p, r, i, l point org et vous y trouvez déjà une page consacrée à cette émission avec tous les liens et références utiles, les détails sur les pauses musicales et toute autre information utile en complément de l’émission. Vous pouvez également nous faire des retours pour nous indiquer ce qui vous a plu mais aussi des points d’amélioration. Je vous souhaite une excellente écoute.
 
 
 
Nous allons passer maintenant au programme de cette émission.<br/>
 
Nous allons commencer dans quelques secondes par une chronique de Jean-Christophe Becquet, président de l’April, intitulée « Pépites libres ». Normalement Jean-Christophe est avec nous au téléphone, bonjour Jean-Christophe.
 
 
 
<b>Jean-Christophe Becquet : </b>Bonjour Fred. Bonjour à tous.
 
 
 
<b>Frédéric Couchet : </b>On se retrouve d’ici quelques secondes.<br/>
 
D’ici une quinzaine de minutes notre sujet principal portera sur le projet Software Heritage avec Roberto Di Cosmo qui est avec nous en studio. Bonjour Roberto.
 
 
 
<b>Roberto Di Cosmo : </b>Bonjour Fred.
 
 
 
<b>Frédéric Couchet : </b>Et en fin d’émission nous parlerons du projet de loi pour une école de la confiance et des amendements proposant d’inscrire dans la loi la priorité au logiciel libre dans l’Éducation.
 
 
 
Je salue à la réalisation de l’émission pour sa première notre camarade Patrick Creusot sous la surveillance et l’aide d’Étienne Gonnu, de Charlotte Boulanger et d’une autre personne dont je ne connais pas le prénom, j’en suis désolé.
 
 
 
Tout de suite bous allons passer au premier sujet avec la seconde édition de la chronique de Jean-Christophe Becquet, président de l’April, chronique qui s’appelle « Pépites Libres ». Dans cette chronique Jean-Christophe nous présente une ressource sous une licence libre – texte, image, vidéo ou base de données – sélectionnée pour son intérêt artistique, pédagogique, insolite, utile et les auteurs de ces pépites ont choisi de mettre l’accent sur les libertés accordées à leur public.<br/>
 
La chronique du jour, Jean-Christophe, porte sur le dessin animé de Nina Paley, <em>Copier n’est pas voler</em>.
 
 
 
==2’ 35==
 
 
 
 
 
<b>Jean-Christophe Becquet : </b>Oui. Dans ma chronique du mois de janvier je vous invitais à découvrir la conférence <em>Un Faible Degré d’Originalité</em> d’Antoine Defoort dont la vidéo est disponible sous licence libre. Parmi ses sources d’inspiration j’évoquais Nina Paley et c’est sur elle que j’aimerais revenir aujourd’hui.<br/>
 
Nina Paley est une artiste américaine auteur de bandes dessinées et de dessins animés.<br/>
 
J’ai donc choisi de vous parler d’un dessin animé de Nina Paley <em>Copier n’est pas voler</em> ou <em>Copying Is Not Theft</em> en anglais. Il s’agit d’une vidéo très courte, elle dure à peine une minute. De manière ludique et en chansons Nina Paley démontre l’amalgame entre le vol et la copie.<br/>
 
En effet, le vol concerne des objets matériels alors que la copie s’applique aux idées et aux œuvres de l’esprit qui elles sont intangibles et immatérielles. Et c’est cette escroquerie intellectuelle que dénoncent les petits personnages de Nina Paley.<br/>
 
Dans le code pénal français, le vol est défini comme la soustraction frauduleuse de la chose d’autrui ; c’est l’article 3211.1. Donc le vol est une soustraction, c’est-à-dire qu’il prive sa victime de l’objet dérobé, alors que pour la copie c’est complètement différent : copier c’est multiplier. Je sais que le logiciel libre préserve vos libertés et je vous le dis. Alors nous sommes plusieurs à le savoir sans que je sois privé de ma connaissance initiale. On voit bien qu’il n’y a pas soustraction ! Les idées que je partage à travers cette chronique sont multipliées par le nombre d’auditeurs. En faisant le choix d’une licence libre pour ses émissions, Cause Commune encourage cette multiplication.
 
 
 
Les héros du dessin animé de Nina Paley s’amusent à comparer le vol et la copie d’un vélo. En effet, dans leur monde immatériel, il est possible très facilement de faire des copies : un simple coup de crayon, deux clics de souris et chacun peut enfourcher une copie du vélo. Ils échappent à ce qu’on appelle la rivalité des biens matériels, c’est-à-dire le fait que chacun prenne une copie d’un objet nécessite une quantité importante de ressources et d’énergie.<br/>
 
À l’inverse, depuis l’avènement d’Internet, la copie est grandement facilitée et son coût est devenu marginal. C’est un problème pour les défenseurs de l’ancien système basé sur des rentes indexées sur le nombre de copies. C’est une formidable opportunité pour l’humanité. De plus en plus d’auteurs choisissent de partager leur travail sous licence libre.<br/>
 
Aujourd’hui j’ai envie de dire : copions et multiplions toutes ces pépites libres !
 
 
 
<b>Frédéric Couchet : </b>Merci Jean-Christophe. Donc ce dessin animé de Nina Paley dure à peu près une minute. Les références sont sur le site de l’April avec la version originale qui est en anglais, une version française ; il y aussi un lien vers des versions modifiées parce que dès le départ, Nina Paley qui a diffusé ce dessin animé sous licence, de mémoire CC BY SA, Creative Commons Partage à l’identique, a encouragé les personnes à faire des modifications, à mettre leurs propres musiques. Donc il y a un certain nombre de versions modifiées avec des musiques assez sympas.<br/>
 
Ces petits personnages rappelleront les cartoons qu’on connaît avec notamment les petits personnages qui ont quatre doigts au lieu de cinq doigts. Ce dessin animé date de quelle époque ? Est-ce que tu te souviens ?
 
 
 
<b>Jean-Christophe Becquet : </b>C’est relativement ancien en fait, ça date de 2010, ça a dix ans et effectivement, comme tu l’as dit, parce que Nina Paley a choisi une licence libre, ce dessin animé a fait l’objet d’un grand nombre de reprises, d’adaptations, de traductions d’abord. On le trouve dans un grand nombre de langues. On a mis le lien vers la version française, mais il y aussi des versions en espagnol, en allemand. Il y a des adaptations avec d’autres styles de musique et on peut aussi télécharger les paroles, la partition. L’intérêt de la démarche de Nina Paley, c’est que toutes les briques de sa création sont libres et qu’elle encourage effectivement la création et la réutilisation. Du coup, en dix ans d’ancienneté de cette vidéo, il y en a eu un grand nombre.
 
 
 
<b>Frédéric Couchet : </b>Et ce n’est pas la première animation que Nina Paley a libérée parce qu’en 2006 ou 2008, peut-être, elle avait distribué son dessin animé beaucoup plus long, son animation <em>Sita Sings the Blues</em> sous licence Creative Commons Partage à l’identique et, en plus, elle avait explicitement interdit la pause de verrous numériques, les DRM qu’on a déjà évoqués dans une précédente émission. Donc Nina Paley est une personne qui milite vraiment, on va dire depuis 2008-2010 au moins, pour un mouvement de ce qu’on peut appeler la culture libre. Sur son site ninapaley.com on peut retrouver ses différentes productions en plus, effectivement, de ce dessin animé <em>Copier n’est pas voler</em> dont tu nous as parlé. Quel est le lien avec le logiciel libre ?
 
 
 
<b>Jean-Christophe Becquet : </b>En fait c’est que ces licences libres qui sont aujourd’hui utilisées pour les œuvres de Nina Paley, donc les licences Creative Commons, sont les héritières des licences du logiciel libre. C’est-à-dire que le Libre est né avec le logiciel libre, Richard Stallman en 1984 et, en fait, avec le temps, d’autres personnes ont eu envie de libérer d’autres ressources que des logiciels et se sont mises à réfléchir à des licences adaptées à des ressources non logicielles. Donc ça a donné la licence Art libre, par exemple, qu’on utilise à l’April, les licences Creative Commons dont certaines sont considérées comme libres et d’autres licences qui s’inspirent des libertés du logiciel libre, mais pour les transposer à d’autres œuvres comme des textes, des images ou des films et dessins animés dans le cas de Nina Paley.
 
 
 
<b>Frédéric Couchet : </b>Et le principe de non-rivalité que tu as expliqué et qui est explicité dans cette vidéo est évidemment valable pour toute œuvre de l’esprit qui est une ressource non exclusive et non rivale, c’est-à-dire que tout le monde a un libre accès à cette ressource, non exclusif, et il n’est pas possible d’exclure quelqu’un de l’usage d’une telle ressource sauf, évidemment, à recourir soit à des principes juridiques, soit à des principes techniques comme les mesures techniques qui, des fois, enfin souvent, sont également protégées par des principes juridiques.
 
 
 
<b>Jean-Christophe Becquet : </b>Oui. Tout à fait. C’est ce que j’ai appelé les tenants de l’ancien système qui eux utilisent des verrous juridiques et techniques pour lutter contre cette facilité de copie des ressources qui pose bien des problèmes à leur modèle économique archaïque.
 
 
 
<b>Frédéric Couchet : </b>Exactement. Et pour finir, je te laisserai le mot de conclusion, ça explique aussi pourquoi nous refusons le terme de « propriété intellectuelle », pour deux raisons principales. Déjà le terme « propriété intellectuelle » laisserait supposer qu’on peut, en fait, réfléchir aux œuvres de l’esprit comme on peut réfléchir à des objets matériels alors que ce n’est pas le cas, ce n’est pas la même propriété notamment ce que tu as expliqué, la non-rivalité. Et deuxième chose, c’est que le terme de « propriété intellectuelle » dans le droit englobe des domaines très différents qui vont du droit d’auteur, aux brevets et à plein d’autres choses qui sont très différentes dans leurs principes. C’est pour ça que nous on préfère parler spécifiquement d’un droit particulier, par exemple le droit d’auteur et que, dans son ensemble, le terme « propriété intellectuelle » ne doit pas être utilisé parce qu’il pousse à réfléchir sur les œuvres de l’esprit comme on réfléchirait sur des œuvres matérielles.<br/>
 
Est-ce que tu as une phrase de conclusion ? Est-ce que tu veux rajouter quelque chose cher Jean-Christophe ?
 
 
 
<b>Jean-Christophe Becquet : </b>Oui. Juste dire que Nina Paley a fait, comme tu l’as dit, d’autres dessins animés, notamment un autre dessin animé de sensibilisation au Libre qui montre à quel point toute œuvre créée s’inspire des œuvres existantes. Je vous invite à découvrir ça et puis, dans l’attente, eh bien je me mets en recherche d’une nouvelle ressource libre pour la chronique « Pépites libres » du mois prochain. Un grand merci et bonne écoute pour la suite de l’émission.
 
 
 
<b>Frédéric Couchet : </b>Merci Jean-Christophe et on se retrouve le mois prochain.
 
 
 
Nous allons passer par une petite pause musicale qui va être relativement courte vu qu’elle dure 59 secondes. Évidemment c’est la bande son du dessin animé de Nina Paley <em>Copier n’est pas voler</em>.
 
 
 
Pause musicale : <em>Copier n’est pas voler</em>, bande son du dessin animé de Nina Paley.
 
 
 
==12’ 30==
 
<b>Frédéric Couchet : </b>Vous êtes de retour sur Cause commune 93.1 en Île-de-France et partout dans le monde sur causecommune.fm. Nous venons d’écouter la bande son du dessin animé de Nina Paley <em>Copier n’est pas voler</em> dont les références sont sur le site de l’April, april.org, vous avez une page qui est consacrée à l’émission.
 
 
 
Nous allons passer à notre sujet principal avec notre invité du jour et c’est un grand plaisir de recevoir Roberto Di Cosmo pour parler de l’initiative Software Heritage, archive mondiale du logiciel. Donc rebonjour Roberto.
 
 
 
<b>Roberto Di Cosmo : </b>Bonjour Fred.
 
 
 
<b>Frédéric Couchet : </b>Roberto tu es italien, installé en France, tu es un libriste depuis très longtemps.
 
 
 
<b>Roberto Di Cosmo : </b>Depuis plus de 20 ans.
 
 
 
<b>Frédéric Couchet : </b>Je pense qu’on se connaît depuis une petite vingtaine d’années. Tu as été rendu célèbre notamment par un pamphlet en 1998 qui s’appelle <em>Piège dans le cyberespace</em> et ensuite par un livre coécrit avec Dominique Nora la même année, donc 1998, qui s’appelait <em>Le hold-up planétaire : la face cachée de Microsoft</em>, sur les problèmes posés par le monopole de Microsoft et aussi ses méthodes pour contrer toute concurrence et en premier le logiciel libre.<br/>
 
Depuis septembre 2010 tu es directeur du laboratoire IRILL, Initiative pour la Recherche et l’Innovation sur le Logiciel Libre et, depuis septembre 2016, tu es détaché auprès de l’Inria, l’Institut national de recherche en informatique et en automatique et tu es directeur de l’initiative Software Heritage depuis 2016.
 
 
 
<b>Roberto Di Cosmo : </b>oui. Tout à fait.
 
 
 
<b>Frédéric Couchet : </b>Est-ce que cette présentation te paraît correcte ou est-ce que tu veux ajouter quelque chose ?
 
 
 
<b>Roberto Di Cosmo : </b>On peut ajuster un petit déjà.
 
 
 
<b>Frédéric Couchet : </b>Ajuste !
 
 
 
<b>Roberto Di Cosmo : </b>Mais globalement on y est.
 
 
 
<b>Frédéric Couchet : </b>D’accord. Avant de te laisser la parole et avant d’échanger sur le projet Software Heritage, en préparant l’émission évidemment je me suis renseigné et j’ai trouvé qu’en fait, le plus simple, c’était de prendre des extraits de l’annonce officielle de l’Inria en 2016 qui annonce « Software Heritage, archive mondiale du logiciel ». Annoncée le jeudi 30 juin 2016 l’ouverture au public du projet Software Heritage : « Ce projet a pour objectif de collecter, organiser, préserver et rendre accessible à tous et à toutes le code source de tous les logiciels disponibles. Un enjeu de portée mondiale ». Antoine Petit, PDG de l’Inria, précise : « Les logiciels sont aujourd’hui au cœur de toutes les activités humaines, de la médecine aux loisirs, des communications à l’agriculture ». Je poursuis la présentation du communiqué de l’Inria : « En construisant une archive universelle et pérenne du logiciel, Software Heritage vise à mettre en place une infrastructure essentielle au service de la société, de la science et de l’industrie. Software Heritage vise à construire à la fois une moderne bibliothèque d’Alexandrie du logiciel, le référentiel unique du code source et un grand instrument de recherche pour l’informatique. Le projet va permettre de préserver et diffuser la connaissance aujourd’hui encodée dans le logiciel et augmentera notre capacité d’accéder à l’ensemble de l’information numérique. La base s’appuiera notamment sur une infrastructure distribuée — on y reviendra — de manière à garantir la robustesse et la disponibilité des données ». Lors de l’annonce, deux premiers partenaires internationaux s’étaient déjà engagés à soutenir le projet et l’aider à grandir, Microsoft, dont on vient de parler, ainsi qu’une institution publique au service de la recherche scientifique, le DANS de la Royale Académie des Pays-Bas.
 
 
 
<b>Roberto Di Cosmo : </b>Tout à fait.
 
 
 
<b>Frédéric Couchet : </b>Une fois cette introduction faite, j’ai envie de te poser la première question pour entrer un peu dans les détails, quels problèmes cherche à résoudre l’initiative Software Heritage lancée en 2016 par l’Inria ?
 
 
 
<b>Roberto Di Cosmo : </b>Tout d’abord merci de m’avoir invité, c’est vraiment un plaisir de participer et échanger un peu sur ce sujet, de prendre un peu de temps, un peu de calme. Comme tu sais, Fred, ça fait longtemps qu’on s’occupe de logiciels, de logiciels libres, de codes, d’informatique en général donc on a vu pas mal d’évolutions de notre société. Aujourd’hui on est tous d’accord que le logiciel est quelque chose d’essentiel. Par contre, il faut dire que les personnes qui ne sont pas très techniques donc qui ont plutôt l’habitude de voir les logiciels juste comme des outils : tu prends ton téléphone, tu appuies sur une icône, ça lance une petite application ça fait quelque chose, on peut envoyer des bisous à quelqu’un qu’on aime, on peut acheter quelque chose, on peut regarder un vidéo, c’est très bien. Par contre on a tendance à ne pas savoir, à oublier que derrière ces logiciels qui sont exécutables, qu’on utilise comme des outils, en vérité il y a tout un travail humain de conception super important. Ces logiciels ne tombent pas du ciel, ils sont écrits, c’est vraiment le terme qu’on utilise quand on développe – les développeurs écrivent du logiciel –, on les écrit dans des langages de programmation en produisant ce qu’on appelle le code source. C’est le code source du logiciel qui contient vraiment la connaissance qui est nécessaire pour faire fonctionner ce logiciel-là.
 
 
 
<b>Frédéric Couchet : </b>Tu peux expliquer peut-être juste ce qu’est le code source aux personnes qui nous écoutent.
 
 
 
<b>Roberto Di Cosmo : </b>On peut prendre l’analogie habituelle qu’utilise aussi Richard [Stallman] à un moment donné, l’histoire de la recette de cuisine. Par exemple vous avez un gâteau que vous aimez beaucoup, ça c’est un peu l’exécutable, vous coupez des tranches et vous mangez, c’est super. Par contre s’il faut le refaire c’est un peu compliqué si on ne vous a pas expliqué comment on l’a fait. En général on s’échange des recettes de cuisine dans lesquelles on dit dans quel ordre on a mis quel ingrédient, pendant combien de temps, etc. C’est un peu la même idée. Dans la musique aussi : vous pouvez écouter de la musique qui est fantastique mais pour refaire cette musique-là normalement on a besoin d’une partition et ce n’est pas facile de reconstruire la partition juste en écoutant la musique telle qu’elle est.<br/>
 
Il faut savoir que dans le cas des logiciels c’est un peu la même histoire, sauf que c’est énormément plus compliqué. À partir d’un binaire – un binaire c’est ce qu’on utilise pour les exécutables, les applications qu’on voit – reconstruire ce qu’on appelle le code source qui est la représentation du logiciel qui est préféré pour un développeur pour le modifier, c’est vraiment la définition formelle, c’est énormément difficile en partie aussi parce que, très souvent, dans ce logiciel on a plein de commentaires ou d’annotations qui sont faites pour les êtres humains, pour les relire, et qui disparaissent.
 
 
 
<b>Frédéric Couchet : </b>Qui sont supprimés dans la phase de cuisson, quelque part.
 
 
 
<b>Roberto Di Cosmo : </b>Voilà ! Dans la phase de cuisson ça disparaît, on ne les retrouve pas dans l’exécutable qui tourne sur la machine donc on a complètement perdu de l’information.<br/>
 
C’était un peu le préalable. Effectivement on parle souvent de logiciel, mais on oublie que ces logiciels sont fabriqués à travers une forme qui est ce code source, qui est vraiment précieuse, qui est une forme d’écriture nouvelle, technique, une sorte de littérature technique du 21e siècle qu’on est en train de mettre en place.
 
 
 
<b>Frédéric Couchet : </b>Ça ressemble quand même à un langage quelque part naturel parce qu’il y a une grammaire, il y a un vocabulaire et en fait, n’importe quelle personne, en y pensant du temps, peut apprendre à écrire du code ou à le comprendre.
 
 
 
<b>Roberto Di Cosmo : </b>Absolument. Tu fais très bien de le dire. Il ne faut pas non plus se sentir rebuté par le code source. C’est la même chose que dans la littérature. On utilise tous le français, moi avec un peu d’accent, mais normalement on utilise tous la langue française. Pourtant il y a des textes qui sont très faciles à lire, il y a des textes qui sont beaucoup plus compliqués donc il faut passer du temps pour comprendre ce que ça veut dire.<br/>
 
Dans le cas des programmes c’est un peu similaire : il y a des programmes qui sont très simples à aborder et des programmes qui sont plus complexes, qui nécessitent plus de temps pour comprendre des notions plus avancées. C’est quand même à la portée, pas de tout le monde, mais en y mettant un peu d’énergie on arrive à comprendre ce qui se passe derrière. C’est vraiment une production humaine.
 
 
 
<b>Frédéric Couchet : </b>Donc ce premier point et je te laisse continuer, c’est l’importance du code source quand on parle de logiciel et donc ça sera l’un des points central de Software Heritage. Je te laisse poursuivre.
 
 
 
<b>Roberto Di Cosmo : </b>Absolument. On s’est aperçu qu’effectivement dans notre monde – c’était très surprenant, parce que tous ces éditeurs on ne peut pas les voir –, mais moi j’ai un peu la barbe blanche, je commence à avoir un certain âge, n’empêche que comme informaticien je pense toujours au futur, on est toujours projeté vers le futur. On a du mal à se confronter à l’idée de perdre, de disparition, de mort, d’échec, de perte d’information. On ne réfléchit pas trop, on est toujours dans la dynamique de construire des choses nouvelles, mais après, si on se pose un instant, on se rend compte qu’il y a énormément de cette connaissance, énormément de logiciels qu’on a construits, de codes sources qu’on a écrits qui sont en réalité en danger ; personne ne s’occupe vraiment de les préserver, de les protéger, de les indexer, de les rendre facilement disponibles. Il y a énormément d’initiatives pour archiver des informations numériques, par exemple l’Internet Archive qui est une initiative magnifique.
 
 
 
<b>Frédéric Couchet : </b>C’est <em>archive.org</em> ou archive.org.
 
 
 
<b>Roberto Di Cosmo : </b>C’est parti il y a plus de 20 ans cette <em>archive</em>. Elle archive le Web, les pages web qu’on connaît. Il y a d’autres initiatives qui essaient d’archiver des vidéos, qui essaient même d’archiver des exécutables de logiciel, Internet Archive fait ça aussi, un peu. Donc on archive tout ce que vous voulez dans le monde numérique sauf, et c’était ça qui était surprenant, le point de départ du projet, sauf le code source qui est quand même la brique fondamentale de la révolution numérique dans laquelle on vit aujourd’hui. C’était étonnant ! Quand on s’est aperçu de ça et d’ailleurs on s’en est aperçu de façon un peu…
 
 
 
<b>Frédéric Couchet : </b>En fait, peut-être que les gens pensaient que comme le code source était dupliqué sur plein de machines qu’il ne pourrait jamais disparaître. Peut-être que les gens pensaient ça !
 
 
 
<b>Roberto Di Cosmo : </b>Tu sais, le même argument on peut le faire pour la vidéo, pour les images, etc. Pourquoi les archiver si elles sont bien dupliquées sur l’ordinateur de quelqu’un ?
 
 
 
<b>Frédéric Couchet : </b>Oui, tout à fait.
 
 
 
<b>Roberto Di Cosmo : </b>On a tendance à confondre plusieurs activités qui sont très importantes. D’ailleurs j’ouvre une petite parenthèse mais qui est importante en termes de terminologique : quand on développe du logiciel, souvent aujourd’hui quand on fait du logiciel libre on travaille de façon collaborative, en réalité on a besoin d’infrastructures qui font trois choses différentes.<br/>
 
Il y a un premier type d’infrastructures qui sont ce qu’on appelle souvent les forges logicielles, ce sont des endroits dans lesquels une communauté de développeurs travaille de façon collaborative pour mettre au point un logiciel ou le faire évoluer. On travaille ensemble, on commente, on décide, on trouve les erreurs, on les corrige, etc. C’est très dynamique. Ça ce sont les plateformes de développement.<br/>
 
À un certain moment on peut dire : tiens, cette version-là du logiciel est quand même la version stable, celle qu’on veut vraiment distribuer, que tout le monde puisse la réutiliser facilement, etc. À ce moment on a envie de le diffuser, de le partager, de le rendre plus facilement accessible à tout le monde et là on passe dans une deuxième catégorie de plateformes qui sont normalement des plateformes de distribution.<br/>
 
Et après il y a un troisième type de plateformes qui n’existent pas, qui sont des plateformes d’archivage. C’est quoi une archive ? C’est un endroit dans lequel quand on a versé un objet dedans, on a déposé un objet dedans, on repasse six mois, deux ans, trois ans, dix ans, cent ans après, si on est tous vivants, et on retrouve le même objet.<br/>
 
Ce sont trois missions très différentes.
 
 
 
<b>Frédéric Couchet : </b>Je vais juste préciser par rapport aux personnes qui écoutent régulièrement l’émission qu’on a parlé des distributions GNU/Linux il y a une semaine ou quinze jours, je ne sais plus, notamment avec Nicolas Dandrimont qui travaille avec toi sur Software Heritage et qu’on a parlé plusieurs fois des forges logicielles, alors pas d’un point de vue technique, mais on en a parlé dans le cadre du projet de directive européenne sur le droit d’auteur qui peut mettre justement en danger ces forges logicielles. Vous retrouvez ces références sur le site de l’April, podcast et transcriptions. Je te laisse poursuivre Roberto.
 
 
 
<b>Roberto Di Cosmo : </b>Parfait, merci.<br/>
 
Donc là, finalement ce qui manquait dans le panorama, c’était une plateforme qui fasse vraiment l’archivage de ces logiciels. Donc c’était vraiment quelque chose qui manquait et, en regardant un peu plus, on s’était rendu compte qu’effectivement il y a plein de logiciels, il y a plein de codes sources de logiciels qui sont disponibles ; cela dit, on n’a pas un vrai catalogue. Ils sont éparpillés sur plein de ces autres plateformes, soit sur les plateformes de développement, soit sur les plateformes de distribution, on ne sait pas où chercher. Donc la meilleure approche, en général, c’est un moteur de recherche : demander à un copain à la machine à café : où est-ce que je trouve telle <em>librairie</em> pour faire telle bibliothèque, pour faire telle application. Finalement on a découvert qu’il n’y avait pas d’archive.<br/>
 
Fred, par exemple quand on a commencé ça, parce qu’après tu as bien fait de mentionner le 30 juin 2016 c’est le moment où on a annoncé le projet de façon publique…
 
 
 
<b>Frédéric Couchet : </b>Mais le projet avait commencé avant.
 
 
 
<b>Roberto Di Cosmo : </b>Le projet avait commencé bien avant.
 
 
 
<b>Frédéric Couchet : </b>Quand ça ?
 
 
 
<b>Roberto Di Cosmo : </b>Les premières idées ont commencé à circuler dans l’été 2014.
 
 
 
<b>Frédéric Couchet : </b>Donc deux ans avant en fait.
 
 
 
<b>Roberto Di Cosmo : </b>Deux ans avant.
 
 
 
<b>Frédéric Couchet : </b>Quand il y a l’annonce de l’Inria vous avez déjà commencé à travailler, vous avez déjà commencé à archiver des logiciels. Tu te souviens au moment de l’annonce de l’Inria combien il y en avait déjà ?
 
 
 
<b>Roberto Di Cosmo : </b>Je pense qu’on avait déjà archivé peut-être un milliard de fichiers sources différents.
 
 
 
<b>Frédéric Couchet : </b>Un milliard de fichiers sources. D’accord !
 
 
 
<b>Roberto Di Cosmo : </b>Ce qui est quand même remarquable ; ce sont des fichiers sources tous différents, uniques. Il faut savoir que justement dans cette période pendant laquelle on était en mode un peu sous-marin, on ne voulait pas… Je déteste vendre du <em>slideware</em>, vendre de la fumée.
 
 
 
<b>Frédéric Couchet : </b>Du<em>slideware</em>. En français on traduit ça comment ?
 
 
 
<b>Roberto Di Cosmo : </b>Je ne sais pas comment traduire ça.
 
 
 
<b>Frédéric Couchet : </b>C’est-à-dire uniquement des diaporamas avec des listes à points.
 
 
 
<b>Roberto Di Cosmo : </b>Des diaporamas avec quelques idées et après on ne sait pas comment c’est fait. Je préfère arriver avec un prototype, montrer des choses qui fonctionnent. On avait mis en place une petite équipe, commencé à construire un prototype pour donner de la crédibilité à ce qu’on faisait. C’est une démarche pas évidente. Mais tu vois, dans cette période-là où on était en souterrain, c’est-à-dire entre 2014 et 2016, il y a eu deux événements qui ont montré clairement pourquoi c’était important d’avoir une archive. Parce que, comme tu dis, plein de gens se disent pourquoi faire une archive ? Après tout il y a plein de copies à droite, à gauche, il n’y a pas de problème.
 
 
 
<b>Frédéric Couchet : </b>Eh bien oui, c’est sur Internet !
 
 
 
<b>Roberto Di Cosmo : </b>C’est sur Internet, on le trouve, etc. Il faut savoir qu’au mois de mars 2015, c’est assez intéressant, il y avait deux plateformes de développement très populaires à l’époque, une qui s’appelait Gitorious et l’autre qui était Google Code, pas exactement la même quantité d’argent derrière, les deux étaient très populaires. Sur Gitorious il y avait à peu près 120 000 projets de développement logiciel, sur Google Code il y en avait un million et demi. Au mois de mars 2015, il y a deux annonces : d’un côté l’annonce de Gitorious qui se fait racheter par une autre entreprise qui est GitLab. Comme il y a ce rachat-là, ils décident de fermer l’ancienne forge Gitorious, ils ne font pas de transfert de données, ils ont juste donné une annonce.
 
 
 
<b>Frédéric Couchet : </b>Ils ferment sans laisser accès, c’est ça ?
 
 
 
<b>Roberto Di Cosmo : </b>Ils ferment sans laisser l’accès et ils disent tout simplement aux gens : » Écoutez on ne va pas maintenir deux plateformes ; vous avez quand même trois semaines pour tout transférer et après on ferme. » Alors ça a duré un plus de trois semaines, heureusement, parce que les gens ont un peu protesté. Vous voyez un petit peu le topo. Maintenant effectivement c’est fermé. Si vous allez regarder là-dedans il n’y a plus rien et, en parallèle, Google avait annoncé que bon, bref ! Il y avait d’autres solutions, que Google Code n’était justement plus justifié à maintenir. Ça c’est leur décision, c’est leur droit de faire ce qu’ils veulent, c’était mis à disposition de façon gratuite mais pas libre, justement, et là c’était un milliard et demi de projets qui étaient mis en danger sauf que Google est un peu plus seigneurial donc il a donné un an.
 
 
 
<b>Frédéric Couchet : </b>Donc ils ont laissé plus de temps ! Un an.
 
 
 
<b>Roberto Di Cosmo : </b>Un an, pas trois semaines et ils ont quand même gardé une sorte de version d’archive dans un coin.<br/>
 
Ça c’est arrivé un peu à point nommé parce qu’ils montraient que le message qu’on envoyait, c’est-à-dire que c’est important de construire une archive. Qu’est-ce que c’est une archive ? C’est vraiment une plateforme dont la finalité est l’archivage et pas autre chose, que c’était nécessaire. Après ces deux évènements c’était devenu relativement clair pour tout le monde que c’était nécessaire d’aller dans cette direction-là.<br/>
 
La troisième chose qu’on avait observée c’est qu’effectivement aujourd’hui non seulement le logiciel est au cœur de toute la transformation numérique de notre société, mais le logiciel libre est au cœur des logiciels qui transforment notre société. Presque toutes les entreprises utilisent du logiciel libre de façon massive encore aujourd’hui, donc il est devenu super important, par exemple, de se doter d’une plateforme qui permette d’analyser systématiquement le code source de ces logiciels pour essayer de repérer les erreurs, les vulnérabilités, rendre plus facile l’analyse des codes, aider les développeurs à mieux réutiliser leurs codes, etc. Pour ça on a besoin d’une plateforme commune qu’on n’a jamais réussi à construire avant.<br/>
 
Par exemple j’ai plein d’amis qui sont dans le monde de la physique, un de mes copains est parti aux États-Unis il y a très longtemps, s’occupe d’un gros projet de télescope spatial, je suis très admiratif de mes collègues en physique qui sont capables de mobiliser des ressources très conséquentes, là on parle de milliards, de dizaines de milliards d’euros, pour chercher à comprendre l’origine de l’univers, regarder les étoiles, regarder l’infiniment petit. Ça c’est super important, je n’ai rien contre, au contraire, je suis très admiratif du fait qu’ils arrivent à le faire. Par contre nous dans le monde de l’informatique, qui est pourtant le moteur de la transformation numérique, jusque-là on a été un peu incapables de fédérer le même type d’effort pour avoir une plateforme commune qu’on puisse, de façon mutualisée, réutiliser pour travailler ensemble, pour améliorer la qualité des logiciels que nous développons.<br/>
 
Évidemment chaque grosse entreprise a son propre de système interne. Dans le monde associatif chacun essaie de mettre en place son propre outil technique à tel ou tel autre endroit. Le rêve serait d’arriver à faire quelque chose comme le CERN pour la recherche nucléaire ou les grands réseaux de télescopes spatiaux pour explorer les galaxies. Eh bien nous on a besoin d’une infrastructure pour explorer la galaxie du logiciel. Aujourd’hui ça n’existe pas.<br/>
 
Donc c’était vraiment ces trois constats ; pas de catalogue, pas d’archive, pas d’infrastructure de recherche, la situation n’était pas idéale, donc il fallait essayer de faire quelque chose. Donc en mettant en place le projet Software Heritage on essaye, très humblement parce qu’on n’est pas Google, on n’a pas de dizaines de milliards comme certains de mes copains qui travaillent ailleurs, mais on essaye très humblement de construire une réponse à ces trois besoins et de le faire en essayant de mettre de son côté tous les atouts pour minimiser les risques que le projet échoue, c’est-à-dire pour maximiser les chances de succès.
 
 
 
<b>Frédéric Couchet : </b>Tu dis « on ». Le projet a été annoncé par l’Inria et, comme je l’ai dit tout à l’heure, tu es détaché à l’Inria depuis quelques années.
 
 
 
<b>Roberto Di Cosmo : </b>Tout à fait.
 
 
 
<b>Frédéric Couchet : </b>Qui est ce « on » ? C’est-à-dire qui a lancé ce projet en dehors de l’Inria s’il y en a d’autres ? Qui sont les partenaires ? Comment est financé ce projet ? Tu as parlé d’une équipe. Je suppose que tu as une équipe, je ne sais pas, de 500 personnes pour travailler avec toi.
 
 
 
<b>Roberto Di Cosmo : </b>J’aimerais bien ! Dans le monde de l’informatique, comme tu le sais bien, très souvent la révolution est faite par un tout petit nombre, on grandit plus tard.
 
 
 
<b>Frédéric Couchet : </b>C’est quoi l’équipe Software Heritage ? Essayer de nous expliquer qui est ce « on ».
 
 
 
<b>Roberto Di Cosmo : </b>Je vais vous expliquer. Tu as mentionné l’IRILL. Effectivement dans cette structure qu’on avait mise en place en 2010 pour essayer de tisser des liens entre des communautés de développeurs, des entreprises, des chercheurs qui s’intéressent au problème nouveau, scientifique, qui vient quand on fait du développement de logiciel libre, dans l’été 2014, autour de la machine à café, tu sais qu’on dit souvent que les développeurs sont des machines qui convertissent du café en code, mais des fois on le convertit en idées plutôt qu’en code directement.
 
 
 
<b>Frédéric Couchet : </b>Ou des pizzas en code, des fois.
 
 
 
<b>Roberto Di Cosmo : </b>Ou des pizzas ou des boissons socialisantes quelconques, il n’est pas nécessaire de prendre de la caféine tout le temps. Là on discutait de plein de choses. À partir d’autres idées, d’autres projets de recherche qu’on avait en tête, on s’est aperçu qu’il y avait ce problème et on a passé plusieurs mois à discuter à plusieurs. C’était moi à l’origine, il y avait Guillaume Rousseau, il y avait Stefano Zacchiroli, il y avait d’autres personnes qui se sont greffées dessus petit à petit et on a identifié le problème, on a écrit des notes d’opportunité, on pourrait dire, qui faisaient un bilan de la situation. Parce que même si le problème existe ça ne veut pas dire que nous sommes capables de le résoudre, n’est-ce pas ! La question est de se dire : le problème est là, est-ce que vraiment on a les reins solides pour essayer d’aller dans cette direction-là et comment on peut faire, qu’est-ce qui existe. Sur la base de ces notes-là, on a pensé qu’il y avait une opportunité de faire quelque chose de bien avec un peu de ressources initiales.<br/>
 
Avec ça j’étais allé voir le directeur de l’Inria à l’époque qui était Antoine Petit, et là il faut dire effectivement que ça fait partie de la chance, des fois, il a été convaincu de l’opportunité de cette mission, donc il a pris la décision de donner cette impulsion initiale.<br/>
 
Tu vois quand on dit « on », il y a des gens qui ont des idées, mais des idées sans les ressources pour les implanter il y a plein dans les tiroirs !
 
 
 
<b>Frédéric Couchet : </b>Le soutien du directeur a été un grand atout évidemment.
 
 
 
<b>Roberto Di Cosmo : </b>Un grand atout mais aussi toute l’institution. L’Inria est une institution qui à l’origine avait été capable, il y a 22 ans, de soutenir le W3C, le World Wide Web Consortium qui est le consortium mondial qui maintient les standards du Web et qui a permis au Web de devenir ce qu’il est devenu maintenant. Donc ils ont déjà montré leur capacité à soutenir un projet sur le long terme et de façon partenariale, pas en disant : c’est à moi, c’est à l’Inria.
 
 
 
<b>Frédéric Couchet : </b>Pas tout seul.
 
 
 
<b>Roberto Di Cosmo : </b>Mais en disant : OK on travaille à plusieurs. Ça c’était un peu le début. Là on a commencé à avoir un peu de ressources pour travailler. Quand je dis un peu de ressources c’était juste un ingénieur, Antoine Dumont qu’on avait recruté comme premier ingénieur. Après il y a Nicolas Dandrimont, qui était dans l’émission la semaine passée, qui nous a rejoints quelques mois après et là on a commencé un petit peu à construire. Mais la mission, dès le départ, était de ne pas être tout seuls, de ne pas être juste Inria. Il fallait avoir d’autres partenaires autour. Donc là c’était un travail énorme, si tu regardes l’historique on n’est pas encore public, on est en train de parler 2015, avant l’annonce en 2016 et là on essaye de contacter plein d’entités : la Free Software Foundation, on a contacté l’Open Source Initiative, on a contacté Creative Commons, on a contacté des sociétés savantes, françaises, européennes, internationales, on a contacté des fondations comme la fondation Linux, la fondation Eclipse, plein d’autres instituts comme ça pour leur dire ce qu’on allait faire, pour savoir si elles allaient nous soutenir
 
 
 
<b>Frédéric Couchet : </b>Si elles voulaient soutenir.
 
 
 
<b>Roberto Di Cosmo : </b>Là on a obtenu un soutien qui était important mais qui était un soutien moral, pas financier, il faut quand même payer le développeur à la fin du mois, ça ne suffit pas d’être un soutien moral, mais c’est très important.
 
 
 
<b>Frédéric Couchet : </b>En tout cas ces structures qui sont des structures importantes dans le monde du logiciel libre ont considéré que ce projet était fondamental, donc qu’il fallait le soutenir au moins moralement, déjà.
 
 
 
<b>Roberto Di Cosmo : </b>Exactement. Donc là si tu vas sur le site de Software Heritage aujourd’hui, www.softwareheritage.org, tu vas regarder dans la partie soutiens, il y a des témoignages. Il y a une cinquantaine de lettres officielles de tout un tas d’entités diverses et variées qui disent pourquoi ils considèrent que le sujet est important et pourquoi le projet est structurant pour elles.<br/>
 
Là on avait déjà commencé à avoir des premiers contacts avec l’Unesco, parce que c’est quand même une mission universelle, c’était bien de travailler avec eux. Mais ça ne suffisait pas, il fallait chercher des partenaires qui partagent la charge financière d’un tel projet avec Inria, dont la vocation est de lancer le projet mais pas, quand même, de le maintenir pendant 50 ans en payant tout, tout seul. Ce n’est pas, comment dire, ce n’est pas soutenable et ce n’est pas souhaitable non plus si tu veux minimiser les risques d’échec.
 
 
 
<b>Frédéric Couchet : </b>Pour la pérennité du projet il faut qu’il y ait plusieurs acteurs, plusieurs partenaires.
 
 
 
<b>Roberto Di Cosmo : </b>Il faut plusieurs partenaires autour de la table. Et c’est là que ça devient paradoxal, parce qu’on avait contacté, je ne vais pas donner les noms, mais un certain nombre d’acteurs, même des grandes entreprises qui utilisent massivement du logiciel libre, même des grands acteurs industriels du logiciel libre, mais, grande surprise, au mois de juin au moment où il fallait devenir public, personne de ceux-là n’avait répondu présent. Peut-être qu’ils considèrent que développer du logiciel libre ça suffit, ce n’est pas la peine de s’occuper de le maintenir sur le long terme. Et, à ma grande surprise, c’était par contre Microsoft qui avait répondu présent.
 
 
 
<b>Frédéric Couchet : </b>Donc tu vas renouer des liens avec Microsoft à cette époque-là !
 
 
 
<b>Roberto Di Cosmo : </b>Et ça c’était drôle, parce que je n’aurais jamais dit il y a 20 ans que je me serais retrouvé à Redmond, à Seattle au siège de Microsoft avec tout le top management de Microsoft pour leur dire pourquoi c’était intéressant de soutenir un tel projet. Mais c’était quand même une expérience intéressante parce que là j’ai découvert un Microsoft qui n’est pas tout à fait le même que celui que j’avais connu il y a 20 ans. Il y a eu un changement complet de direction et j’ai découvert qu’il y a, je ne sais pas si je peux dire ça, mais je pense que ça va être facile avec toi.
 
 
 
<b>Frédéric Couchet : </b>Nous sommes en direct, je te préviens !
 
 
 
<b>Roberto Di Cosmo : </b>Je ne vais pas le dire, il y avait un nombre très conséquent d’ingénieurs à Microsoft, déjà en 2015, qui travaillaient en faisant seulement du logiciel libre. Après c’est devenu public. Dans l’été 2016, Microsoft a été l’un des premiers contributeurs à des projets logiciel libre sous GitHub à la grande surprise de tout le monde, c’est devant tout le monde ! Qu’est-ce qui se passe ? Tout le monde a le droit de changer d’idée, n’est-ce pas, de temps à l’autre !
 
 
 
<b>Frédéric Couchet : </b>Au moins partiellement on va dire !
 
 
 
<b>Roberto Di Cosmo : </b>Je vais y venir. Au moins sur la partie technique, le développement technique, stratégie industrielle à long terme, ils ont vraiment complètement changé d’attitude maintenant. Après il reste tout un tas d’autres choses sur lesquelles on peut débattre longuement. Restons sur la partie positive. On a retrouvé un point d’intérêt commun, donc ils ont été les premiers acteurs industriels à répondre présents.<br/>
 
Par contre le deuxième acteur qu’on avait mentionné, l’Archive nationale de l’Académie des sciences hollandaise, c’est une institution publique donc c’était tout à fait naturel de la retrouver à nos côtés parce que leur mission c’est d’archiver les données de la recherche en Hollande ; ils ont énormément de demandes de la part de chercheurs qui disent : « Bon, très bien, archiver des données c’est très bien, mais qu’est-ce que je fais avec mes logiciels ? Où est-ce que je mets mes codes sources ? » Ils avaient des demandes comme ça, ils ne savaient pas exactement comment les traiter. Quand ils ont découvert ce qu’on faisait dans Software Heritage, ils ont sauté immédiatement sur l’occasion en disant : il faut qu’on travaille ensemble. Maintenant on travaille ensemble dans un projet européen ensemble, par exemple. C’est naturel de trouver ces deux-là, mais ça ne suffisait pas, il fallait élargir. Si vous regardez sur le site aujourd’hui il y a un certain nombre de sponsors qui sont arrivés : on a retrouvé Intel aussi qui est devenu sponsor ; on a retrouvé GitHub, évidemment.
 
 
 
<b>Frédéric Couchet : </b>Une archive d’hébergement de code.
 
 
 
<b>Roberto Di Cosmo : </b>GitHub qui est une plateforme de développement de code, donc une archive.
 
 
 
<b>Frédéric Couchet : </b>Et une société aux Pays-bas, si je me souviens bien.
 
 
 
<b>Roberto Di Cosmo : </b>GitHub est à San Francisco.
 
 
 
<b>Frédéric Couchet : </b>San Francisco d’accord.
 
 
 
<b>Roberto Di Cosmo : </b>Et a été racheté par ailleurs, c’est le monde à l’envers ; ça a été racheté par Microsoft cet été pour 7 milliards de dollars, c’est assez intéressant.
 
 
 
<b>Frédéric Couchet : </b>Tu parlais de GitHub, excuse-moi.
 
 
 
<b>Roberto Di Cosmo : </b>GitHub, oui, tout à fait.
 
 
 
<b>Frédéric Couchet : </b>D’accord. Je croyais que c’était GiLab, excuse-moi.
 
 
 
<b>Roberto Di Cosmo : </b>Non, GitHub. GitLab c’est autre chose. On a des contacts avec GitLab aussi, on a archivé aussi GitLab. Donc on a élargi petit à petit disons l’ensemble des partenaires, des sponsors qui sont tous des mécènes. C’est-à-dire ce qu’ils font ce sont des donations, il n’y a pas de contreparties. Ils ont vraiment des financements qui servent à faire grandir le projet parce qu’ils trouvent que c’est une infrastructure…
 
 
 
<b>Frédéric Couchet : </b>Donc c’est de la contribution financière ou est-ce que c’est aussi de la contribution humaine avec la mise à disposition de personnel ?
 
 
 
<b>Roberto Di Cosmo : </b>Pour l’instant c’est essentiellemnt de la contribution financière, il n’y a pas de mise à disposition de personnel.
 
 
 
<b>Frédéric Couchet : </b>D’accord.
 
 
 
<b>Roberto Di Cosmo : </b>Mise à disposition de personnel c’est compliqué.
 
 
 
<b>Frédéric Couchet : </b>Oui, mais ça aurait pu être.
 
 
 
<b>Roberto Di Cosmo : </b>Ça aurait pu être, mais ça commence à arriver : on commence à voir des contributions qui viennent de certaines entreprises, mais pas vraiment de personnel qui est mis chez nous.
 
 
 
<b>Frédéric Couchet : </b>Donc ça permet de financer une équipe de combien de personnes aujourd’hui, pour Software Heritage ?
 
 
 
<b>Roberto Di Cosmo : </b>Aujourd’hui si tu regardes sur le site de Software Heritage tu trouveras, je ne veux pas dire de bêtises, mais je pense que tu vas trouver probablement 14 ou 15 photos.
 
 
 
<b>Frédéric Couchet : </b>D’accord.
 
 
 
<b>Roberto Di Cosmo : </b>Peut-être un peu plus parce que sur le site web on a mis aussi le conseil scientifique. Donc ça fait quand même une dizaine de personnes à temps plein qui travaillent sur le projet. On a un peu grandi depuis l’époque où on était deux-trois.
 
 
 
<b>Frédéric Couchet : </b>La machine à café s’est un peu agrandie.
 
 
 
<b>Roberto Di Cosmo : </b>La machine à café est toujours là, elle s’est un peu agrandie, et on est accueilli dans de très bonnes conditions chez Inria pour pouvoir travailler sur le projet
 
 
 
<b>Frédéric Couchet : </b>Donc l’équipe est physiquement, toutes les personnes sont ici à Paris ?
 
 
 
<b>Roberto Di Cosmo : </b>Physiquement ici à Paris, dans les locaux d’Inria, pour l’instant accueillis là, ce n’est pas forcément la position définitive. Ce qu’il faut quand même remarquer c’est que les dix à temps plein qui sont là maintenant – c’est seulement maintenant qu’on est arrivés à dix, on s’est agrandis petit à petit – on fait quand même un travail qui est énorme. On peut le voir comme beaucoup, mais en réalité on est tout petits par rapport à la mission monstre qu’on s’est donnée. Effectivement il y a tout un tas de questions à se poser : quelle garantie d’arriver à long terme, quelle stratégie mettre en place pour pouvoir travailler sur tout ça ? Je dois dire quand même que la première étape est d’avoir toutes les personnes qui sont dans l’équipe qui sont extrêmement motivées pour travailler là-dedans. Nicolas qui était là la semaine passée est un ancien acteur du monde du logiciel libre, Stefano Zacchiroli était leader du projet Debian.
 
 
 
<b>Frédéric Couchet : </b>Leader du projet Debian.
 
 
 
<b>Roberto Di Cosmo : </b>Pendant trois ans, c’est un chercheur magnifique. Il y a d’autres personnes qui sont motivées. Des fois il n’y a pas que l’argent qui fonctionne.
 
 
 
<b>Frédéric Couchet : </b>Tout à fait.
 
 
 
<b>Roberto Di Cosmo : </b>Des fois il y a une vraie motivation et c’est ça qui aide beaucoup.
 
 
 
<b>Frédéric Couchet : </b>C’est une bonne conclusion pour cette première partie d’émission. On va faire une pause amicale. Nous allons écouter <em>Mountains</em> par Cud Eastbound et on revient juste après ça.
 
 
 
Pause musicale : <em>Mountains</em> par Cud Eastbound.
 
 
 
==43’ 07==
 
 
 
<b>Frédéric Couchet : </b>Vous êtes de retour sur Cause Commune, 93.1 en Île-de-France et partout dans le monde sur causecommune.fm. Vous écoutez l’émission <em>Libre à vous !</em>, l’émission pour comprendre et agir avec l’April l’association de promotion et de défense du logiciel libre. Nous venons d’écouter <em>Mountains</em> par Cud Eastbound qui est disponible en licence Creative Commons Partage à l’identique. J’en profite pour rappeler que toutes les musiques que nous diffusons sont librement partageables y compris pour des usages commerciaux. Vous retrouvez la référence sur le site de l’April donc april.org.<br/>
 
Je suis toujours en compagnie de Roberto Di Cosmo, professeur d’informatique et directeur de l’initiative Software Heritage. Nous allons poursuivre la discussion. Nous avons parlé, avant la pause musicale, un petit peu d’où venait le projet, les raisons pour lancer ce projet, où ce projet en est, où cette initiative en est aujourd’hui avec une équipe certes réduite, mais de gens très motivés et de libristes de longue date, on a cité plusieurs noms. Maintenant on va parler un petit peu du fonctionnement de Software Heritage du point de vue technique et puis du futur.<br/>
 
Peut-être première question, Roberto, Software Heritage est une archive, tout à l’heure tu disais que le but c’était de garantir la pérennité de ces codes sources, patrimoine culturel, économique, industriel et scientifique. Cette archive est hébergée sur les internets, comme on dit, quelque part. Est-ce qu’elle est sur plusieurs sites ? Comment techniquement ça fonctionne ?
 
 
 
<b>Roberto Di Cosmo : </b>Effectivement c’est une très bonne question. Quand on réfléchit à un projet comme Software Heritage on se place dans une logique de long terme. La question de comment maintenir l’information à long terme est cruciale. Il y avait seulement deux choix qu’on pouvait faire au début. Un premier choix aurait été de dire : on construit un super <em>datacenter</em>, un centre de données ultra sécurisé, complètement
 
 
 
<b>Frédéric Couchet : </b>Une solution à la française quoi !
 
 
 
<b>Roberto Di Cosmo : </b>Pas à la française. On prend les meilleurs ingénieurs du monde, on cache tout et on dit à tout le monde : « C’est secret il n’y a rien à voir, on est les meilleurs du monde, on ne sera jamais piratés, on ne perdra jamais de données, on ne fera jamais d’erreurs, etc. » À nouveau, comme j’ai un peu de poils blancs dans la barbe, je sais très bien que ce type d’approche marche peu. Donc j’ai dit : je ne suis pas capable de le faire fonctionner comme ça. Donc on a préféré prendre une stratégie différente qui est de dire : on sait qu’il y aura des erreurs, on sait qu’il y aura des pertes de données, on sait qu’il y aura des problèmes. On peut avoir un centre de données qui brûle, il peut y avoir un tremblement de terre, il peut y avoir un pirate qui rentre dedans qui détruit des données, on peut avoir des problèmes, c’est inévitable, ça fait partie de la vie donc il faut structurer le projet de telle façon qu’il résiste à ce type d’erreurs, qui soit résilient sur le long terme. Qu’est-ce que ça veut dire ?<br/>
 
La base de notre stratégie est un, de faire en sorte que toute l’infrastructure qu’on construit, nous, soit entièrement faite en logiciels libres pour rendre plus facile à d’autres de la répliquer ailleurs ; deux, d’avoir un réseau de miroirs au niveau planétaire dans lequel l’ensemble des données que nous collectons est réparti et distribué. Et là on utilise en particulier une terminologie qui est un peu particulière dans notre projet, on ne l’a pas formalisée, mais on peut la partager dès aujourd’hui, on utilise le terme copie pour une copie entière de toutes les données qui sont dans l’archive mais qui sont sous notre responsabilité.<br/>
 
Donc par exemple aujourd’hui, Software Heritage dispose de trois copies de l’archive. Deux qui sont dans les locaux de l’Inria, chez nous, et une qui est sur une plateforme Azur qui est sponsorisée par Microsoft.
 
 
 
<b>Frédéric Couchet : </b>Donc ce sont les mêmes données.
 
 
 
<b>Roberto Di Cosmo : </b>Ce sont les mêmes données.
 
 
 
<b>Frédéric Couchet : </b>Qui sont sur trois infrastructures physiques différentes.
 
 
 
<b>Roberto Di Cosmo : </b>Sur trois infrastructures différentes, mais les infrastructures, toutes les trois, sont sous notre contrôle, le contrôle de l’organisation Software Heritage aujourd’hui. Le fait que ça soit à trois endroits physiquement différents et pas forcément la même technologie, si tu vas sur Azur, même si c’est une base Debian, en réalité la techno qui est derrière la machine, etc. ; c’est un autre endroit que chez nous, c’est un peu rassurant. Mais imagine qu’on devienne tous fous, les dix de l’équipe on décide de tout détruire et de tout brûler, mort s’ensuit avec tous les ???? comme on dit, on pourrait le faire. Donc il faut quand même se protéger de ce dommage-là. Donc là on a besoin de ce qu’on appelle des miroirs. Qu’est-ce que c’est un miroir ? Un miroir, pour nous, c’est une copie mais qui est sous le contrôle administratif et technique de quelqu’un d’autre. Sous une entité qui n’est pas Software Heritage, mais avec qui, évidemment, on a passé des accords pour les questions d’éthique, juridiques, etc., mais qui n’est pas nous.<br/>
 
Donc là c’était dans notre plan de puis le départ et en décembre passé, il y a quelques semaines, on a annoncé qu’on a signé le premier accord pour la création d’un miroir. Donc ça sera en Suède, ça sera porté par une société qui s’appelle FOSSID. Ce n’est pas encore fait, la partie technique est à développer, mais au moins l’accord est là, et on met la première pierre de ce réseau de miroirs qui va nous protéger de la perte de données.<br/>
 
C’est très intéressant d’en parler aujourd’hui. Tu as mentionné la réforme du droit d’auteur ; il y a plusieurs dangers qui guettent un projet comme le nôtre. Il y a des dangers techniques, par exemple tu as cassé un disque, tu as perdu des choses, tu t’es trompé dans le logiciel qui a corrompu toutes les données, ce sont des choses qui peuvent arriver, mais il y a des risques d’une certaine façon plus subtiles, plus néfastes qui sont des risques juridiques. Il se peut qu’un miroir, une copie de l’archive, se trouve dans un pays ou dans une zone géographique dans lesquels, à un moment donné, sont passés des textes de lois qui rendent difficile voire impossible, voire illégal, de faire ce travail d’archivage. Et c’est effectivement ce qui est en train d’arriver avec cette fameuse réforme du droit d’auteur, un article 13 qui oblige toutes les plateformes qui partagent du contenu couvert par le droit d’auteur de mettre en place des filtres avec des autorisations, il y a un droit qui est très contraint, on ne va pas rentrer dans ça, ce n’est pas le sujet aujourd’hui.
 
 
 
<b>Frédéric Couchet : </b>Je précise qu’on en parlera la semaine prochaine avec Anne-Catherine Lorrain qui travaille pour le groupe des Verts au Parlement européen parce que cette semaine il y a une négociation interministérielle au niveau européen qui se déroule donc en saura plus à la fin de la semaine et la semaine prochaine on fera un point là-dessus.
 
 
 
<b>Roberto Di Cosmo : </b>Absolument. Donc effectivement ce débat-là nous a pris nous, côté Software Heritage, pas mal de temps parce qu’on le voyait qu’on le voyait comme un danger : pour le travail qu’on est en train de faire c’est un vrai danger. Donc le fait d’avoir des miroirs dans d’autres juridictions ça protège aussi de ces risques juridiques ; il n’y a pas seulement les risques techniques. Cela dit, ça c’est l’objectif, il faut y arriver. Ça prend un peu de temps d’y arriver, je vous signale.
 
 
 
<b>Frédéric Couchet : </b>Ça c’est l’objectif. Donc le principe technique, on va le répéter pour que les personnes comprennent bien : il y a trois archives sous le contrôle du projet Software Heritage : deux sont sur l’infrastructure Inria, une, une infrastructure Azur Microsoft et, en plus de cela, il y a un principe de miroirs sur lequel Software Heritage n’a pas d’accès on va dire direct de contrôle.
 
 
 
<b>Roberto Di Cosmo : </b>En écriture.
 
 
 
<b>Frédéric Couchet : </b>Par un contrat et le premier projet de miroir c’est FOSSID. FOSSID ça veut dire <em>free open source software</em> ?
 
 
 
<b>Roberto Di Cosmo : </b>Non, ça ne veut rien dire. C’est une entreprise qui est en Suède qui fait de l’analyse de code pour des questions de licences.
 
 
 
<b>Frédéric Couchet : </b>D’accord. Donc ils sont intéressés. Donc on voit l’intérêt du projet : ce sont des gens qui sont intéressés aussi par rapport à l’analyse de code qui est un point très important. On pourrait imaginer que des universités soient intéressées pour les étudiants, pour mettre à disposition. Parce qu’on sait très bien, on a appris l’informatique tous les deux – toi peut-être un petit peu avant moi comme tu le dis assez avec ta barbe un peu blanche – que souvent la meilleure façon d’apprendre eh bien c’est de regarder ce qui a été fait par d’autres personnes. Donc des universités pourraient être intéressées par cette masse de codes disponibles.<br/>
 
D’ailleurs j’ai une question avant de poursuivre sur la partie archive miroir, est-ce que ce ne sont que des logiciels libres ? Est-de que ce ne sont que des codes sources de logiciels libres qui sont hébergés dans le projet ou est-ce que ça peut être des codes sources d’autres logiciels ?
 
 
 
<b>Roberto Di Cosmo : </b>C’est une très bonne question. Je vais même généraliser la question. La question est de savoir comment on décide de ce qui mérite d’être archivé dans l’archive de Software Heritage. Effectivement la position qu’on a prise dans Software Heritage c’est quelque chose qui fait un peu dresser un peu les cheveux sur la tête quand j’en parle avec des gens qui sont habitués à de l’archivage traditionnel, que ça soit dans des bibliothèques ou ailleurs. Nous on a pris une position très particulière : on essaye d’archiver tous les codes sources qui sont publiquement disponibles, c’est-à-dire auxquels on peut avoir accès, donc on ne filtre pas spécialement sur le fait qu’ils soient des beaux logiciels ou des logiciels pas très beaux, ou que la licence permette explicitement la redistribution donc qui soient vraiment des logiciels libres, ou que ça soit juste des codes qui ont été mis à disposition dont la licence n’est pas super claire, etc.
 
 
 
<b>Frédéric Couchet : </b>Mais elle permet au moins de faire la copie du code.
 
 
 
<b>Roberto Di Cosmo : </b>Au moins de faire la copie. L’idéal ça serait à terme d’arriver à avoir vraiment tous les logiciels, même les anciens, parce si tu veux les logiciels qui sont propriétaires aujourd’hui, tant qu’on ne change pas encore une fois le droit d’auteur.
 
 
 
<b>Frédéric Couchet : </b>On n’étend pas le droit d’auteur.
 
 
 
<b>Roberto Di Cosmo : </b>Au-delà de ce qui est raisonnable.
 
 
 
<b>Frédéric Couchet : </b>Au-delà de ce qui est raisonnable, ce qui est déjà le cas, nous sommes d’accord.
 
 
 
<b>Roberto Di Cosmo : </b>Normalement au bout de 70 ans ils deviennent du domaine public.
 
 
 
<b>Frédéric Couchet : </b>Après la mort de l’auteur.
 
 
 
<b>Roberto Di Cosmo : </b>Oui. En réalité pour les logiciels industriels c’est à partir de leur mise sur le commerce.
 
 
 
<b>Frédéric Couchet : </b>Ah pour les logiciels industriels, d’accord.
 
 
 
<b>Roberto Di Cosmo : </b>Oui, les logiciels industriels. Et effectivement après la mort de l’auteur c’est un peu compliqué, mais l’idée ça serait mieux de les avoir, question de pouvoir les mettre à disposition plus tard. Là j’aurais plein d’anecdotes à raconter, mais je ne vais pas les raconter maintenant.
 
 
 
<b>Frédéric Couchet : </b>Oui, parce que sinon, n’aura pas le temps dans l’émission. Ce sera pour une deuxième émission. Donc c’est tout le code, en fait, qui est disponible sur Internet.
 
 
 
<b>Roberto Di Cosmo : </b>Voilà. On essaye de le collecter et maintenant on a ouvert plein de pistes c’est-à-dire techniquement je vais donner quelques éléments techniques supplémentaires. Pour les grandes plateformes de développement comme GitHub qui est très populaire aujourd’hui ou GitLab ou même la forge Inria ou même Framagit qui est la forge mise à disposition par Framasoft ici en France, ce qu’on fait on met en place un mécanisme de moissonnage automatique. C’est-à-dire qu’on va collecter tous les logiciels qui sont disponibles là-dessus et on les intègre automatiquement. Par contre on a aussi rajouté des pistes pour pouvoir, de façon explicite, déposer des logiciels, par exemple des logiciels développés dans la cadre de la recherche académique, pouvoir les déposer. Là on a fait un partenariat avec un portail national qui s’appelle HAL
 
 
 
<b>Frédéric Couchet : </b>HAL, H, A, L ?
 
 
 
<b>Roberto Di Cosmo : </b>H, A, L, c’est une sorte de portail <em>open access</em> pour l’accès ouvert aux publications et maintenant il y a un mécanisme pour déposer aussi du code scientifique dedans. Plus récemment on a ouvert un mécanisme qu’on appelle, tu me passeras l’anglais, <em>save code now</em>.
 
 
 
<b>Frédéric Couchet : </b>Sauvegardez votre code maintenant.
 
 
 
<b>Roberto Di Cosmo : </b>Maintenant c’est possible de nous indiquer qu’il y a certains endroits dans lesquels il y a du code important et, en nous indiquant cette piste-là, après nous on le rajoute aux moissonneurs.
 
 
 
<b>Frédéric Couchet : </b>Oui, parce qu’en fait évidemment Software Heritage ne peut pas avoir connaissance de tout le code qui existe sur Internet, ça paraît compliqué. J’ai une question sur les plateformes d’hébergement de logiciels que tu as citées, est-ce que ces plateformes donnent un accès complet, exhaustif, à l’ensemble des codes qui sont hébergés ? Est-ce que Software Heritage a une certitude, en fait, de pouvoir récupérer tout le code que ces plateformes hébergent, d’un point technique ?
 
 
 
<b>Roberto Di Cosmo : </b>D’un point de vue technique la réponse est oui. Disons que techniquement c’est compliqué, on ne va pas rentrer dans les détails, mais oui on peut y arriver. Par exemple tout ce qui est disponible publiquement sur GitLab ou sur GitHub, etc., techniquement on pourrait être capables d’obtenir absolument tout et d’être à jour même très rapidement. Après il ne faut pas oublier qu’on est une petite équipe, qu’on a commencé avec des ressources relativement limitées ; si on avait des milliards on ferait beaucoup plus. On n’a pas des milliards !
 
 
 
<b>Frédéric Couchet : </b>Ma question n’est pas forcément sur l’équipe.
 
 
 
<b>Roberto Di Cosmo : </b>Est-ce qu’il y a un filtre qui nous a empêche de l’obtenir ?
 
 
 
<b>Frédéric Couchet : </b>Est-ce que la plateforme d’hébergement propose déjà une liste exhaustive de ces projets en disant là c’est facile de récupérer ?
 
 
 
<b>Roberto Di Cosmo : </b>Les plateformes plus récentes comme GitLab ou GitHub effectivement fournissent une interface accessible pour les machines, ce qu’on appelle des API, c’est-à-dire une interface de programmation qui permette de lister des contenus. Donc on a moins accès à la liste des contenus qui sont disponibles et après, si on peut suivre les évènements, on peut télécharger les choses de façon plutôt raisonnable. Les anciennes plateformes comme SourceForge qui existait déjà il y a 20 ans et qui sont un peu…
 
 
 
<b>Frédéric Couchet : </b>Sur le déclin !
 
 
 
<b>Roberto Di Cosmo : </b>Pas sur le déclin, il y encore des logiciels très importants qui sont dedans.
 
 
 
<b>Frédéric Couchet : </b>Oui, il y en a plein !
 
 
<b>Roberto Di Cosmo : </b>Par contre ils n’ont même pas ça, ils n’ont même pas une interface qui permet de lister le contenu. Donc là c’est assez compliqué, il faut aller travailler avec eux pour obtenir les choses, on ne l’a pas encore fait, ça fait partie de la <em>roadmap</em>et c’est beaucoup d’effort pour pas grand-chose comme résultat.
 
 
 
<b>Frédéric Couchet : </b>Ça pourrait être un effort de SourceForge, des personnes qui maintiennent SourceForge de proposer ça.
 
 
 
<b>Roberto Di Cosmo : </b>De proposer cette interface.
 
 
 
<b>Frédéric Couchet : </b>Peut-être que quand ils ont créé ce genre de plateforme ils ne sont pas mis en tête : tiens il y a un Roberto Di Cosmo qui arrivera un jour pour pouvoir archiver tout ce qu’il y a dessus, donc ils n’ont pas proposé cette simple information sur l’ensemble des projets qui sont disponibles sur la plateforme. Donc c’est à ces structures-là de faire ce travail.
 
 
 
<b>Roberto Di Cosmo : </b>Là, au passage, j’en profite pour dire merci à l’ADULLACT, on a travaillé avec elle.
 
 
 
<b>Frédéric Couchet : </b>L’association des développeurs et utilisateurs de logiciels libres dans l’administration et les collectivités territoriales françaises.
 
 
 
<b>Roberto Di Cosmo : </b>Très bien. Je vois que tu te rappelles l’acronyme, c’est super et qui a aidé à développer une sorte de plugin, un greffon qui a été rajouté sur la technologie des forges qui s’appelle FusionForge qui est une évolution de SourceForge et qui fait en sorte que maintenant il est possible de moissonner les contenus qui sont une instance de FusionForge en particulier celle de l’ADULLACT qui a mis en place ça. Tu vois ça fait partie de ce travail collaboratif dans lequel je vais essayer juste d’arriver à dire ça clairement : la mission qu’on s’est donnée est quand même énorme, herculéenne et on n’y arrivera jamais si on le fait tout seuls. Donc toute la stratégie du projet est de rendre facile et possible à tout le monde de participer.
 
 
 
<b>Frédéric Couchet : </b>Tu parles de l’ADULLACT. Le 8 janvier on recevait Laurent Joubert et Mathilde Bras de la DINSIC, la Direction interministérielle du numérique et de la société de l’information et de la communication, j’ai un petit doute sur l’acronyme [Direction interministérielle du numérique et du système d’information et de communication], en tout cas la direction informatique de l’État et Laurent Joubert avait annoncé qu’il y avait un partenariat qui se créait entre la DINSIC et Software Heritage pour que Software Heritage archive les codes sources publiés par l’administration.
 
 
 
==57’ 15==
 
 
 
<b>Roberto Di Cosmo : </b>Absolument.
 

Dernière version du 22 février 2019 à 15:33


Publié ici - Février 2019