Émission Libre à vous ! du 14 mars 2023

De April MediaWiki
Aller à la navigationAller à la recherche


Titre : Émission Libre à vous ! du 14 mars 2023

Intervenant·e·s : - à la régie

Lieu : Radio Cause Commune

Date : 14 mars 2023

Durée : 1 h 30 min

Podcast PROVISOIRE

Page des références de l'émission

Licence de la transcription : Verbatim

Illustration : Déjà prévue

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Transcription

Voix off : Libre à vous ! l’émission pour comprendre et agir avec l’April, l’association de promotion et de défense du logiciel libre.

Frédéric Couchet : Bonjour à toutes, bonjour à tous dans Libre à vous ! C’est le moment que vous avez choisi pour vous offrir une heure trente d’information et d’échanges sur les libertés informatiques et également de la musique libre. Le système de gestion de bases de données PostgreSQL sera le sujet principal de l’émission du jour. Avec également au programme, en début d’émission, la chronique d’Antanak sur « logiciel libre et décroissance », et également la chronique de Vincent Calame en fin d’émission, sur le low-tech magazine.

Soyez les bienvenus pour cette nouvelle édition de Libre à vous ! l’émission qui vous raconte les libertés informatiques, proposée par l’April, l’Association de promotion et de défense du logiciel libre. Je suis Frédéric Couchet, le délégué général de l’April. Le site web de l’émission, c’est libreavous.org. Vous pouvez trouver une page consacrée à l’émission du jour, avec tous les liens et références utiles et également les moyens de nous contacter. N’hésitez pas à nous faire des retours ou nous poser toutes questions.

Nous sommes mardi 14 mars 2023. Nous diffusons en direct, mais vous écoutez peut-être une rediffusion ou un podcast. À la réalisation de l’émission du jour, Thierry Holleville. Bonjour Thierry.

Thierry Holleville : Bonjour à tous.

Frédéric Couchet : Nous vous souhaitons une excellente écoute.

[Jingle]

Chronique « Que libérer d’autre que du logiciel » avec Antanak sur le logiciel libre et la décroissance

Frédéric Couchet : « Que libérer d’autre que du logiciel », la chronique d’Antanak. Isabelle Carrère et d’autres personnes actives de l’association Antanak se proposent de partager des situations très concrètes et/ou des pensées et mises en actes et en pratique au sein du collectif : le reconditionnement, la baisse des déchets, l’entraide sur les logiciels libres, l’appropriation du numérique par tous et toutes. Le thème du jour : logiciel libre et décroissance, avec une invitée, Nathalie. Je vous passe la parole.

Isabelle Carrère : Oui, merci, Fred. Bonjour à tout le monde. Oui, je suis vraiment contente qu’aujourd’hui une autre personne d’Antanak soit non seulement avec moi, mais plutôt même va prendre toute la place. Et moi, je vais me taire pour une fois pendant cette chronique puisque, Nathalie : je ne sais pas quand tu es arrivée à Antanak ?

Nathalie : 2017 ? 2016.

Isabelle Carrère : 2016. Oui, voilà donc, on avait juste un an. Donc voilà, c’est génial, écoute, super, bienvenue à toi et je te laisse la parole.

Nathalie : Merci et bonjour à tout le monde. Donc, je vais vous lire un petit texte : Libriste et décroissance. Le libre est-il décroissant ? C’est grâce à la fin de Windows XP que je me suis lancée à la découverte du monde du libre en 2014. Abandonner la logique de domination de Microsoft ou l’univers fermé d’Apple me convenait politiquement. À ce moment-là, j’étais décroissante, sortie du sur-consumérisme et du culte du neuf. Il était donc hors de question pour moi de devoir changer de PC pour pouvoir répondre aux exigences techniques et commerciales de Microsoft. J’allais désormais utiliser des outils élaborés en toute transparence par des communautés de développeuses-développeurs, des logiciels et systèmes d’exploitation au code source accessible et obligatoirement assorti de la licence GPL aux quatre libertés : de les utiliser, étudier, modifier et redistribuer, gratuitement ou non.

Tous ces outils, mis à disposition des particuliers sans obligation de payer, m’ont ouvert des horizons de découverte sans fin. Ceci m’a permis de m’émanciper du modèle rigide, onéreux et verrouillé imposé par Microsoft et Apple. Les ressources logicielles ne sont pas, elles, alourdies par des programmes parasites de surveillance et de restrictions d’accès, mais centrées sur l’essentiel : leur fonctionnement. Je pouvais donc faire tourner un système GNU-Linux stable, sans bug et sans virus avec tous ces logiciels légers et efficaces sur mon PC vieillissant, au lieu d’ajouter une machine à la masse déjà considérable de nos déchets informatiques.

En 2016, j’ai rejoint Antanak. Est-ce que je vous présente encore l’association ? L’association libriste qui récupère, valorise, donne des ordinateurs après y avoir installé un système d’exploitation libre. En participant à toutes ces activités, j’ai pu m’approprier des savoirs sur le Libre et l’informatique, puis les transmettre à mon tour.

C’est en configurant le navigateur Mozilla Firefox, autre logiciel libre, sur les ordinateurs à l’association Antanak que j’ai commencé à approfondir mes connaissances sur la surveillance et la collecte de données dont nous faisons l’objet à chaque connexion internet. La communauté Mozilla fournit des logiciels pour lutter contre ces intrusions, mais aussi une documentation abondante sur Internet et le pistage. J’ai beaucoup appris grâce au partage de ressources et de connaissances et aux dispositifs d’entraide mis en place par les communautés de développeuses-développeurs et des usagers et usagères expérimentés. Combien de fois suis-je allé consulter des forums et autres tutoriels ou articles en ligne ? J’ai pu rencontrer des associations libristes à des install-party ou à des événements variés. J’y ai même participé avec Antanak.

Ces valeurs et pratiques essentielles dans le monde du Libre me sont familières. Il y a environ quinze ans, j’ai contribué à l’écriture d’un texte en ligne avec des militantes et des militants écologistes, grâce à un wiki, un logiciel libre très simple et pratique à utiliser permettant le travail collectif à distance.

Le partage de la connaissance et les échanges sont centraux dans le monde écolo-libertaire décroissant, où des personnes et collectifs, soucieux de préserver notre planète, échangent savoirs et réflexions dans des domaines très variés. Ce sont des pratiques essentielles et précieuses dans le mouvement de la décroissance qui ne se contente pas de réfléchir à comment décroître, mais place la coopération, les liens et la convivialité au centre de son projet politique.

Parallèlement à mes passionnantes lectures sur le pistage numérique, je consultais régulièrement la presse informatique. C’est un dossier consacré aux dangers des GAFAM qui m’a donné envie de me documenter davantage. Ces entreprises ont la puissance comparable à celle de pays, possèdent la majorité de nos données et de nombreuses infrastructures et services numériques qui leur permettent de se rendre incontournables, voire autonomes : elles se trouvent donc en position de force pour orienter les législations des États. Ces multinationales promeuvent un modèle de société autoritaire où la vie privée est abolie, la surveillance généralisée et les humains exploités.

Google Alphabet investit massivement dans les NBIC, nanotechnologies, biotechnologies, technologies de l’information, sciences cognitives. Ses dirigeants entendent mener un projet transhumaniste en vue de refaçonner le monde et l’humain. En 2012, ils ont engagé Ray Kurzweil, scientifique et théoricien du mouvement transhumaniste que Google finance. Ce sont ces mêmes multinationales qui ont pillé les logiciels libres pour en tirer de gros bénéfices. Le monde du Libre se situe à l’intérieur d’un Internet majoritairement exploité et géré par les entreprises et institutions d’un système capitaliste de plus en plus agressif, sous la domination des GAFAM. Se trouve même prisonnier, je dirais. Actuellement, l’arrivée de la 5G dédiée aux objets connectés et aux véhicules autonomes représente un vrai butin de données pour ces multinationales.

Cela pourra-t-il durer ? Sachant que si les consommateurs et consommatrices se soucient peu d’éthique ou de logiciels libres, ils sont tout de même sensibles à la sauvegarde de leur vie privée et aux scandales diminuant la confiance dans les GAFAM. Les entreprises, elles, commencent à s’inquiéter du devenir de leurs données. Tout cela se joue sur fond de crise écologique, dans une dynamique de croissance et d’extractivisme, comme si les ressources planétaires étaient illimitées et le réchauffement climatique inexistant.

Cela ne pouvait pas durer.
Cela ne pourra pas durer.
Il faudra décroître.
Il y a des solutions pour cela.
Les logiciels libres en font partie.
Pourtant le monde du Libre n’est pas en soi décroissant, car il est associé au numérique et à son développement. Comme la fondation Linux à la 5G, il est aussi majoritairement présent dans la gestion des serveurs. Il contient malgré tout de précieux ingrédients pour faire décroître le numérique. Si on considère que la décroissance est la trajectoire qui va de notre monde en surproduction à une société écologiquement soutenable, le Libre peut s’inscrire dans ce processus. Par leur conception, les logiciels libres légers et efficaces permettent de réaliser des économies d’énergie conséquentes et de garder un parc informatique durable. L’organisation du monde du Libre en collectif, fondée sur la coopération, le partage des ressources et des savoirs associés, répond totalement à celle souhaitée par les militants de la décroissance. Le contrôle des technologies souhaitée par les décroissants passe par l’appropriation individuelle et collective de connaissances techniques afin de décider ensemble de leur devenir et d’agir.

L’association Framasoft a montré qu’il était possible de « dégoogliser » Internet en mettant des logiciels libres à disposition comme alternatives aux services et applications des GAFAM et de proposer un ensemble de services en ligne décentralisés hébergés par un collectif de petites structures, les CHATONS. Ces expériences montrent que les outils d’un Internet libre, décentralisé, non surveillé et bien moins énergivore que l’actuel, existent déjà. Tout est question de choix politiques collectifs, de ce dont nous avons réellement besoin. Serons-nous un jour dans les conditions politiques de pouvoir échanger, débattre et décider ensemble sereinement ?

Isabelle Carrère : Super. Merci d’avoir réussi à faire tenir tout ça dans quasi 10 minutes. Vraiment, c’est pas mal, à la fois ta propre expérience d’arrivée sur le Libre, ce que tu fais avec nous à Atanak, plus d’autres perspectives politiques intéressantes à débattre. Tout un programme ! Merci Nathalie.

Nathalie : C’était le but : lier le quotidien, l’expérience à des réflexions plus globales.

Frédéric Couchet : Merci, Nathalie, merci Isabelle. Je vais juste préciser que le site des CHATONS avec un s dont tu as parlé, mais ces chatons.org, c’est le Collectif des Hébergeurs Alternatifs Transparents, Ouverts, Neutres et Solidaires sur lequel vous pouvez trouver plein de structures qui offrent des services, type bloc-notes, gestion de rendez-vous, etc. Et deuxième chose, tu as parlé beaucoup des GAFAM, au tout début : ça tombe bien, la semaine prochaine, le sujet principal concernera le rapport de l’Observatoire des multinationales, qui s’appelle GAFAM Nation, sur le lobbying des GAFAM en France.

Les GAFAM, ce sont ces fameuses entreprises de l’Internet qui se gavent de nos données personnelles en échange de services. C’est le sujet principal de l’émission de la semaine prochaine, donc nous sommes raccord.

Nathalie : Je vais suivre, parfait.

Frédéric Couchet : C’était la chronique d’Antanak. Je rappelle que Antanak, c’est antanak.com avec un k et que vous êtes nos voisines et voisins au 18 rue Bernard Dimey. Nous, nous sommes au 22 rue Bernard Dimey. Donc au mois prochain, Isabelle, pour une prochaine chronique.

Isabelle Carrère : Merci.

Frédéric Couchet : Nous allons faire une pause musicale. Après la pause musicale, nous parlerons de PostgreSQL, le système de gestion de bases de données libre. En attendant, nous allons écouter une rappeuse américaine que j’adore, qui s’appelle ???. Son titre c’est 2012. On se retrouve dans 3 minutes 30.

Pause musicale : 2012 par ???

Frédéric Couchet : Nous venons d’écouter 2012 par ???, disponible sous licence libre Creative Commons Attribution, CC BY. Sur le site libreavous.org, vous retrouverez le lien vers la chanson, le titre et vers l’artiste. Cet artiste ne fait plus de musique depuis onze ans : elle s’est un petit peu orientée vers d’autres activités, mais en tout cas, c’est une des premières rappeuses américaines, en tout cas artiste américaine, à avoir utilisé des licences Creative Commons totalement libres pour ses créations, de l’avoir revendiqué, et d’avoir eu en plus un très gros succès. Donc, c’est ???.

Et nous allons passer au sujet suivant.

[Jingle]

Le système de gestion de base de données libre PostgreSQL, avec Lætitia Avrot et Anthony Nowocien

Frédéric Couchet : Nous allons poursuivre par notre sujet principal qui va porter sur le système de gestion de base de données libre Postgres avec Lætitia Avrot et Anthony Nowocien.
N’hésitez pas à participer à notre conversation sur le salon web dédié à l’émission, sur le site causecommune.fm, bouton « chat », salon #libreavous ou directement sur le site libreavous.org. Vous pouvez même nous appeler, je sais que Thierry, en régie, rêve d’avoir un appel téléphonique, le numéro est le 09 72 51 55 46.
Bonjour Lætitia.

Lætitia Avrot : Bonjour.

Frédéric Couchet : Bonjour Anthony.

Anthony Nowocien : Bonjour.

Frédéric Couchet : Avant d’aborder le sujet principal , système de gestion de base de données libre PostgreS, je précise tout de suite que le sujet ne va pas être ultra-technique, je vois, sur le salon web, que quelqu’un dit « ça va être technique aujourd’hui ! » , pas que technique, loin de là. Comme vous savez c’est Libre à vous !, on essaye de contenter les deux publics, le public technique et le grand public qui va découvrir ce qu’est Postgres.
D’abord, première question, vous découvrir, une petite question de présentation personnelle. On va commencer de Lætitia Avrot.

Lætitia Avrot : Je suis Field CTO pour une entreprise américaine qui s’appelle  EDB. Field CTO ne veut pas dire que je travaille dans les champs, dans l’agriculture, dans les champs, field c’est dans le sens « sur le terrain », donc je suis le bras droit technique des CTO ou DSI, Direction des systèmes d’information. C’est vraiment m’assurer que mes clients DSI aient compris les implications de leurs choix, puisqu’un DSI fait toujours énormément de choix. Il n’y a rien de gratuit de ce monde, donc même le choix de ne rien changer a des implications, donc je m’assure qu’ils et elles ont bien compris les implications et après ils font leurs choix en leur âme et conscience.

Frédéric Couchet : Tu es également trésorière de Postgres Europe, cofondatrice de Postgres Women et contributrice reconnue du projet Postgres.

Lætitia Avrot : Oui.

Frédéric Couchet : On reparlera tout à l’heure de Postgres Women que je ne connais pas et peut-être aussi de Postgres Europe quand on parlera de la communauté. Tu es donc quelqu’un qui est aussi très actif, en tout cas le projet Postgres.

Lætitia Avrot : Une dernière contribution que je fais, je suis aussi enseignante à l’Université Lyon 1, en master 2.

Frédéric Couchet : Je précise qu’on a le plaisir de t’avoir en studio parce que tu es venue spécialement pour l’émission aujourd’hui.
Deuxième invité, c’est aussi un grand plaisir parce que ça fait à peu près deux qu’on essaye d’organiser ça, c’est Anthony Nowocien. Anthony. une petite présentation.

Anthony Nowocien : Bonjour. Je m’appelle Anthony, je viens d’un peu moins loin que Lætitia puisque je travaille à Paris. Je suis secrétaire de l’association Postgrer Fr. Je suis, depuis septembre dernier, membre du comité du Code of Conduct Postgres, le code de conduite du projet Postgres. Je suis également expert Postgres à la Société Générale.

Frédéric Couchet : Précisons que tu interviens à titre personnel aujourd’hui, tu n’interviens pas au nom de la Société Générale.
Dans l’introduction j’ai dit « système de gestion de base de données libre Postgres », on va peut-être commencer par la première partie, celle qui est sans doute la moins connue des gens, système de gestion de base de données. C’est quoi système de gestion de base de données ? Qui veut commencer par essayer d’expliquer ça ? Lætitia

Lætitia Avrot : Aujourd’hui on a énormément de données, mais, en fait, ce n’est pas nouveau, ça date des années 70. Quand on a commencé à avoir beaucoup de données, on s’est rendu qu’on aurait aimé pouvoir y accéder en même temps, sans se poser la question de qui écrit, qui lit en même temps, etc. Ce n’était pas possible de résoudre ça avec le stockage. Quand on a fichier, on ne peut pas avoir deux personnes qui écrivent en même temps dessus, donc on a dû créer ce qu’on appelle des moteurs de base de données qui sont capables, justement, de servir ce qu’on appelle des accès concurrents aux données, ce qui permet de pouvoir avoir quelqu’un qui écrit avec, en même temps, quelqu’un qui est en train de lire et quelqu’un d’autre qui attend sa place pour pouvoir écrire aussi sur cette donnée, etc. C’est la raison pour laquelle on a inventé ça dans les années 70.
Ensuite on est allé plus loin, du coup, on a mis en place un système qui est optimisé pour gérer toutes ces données. C’est son travail de s’assurer que les données sont bien stockées là où elles sont, qu’elles ne sont pas perdues une fois qu’elles sont stockées, que les transactions accèdent aux données une fois qu’elles sont validées, qu’elles n’accèdent pas aux données non validées ; qu’une fois qu’une transaction est passée, donc une fois qu’on a dit qu’on veut changer quelque chose, qu’on a dit « OK je valide », que cette validation soit sur l’intégralité de la transaction. Par exemple, si on décide de transférer 100 euros d’un compte bancaire à un autre, si on retire 100 euros d’un compte et qu’on ne les fait pas arriver sur l’autre, ça va poser problème. Donc on s’assure que la validation est globale sur les deux comptes : on a bien retiré 100 euros d’un compte et ajouté 100 euros sur l’autre.

Frédéric Couchet : Donc, si la deuxième opération de la transaction échoue, la première est annulée ?

Lætitia Avrot : Voilà, exactement. C’est pour ça qu’on a été obligé de mettre en place ces logiciels que sont les systèmes de gestion de base de données. Celui-ci est relationnel, il y en a d’autres. C’est pour ça qu’on a mis tout ça en place, ce sont de très vieux systèmes ; ça date des années 80 ! Oui, dans l’informatique, les années 80, c’est très vieux.

Frédéric Couchet : Humainement c’est très jeune, on va dire!
Ça me paraît très clair. Je précise d’ailleurs que la même personne – je vais dire qui c’est, c’est Bookynette, en plus c’est la présidente de l’April depuis trois mois – qui craignait que ce soit trop technique, vient de dire que c’est super clair, donc franchement ! Par contre, on va juste demander à Lætitia de parler plus proche du micro, on me dit que le volume est un peu bas.
En tout cas, j’ai rarement une explication aussi claire sur ce qu’est un système de gestion de base de données

Anthony Nowocien : Merci Lætitia pour cette introduction très claire. Pour compléter, tu as parlé un petit peu des bases de données. Un certain nombre de familles de bases de données existent. Postgres fait partie de la grande famille des bases de données relationnelles. On peut dire que c’est la famille qui est arrivée en premier dans les bases de données. Plusieurs autres systèmes sont présents, par exemple les bases de données graphes, les bases de données clé-valeur, qui sont les bases données documents, qui sont arrivées un petit peu à posteriori pour gérer de nombreux cas.
L’idée des bases de données relationnelles c’est plutôt de gérer des données que l’on appelle structurées, qui ont un format prédéfini, par exemple des numéros de compte, des civilités, des noms, des prénoms, tout ça ce sont des données qui ont une structure et Postgres sait très bien gérer ce genre de données.

Frédéric Couchet : D’accord. On va expliquer par exemple que des gestions de membres peuvent souvent être stockées dans des bases de données relationnelles. Par exemple, à l’April, on a une base de données relationnelles, d’ailleurs basées sur Postgres avec dessus un applicatif dessus.
Lætitia, tu as parlé des années 80, c’est assez ancien, ce sont effectivement des choses que les gens ne connaissent pas forcément. Plusieurs bases de données existent, il y a des bases de données privatrices dont on va sans doute reparler tout à l’heure avec Oracle ou autres, mais dans le monde du logiciel libre, si j’ai bien compris, Postgres est l’une des plus anciennes.

Lætitia Avrot : Oui. La première note de design c’est 1984.

Frédéric Couchet : J’étais assez étonné quand j’ai vu ça, je pensais que c’était plus récent, ça fait quand même très longtemps. Donc un petit peu d’historique sur, justement, comment est né Postgres, pourquoi c’est né, comment ça s’est développé avant qu’on rentre un peu plus dans les détails d’aujourd’hui ? Lætitia, tu commences.

Lætitia Avrot : Ce qui est assez intéressant c’est que le projet est né à l’Université de Berkeley et l’Université de Berkeley, au lieu d’avoir des laboratoires par matière, par thème, a des laboratoires pluridisciplinaires. Postgres a été créé, au départ, pour de la biologie, pour stocker des données biologiques, parce qu’ils avaient besoin d’une base de données, tout simplement. Du coup, ça a été créé au départ avec une application directe. Ça n’a pas été créé par n’importe qui , c’est Michael Stonebraker et Michael Stonebraker est l’une des quatre personnes qui ont obtenu le prix Turing, l’équivalent du prix Nobel en informatique, pour ses apports en bases de données.

Frédéric Couchet : Oui, c’est quelqu’un qui ne rigole pas !

Lætitia Avrot : Oui. Voilà ! Il avait créé avant un autre moteur de bases de données qui s’appelait Ingres. Du coup, il a appelé celui-ci Postgres pour post Ingres, après Ingres ; c’est de là que vient le nom Postgres.

Frédéric Couchet : D’accord, c’est début des années 80, cette personne lance ça tout seul, université de Berkeley aux États-Unis. Pas tout seul ?

Lætitia Avrot : C’est un professeur, il s’entoure d’une cohorte d’étudiants très intelligents qui vont coder pour lui.

Frédéric Couchet : Très impliqués. Finalement, c’est, quelque part, un projet universitaire qui démarre comme ça. Quel va être le développement ? Aujourd’hui Postgres est utilisé dans plein de cas, dans une association comme l’April – notre base de données n’est pas très grosse –, mais, on va en parler tout à l’heure, de grandes entreprises l’utilisent, tu travailles à la Société Générale, on peut parler de la SNCF et autres. Comment s’est développé ce projet à partir de Berkeley ? Comment c’est sorti de Berkeley quelque part ?

Anthony Nowocien : Tu parlais du tout début de Postgres : il y avait Ingres au tout début, disons en 84. En 1986, un papier sort, <em<The Design of Postgres, qui liste un certain nombre des griefs que les étudiants de l’équipe faisaient à Ingres. Ils ont donc décidé, d’une certaine manière, de forker, donc de faire un nouveau développement se basant un petit peu sur Ingres. Des développements restent dans le giron universitaire pendant un certain nombre d’années et, en 95, le projet devient véritablement libre, il est ouvert à contributions, le code source devient libre et disponible sur Internet et il choisit un nom un petit curieux, Postgres 95.

Lætitia Avrot : Autre chose intéressante, à l’époque il y avait très peu de licences libres, du coup le projet Postgres a déployé sa propre licence.

Frédéric Couchet : C’est une licence PostgreSQL qui ressemble un peu aux licences des universités américaines, en fait on dit qu’on peut faire un peu ce qu’on veut à partir du moment où on cite l’attribution des contributions de chacune et chacun.

Lætitia Avrot : C’est encore plus libre que ça. On peut faire tout ce qu’on veut du moment qu’on ne fait pas de procès à PostgreSQL. La licence tient en moins de 140 caractères.

Frédéric Couchet : D’accord. OK. Tout à l’heure, dans la chronique d’avant, on a parlé d’une autre licence libre qui existe, qui est très connue, qui est GNU General Public license, qui, elle, fait plusieurs pages, mais dont l’objectif est un petit différent.

Anthony Nowocien : Il y a très peu d’obligations avec cette licence-là, c’est effectivement « faites ce que vous voulez », on dit qu’elle est assez proche de la licence MIT

Frédéric Couchet : C’est à ça que je pensais, la licence MIT, Massachusetts Institute of Technology, une licence qu’on dit permissive, c'est-à-dire qu’on peut faire plein de choses sauf qu’il ne faut pas remettre en cause ce qui a été fait par les personnes.
C’est à partir du moment où ça devient libre que ça commence à sortir. Est-ce qu’il y a des réflexions sur la formalisation ou la structuration du projet ? Excusez-moi, je n’ai pas retenu le nom de la personne qui a lancé ça ?

Lætitia Avrot : Michael Stonebraker.

Frédéric Couchet : Est-ce que Michael Stonebraker décide de conserver, je dirais, le leadership sur ce projet ? Est-ce qu’il décide de créer une fondation ? Comment ça se passe ? Quelles sont les discussions et aujourd’hui où ça en est ?

Anthony Nowocien : Il est resté un certain temps dans le projet, mais c’est une personne qui a eu énormément d’idées sur les bases de données, ça a donné naissance à Postgres, et ça a donné naissance aussi à d’autres projets avec d’autres systèmes de gestion qu’il a mis en place. Il a lancé énormément de startups, ce monsieur, à un moment donné. Je ne sais pas à quel moment il s’est retiré du projet Postgres.

Lætitia Avrot : Je dirais qu’à partir du moment où il a mis la formation du PGDG, The PostgreSQL Global Development Group, j’aurais bien daté ça en 1995. Le code est devenu la propriété de tout le monde, en fait.

Frédéric Couchet : Anthony, tu viens de dire qu’il a lancé des startups dans d’autres domaines, il n’a pas choisi de lancer une startup avec un système privateur basé sur Postgres, il a plutôt dit « je le libère et les personnes en feront ce qu’elles veulent ». C’est ça ?

Anthony Nowocien : Au début, il a monté une société qui a fait du support sur Postgres, dont j’ai oublié le nom, qui a eu sa petite vie.

Frédéric Couchet : Et aujourd’hui ça fonctionne comment, en fait ?

Lætitia Avrot : Je voulais juste rajouter qu’aujourd’hui Michael Stonebraker est membre de la direction de EDB, la société dans laquelle je travaille.

Frédéric Couchet : D’accord. As-tu déjà eu le plaisir de le rencontrer ?

Lætitia Avrot : Non, parce qu’il y a eu le Covid !

Frédéric Couchet : OK, J’espère que tu auras ce plaisir.
Avant qu’on parle un peu de technique sur les forces et peut-être les faiblesses de Postgres, on va finir sur cet aspect libre. Aujourd’hui, comment est géré le projet ? On en parlera peut-être un petit peu après, dans la deuxième partie, je regarde mon séquencier, je suis un peu en avance. On va parler du projet un petit peu après. Là on va parler, un peu mais pas trop, technique, parce que ce n’est pas le but, mais aujourd’hui on peut se poser la question : pour quels types de projets peut-on utiliser ce type de base de données relationnelle Postgres ? Est-ce que ce sont des petits projets ? Des gros projets ? Quels types de compétences faut-il ? Quel est le coût entre guillemets « humain ». Je parle d’un projet qui part de zéro, je ne parle pas d’un projet de migration. Après je vous poserai la question sur un projet de migration, parce que c’est très différent. Quelqu’un qui se dit, que ce soit une petite entreprise ou une grosse, « tiens, j’ai un projet qui va nécessiter une base de données, pourquoi choisir Posgres ? » Lætitia.

Lætitia Avrot : La première raison pour laquelle il faut choisir Postgres c’est que c’est le moteur de base de données plébiscité par les développeurs. Dans le sondage annuel de Stack Overflow, un forum d’informaticiens qui fait un sondage annuel, plus de 100 000 personnes répondent. Ça fait plusieurs années que Postgres était le préféré et, cette année encore, c’est le système préféré des développeurs. Je ne sais pas vous, mais quand quelqu’un veut travailler avec un outil, je lui dis eh bien oui.

Frédéric Couchet : Pourquoi est-ce le système préféré ?

Lætitia Avrot : Un de mes copains dit : « On ne peut être sûr de quasiment rien sauf du fisc et de Postgres ! »

Frédéric Couchet : C’est la fiabilité et la capacité, peut-être, à gérer tous les types de projets ?

Lætitia Avrot : J’aurais tendance à dire que Postgres peut tout faire à partir du moment où on a intégré le fonctionnement de Postgres et que le code est développé pour fonctionner avec Postgres.

Frédéric Couchet : C’est donc une écriture spécifique de code pour que ce soit optimisé.

Lætitia Avrot : Optimisé pour les systèmes relationnels, déjà. Si on fait quelque chose en n’imaginant pas qu’on va avoir un système relationnel ça ne va pas bien marcher.

Frédéric Couchet : Donc autant utiliser une base de données d’un autre type, à ce moment-là.

Lætitia Avrot : Oui. Quand j’interviens – j’interviens toujours quand ça ne marche pas, parce que, quand ça marche, les gens ne m’appellent pas – souvent, quand ça ne marche pas, c’est le code, ce n’est pas Postgres, ce n’est pas la base, c’est très souvent un problème de code.
La vision des requêtes n’est pas en sendlist ??? [33 min 50]. Postgres utilise le SQL qui est un langage normalisé de requêtage de base de données, il y en a d’autres, mais il a une vision en sendlist des choses, il est basé sur la théorie des courbes de Galois, etc., et c’est basé aussi, même si ça sonne un peu éloigné ces derniers temps, de l’algèbre relationnelle. Il y a des grosses bases mathématiques derrière. Si on n’a pas acquis ces fondamentaux, par exemple si on décide de mettre à jour 1000 lignes et, qu’au lieu de mettre à jour 1000 lignes, on met à jour ligne par ligne, ça va être beaucoup plus lent que si on met à jour 1000 lignes.

Frédéric Couchet : Oui. Il y a donc des compétences à avoir pour l’utiliser pleinement et ne pas faire d’erreurs. Je vois une question sur le salon web, je vais la relayer. Tu as parlé de requêtage, quelqu’un demande si tu peux préciser ce qu’est le requêtage.

Lætitia Avrot : Le requêtage c’est demander au moteur de rapporter une donnée. Le SQL est un langage qui a été créé pour les non informaticiens, il a été fait pour être nativement lisible en anglais. Donc on va lui dire « s’il te plaît – non, on ne dit pas s’il te plaît à une machine – rapporte-moi toutes les personnes dans la base de données qui sont nées en 1986 ».

Frédéric Couchet : On demande au système de faire une sélection par rapport à un certain nombre de critères. Si je reprends l’exemple de base de données pour la gestion d’adhérents, on peut demander quels sont les membres à jour de cotisation aujourd’hui, quels sont les membres qui habitent dans la région parisienne, etc. On fait une requête, d’où le terme requêtage.

Lætitia Avrot : Le gros avantage c’est qu’au lieu de dire à l’ordinateur comment faire les choses, on lui dit ce qu’on veut.

Frédéric Couchet : Et on ne sait pas comment la base va gérer ça, mais elle va donner la réponse et tu dis c’est que quand il y a des erreurs c’est plutôt côté développement que côté développement Postgres.

Anthony Nowocien : En fait, c’est en langage de beaucoup plus haut niveau que ce à quoi on est généralement habitué. Habituellement, quand on communique avec une machine, on lui dit « tu fais telle chose, ensuite tu passes à la chose numéro 2, à la chose numéro 3, à la chose numéro 4. » Là on lui pose seulement la question : donne-moi les habitants de Paris qui sont membres de l’association et c’est à charge de Postgres de trouver la réponse, par ses algorithmes, par son intelligence, pour répondre le plus rapidement possible à cette question.

Frédéric Couchet : J’ai pris l’exemple d’une association qui a une petite base de données, 3000 membres c’est bien pour une association mais ça reste relativement petit. Tu as dit en introduction que tu travailles pour la Société Générale, j’ai cité la SNCF. Aujourd’hui les bases de données font plutôt des téraoctets, voire plus, des grosses bases de données. Est-ce que Postgres est capable de gérer ce genre de cas et est-ce que PostgreSQL serait spécialisé dans ce qu’on appelle les grosses bases de données ? Je n’ai pas la réponse.

Lætitia Avrot : On est d’accord que quelqu’un qui a une petite base de données, elle marchera partout, sur n’importe quel système, même si ce n’est pas fait pour. Il n’y aura jamais de problème avec peu de volume. Les problèmes peuvent arriver si on a un gros volume – sachant que c’est très difficile de définir ce qu’est un gros volume – en ayant en même temps une charge de travail important. Si on a beaucoup de données mais qu’on ne va jamais les chercher, ça tournera, il n’y aura pas de problème. Le problème c’est quand on va chercher les données et, pour la réponse, on veut un certain laps de temps.

Frédéric Couchet : La rapidité de la réponse.

Lætitia Avrot : On ne veut pas une latence trop importante. Aujourd’hui, on sait que dans un monde où, si on attend plus de 250 millisecondes sur une page internet, on va fermer la page.

Anthony Nowocien : De nombreux GAFAM ont calculé le coût de la latence en millions d’euros pour le chargement d’une page. C’est pareil pour la base de données.

Lætitia Avrot : Du coup, le problème arrive quand on demande beaucoup de choses à la base de données et, qu’en même temps, elle a beaucoup de choses à trier. Récupérer un item parmi 20 c’est forcément plus facile qu’un item parmi 20 millions. C’est là qu’il commence à y avoir des soucis, ça ne veut pas dire que c’est impossible à faire, ça ne veut pas dire que Postgres est moins bon que les autres pour le faire, à mon avis il est même particulièrement bon pour le faire, c’est juste qu’il va falloir faire attention à comment on demande ; suivant la manière dont on demande, il ne prendra peut-être pas le même chemin pour y arriver ; il faudra faire attention à comment on l’a paramétré pour qu’il puisse utiliser toutes les ressources de la machine ; il va falloir aussi voir comment on a structuré les données, puisqu’on a dit au départ que ce sont des données structurées, si elles ne sont pas structurées correctement, ça peut avoir un impact assez important sur la performance.

Frédéric Couchet : Si je comprends bien, de la façon dont on va faire le travail initial va dépendre la requête finale qu’on va faire, qui va passer en moins de 250 millisecondes, qui va peut-être passer en 10 secondes, voire en plusieurs heures.

Anthony Nowocien : Tu as posé la question de savoir si Postgres est spécialisé dans les gros volumes

Frédéric Couchet : Oui, parce que j’ai lu sur l’environnement spatial par exemple, ???[38 min 50]

Anthony Nowocien : Je pense que c’est effectivement un point intéressant qu’on pourra aborder. Je ne pense pas que Postgres soit spécialisé dans les gros volumes, mais c’est une base de données très versatile qui va savoir gérer les petits comme les gros volumes. Lætitia l’a très bien expliqué.

Lætitia Avrot : Qu’il y ait peu d’éléments ou beaucoup d’éléments, il n’y a pas une très grande variance de temps de latence.

Frédéric Couchet : C’est important. Il n’y a pas une explosion du temps de latence dont tu parlais si le nombre d’éléments augmente, contrairement, peut-être, à d’autres bases de données.

Anthony Nowocien : C’est le pouvoir de ce qu’on appelle l’indexation qui va permettre d’offrir des temps logarithmiques et pas exponentiels ou pas linéaires. Si j’ai bien organisé ma base de données qui est dix fois plus grosse, je ne vais pas avoir des temps qui vont être dix fois plus longs.

Frédéric Couchet : Je précise aux gens qui sont sur le salon web de ne pas hésiter à dire si c’est trop technique ; tout à l’heure on a eu la théorie des groupes de Galois, donc effectivement !
Postgres semble avoir beaucoup de points forts, notamment versatilité, etc. Est-ce qu’il y a aujourd’hui des points faibles techniques ? Après je poserai une question sur la partie humaine. Est-ce qu’il y a des points faibles techniques ? Est-ce qu’il y a des choses que Postgres ne saurait pas faire par rapport à d’autres bases de données, qu’elles soient libres ou privatrices ?

Lætitia Avrot : Je dirais qu’il n’y a pas de choses qu’il ne sait pas faire, je dirais qu’il y a des choses qu’il ne sait pas encore faire. Postgres évolue, même très rapidement puisqu’il y a une version majeure tous les ans. J’ai dit que SQL est un langage normé, standardisé, la norme évolue aussi, donc il y a encore beaucoup de manquements à la norme parce qu’elle évolue plus vite que le temps qu’on a pour implémenter et il faut déjà arriver à comprendre la norme.

Frédéric Couchet : Aujourd’hui, est-ce que tu sais à peu près combien ça implémente de pourcents de la norme ?

Lætitia Avrot : Je n’en sais rien.

Frédéric Couchet : Est-ce qu’il y a des bases de données qui implémentent 100 % de la norme ?

Lætitia Avrot : Non. Et, à mon avis, Postgres est le plus proche du standard.

Anthony Nowocien : C’est réputé pour être le plus proche du standard, c’est même un modèle dans les universités, à bonne raison.

Frédéric Couchet : OK. D’accord.

Lætitia Avrot : Mais ça reste des choses à améliorer, notamment les tables temporelles qui sont des tables qui permettent de stocker les différentes anciennes versions des valeurs, pour stocker un historique automatique. C’est quelque chose qui existe sur MariaDB par exemple, une autre base de données libre, mais qui n’existe pas dans Postgres.

Frédéric Couchet : D’accord. Maintenant je vais poser la question sur l’aspect non technique mais plutôt humain, qui est peut-être la complexité potentielle d’utiliser PostgreSQL. Comme tu l’as expliqué tout à l’heure, Lætitia, il faut avoir une certaine maîtrise des concepts et d’un certain nombre de choses pour faire quelque chose de bien. Je vais poser ma question directement : ans les formations actuelles des jeunes ingés, est-ce qu’il y a des formations à PostgreSQL, à Postgres plutôt, je dis PostgreSQL parce que ça s’écrit « SQL » à la fin.

Anthony Nowocien : On peut dire les deux.

Frédéric Couchet : Est-ce qu’il y a de la formation des jeunes ingés. Est-ce que les jeunes ingés qui arrivent sur le marché du travail, en tout cas les personnes qui ont été formées, ont reçu une formation à la fois sur les concepts de la base de données et sur la base de données elle-même ? Anthony.

Anthony Nowocien : Je peux dire que quand j’étais en école d’ingénieur, j’ai plutôt appris à utiliser la base de données en tant que développeur, donc à faire des requêtes pour poser les questions à la base de données, et j’ai fait ça sur plusieurs systèmes de gestion de base de données. Par contre, je n’ai pas du tout appris comment marchent ces bases de données, disons sous le capot. En tout cas, à l’époque, ce n’était pas vraiment le cas pour moi, c’est quelque chose que j’ai appris sur le tas.

Frédéric Couchet : Excusez-moi, je précise à la régie qu’on va bientôt faire une pause musicale.

Anthony Nowocien : Je pense qu’aujourd’hui il y a des parcours qui mettent l’accent sur comment sont organisées les choses à l’intérieur d’une base de données et pas seulement l’approche d’un développeur, le requêtage.

Lætitia Avrot : Je vais nuancer un peu ce propos. J’enseigne à l’Université Lyon 1, justement pour faire ma part, parce que je me suis rendu compte qu’il y a énormément de formations en informatique avec zéro connaissance en base de données ou près de zéro. Ce sont des gens qui apprenaient encore le langage SQL d’avant 1992. Pour les informaticiens qui veulent avoir quelque chose de très visuel sur ce qu’est l’informatique en 1992, c’est Windows 3.1. C’est donc vraiment quelque chose d’extrêmement ancien. Le langage a énormément évolué depuis. En école d’ingénieur, j’ai eu la chance d’être à Lyon où il y a plusieurs laboratoires de données, donc j’avais des enseignants-chercheurs en bases de données, j’ai fait pas mal de modélisation, j’ai eu des cours sur le langage, des cours d’algèbre relationnelle, toute la théorie mathématique qui est sous le SQL, mais je n’ai pas eu la partie compréhension du fonctionnement interne d’un moteur de base de données.

Frédéric Couchet : On va faire une pause musicale. Je vous avais prévenus, le temps passe vite. Nous allons écouter Women Thoughts par Cyber SDF. On se retrouve dans environ trois minutes. Belle journée à l’écoute de Cause Commune, la voix des possibles.

Pause musicale : Women Thoughts par Cyber SDF.

Voix off : Cause Commune, 93.1.

Frédéric Couchet : Nous sommes en train d'écouter la fin de Women Thoughts par Cyber SDF, disponible sous licence libre Creative Commons Attribution, CC BY. Occasion de rendre une nouvelle fois hommage à Laurent Seguin décédé en novembre 2020. Laurent était une figure incontournable du logiciel libre et également un artiste sous le pseudo de Cyber SDF.

[Jingle]

Deuxième partie

Chronique de Vincent Calame sur le site LOW←TECH MAGAZINE

Frédéric Couchet : Nous allons passer au sujet suivant. Nous allons poursuivre par la chronique de Vincent Calame, informaticien libriste bénévole à l’April. Cette saison, Vincent propose des chroniques sur le thème du Libre et de la sobriété énergétique. Tout à l’heure, on parlait de sobriété pas vraiment sobriété, justement précédemment, dans les soirées libristes. Le chapitre aujourd’hui porte sur le site web Low-tech Magazine. Vincent, c’est quoi ce site web ?

Vincent Calame : Aujourd’hui, je vais revenir à la question du low tech, mais dans le concret cette fois, puisque je vais vous présenter ce site web. Je remercie au passage Laurent Costy, qui est chroniqueur animateur sur cette antenne, qui m’a transmis le lien et partagé son enthousiasme pour ce site. Donc, il s’appelle Low-tech Magazine. Il se trouve à l’adresse solar.lowtechmagazine (tout attaché).com. Vous trouverez évidemment la référence exacte sur le site de l’émission.

Alors je précise tout de suite que si la page d’accueil est en anglais, sa version française est complète dans une traduction de très bonne qualité. Ceci est principalement l’œuvre d’une personne, ???, journaliste scientifique et technique indépendant qui est installée à Barcelone. Ce détail a son importance, nous allons le voir par la suite.

Frédéric Couchet : Alors que trouve-t-on sur ce site ?

Vincent Calame : Tout d’abord, je vous signale que je vous ai donné l’adresse de la version du site qui commence par solar. Il existe une version commençant par les trois w classiques et qui est lui-même tout à fait classique. La version solar est beaucoup plus intéressante, car il s’agit d’un serveur alimenté de manière autonome par des panneaux solaires. Comme l’indique le sous-titre de cette version, ce site fonctionne à l’énergie solaire et se retrouve parfois hors-ligne. Vous avez d’ailleurs, tout en haut à droite des pages, un petit pictogramme qui indique l’état de la batterie en fonction de l’ensoleillement. Alors évidemment, du coup, être à Barcelone, pour l’ensoleillement, ça aide. Pour avoir une consommation minimale, le contenu doit être minimal. C’est en particulier le cas des images : le site ne les bannit pas, mais en propose une version en basse définition. Bon, on ne va pas se cacher : c’est moins lisible qu’une photo habituelle, mais c’est très intéressant d’un point de vue pédagogique.

Je propose aux amateurs. Je précise que tout le système mis en place est, bien sûr, décrit dans le détail dans un des articles.

Le site propose trois grandes rubriques : « solutions low-tech », « problèmes high-tech » et « technologie ancienne ». La distinction entre solutions low-tech et technologie ancienne est instructive, car elle montre que le low-tech n’est pas un retour au passé, mais surtout une ré-interrogation des savoirs et des technologies empiriques à la lumière des connaissances scientifiques actuelles. A tire d’exemple, l’article « Comment concevoir un voilier au 21e siècle » est très éclairant. Comme indique son chapô, je cite : « il est étonnamment difficile de construire un voilier à impact carbone neutre. C’est d’autant plus le cas aujourd’hui que nos normes de sécurité, de santé, d’hygiène, de confort et de commodité ont profondément changé depuis l’âge de la voile ».

Cette illustration illustre bien le ton du site. Il n’est pas catastrophiste, il étudie les questions posément et de manière approfondie, sans éluder les idées qui fâchent ou les points bloquants, en particulier nos standards de confort moderne. Bon, je vous laisse le plaisir de découvrir le contenu du site, qui existe par ailleurs en version papier.

Le sujet des voiliers est un peu particulier. Plus proche de notre vie quotidienne, je vous recommande plus particulièrement l’article sur « Comment sortir son appartement du réseau électrique ? » J’y ai notamment découvert ce paradoxe : nos outils informatiques fonctionnent avec du courant continu basse tension, les panneaux solaires produisent du courant continu basse tension, mais entre les deux, si on fait passer par le réseau électrique classique, il faut transformer ça en courant alternatif haute tension à l’aide d’un onduleur, pour ensuite que l’adaptateur de votre appareil le retransforme en courant continu. Alors, par exemple, d’après l’article, cette simple double conversion ferait perdre jusqu’à 30 % d’énergie produite. Ce n’est pas rien.

Frédéric Couchet : Est-ce que ce site parle de logiciels libres ?

Vincent Calame : Oui, j’aurais envie de répondre : évidemment. Vous trouverez dans la rubrique Problèmes high-tech, un article intitulé « Comment et pourquoi j’ai arrêté d’acheter de nouveaux ordinateurs portables », où l’auteur décrit différents ordinateurs qui ont jalonné sa vie professionnelle et comment il est revenu à un IBM ??? de 2006. Comme il l’indique, l’utilisation de vieux portables est possible grâce aux logiciels libres et en partie des distributions GNU Linux spécialement conçues pour des vieux matériels. Je ne vais pas m’étendre là-dessus, car j’ai déjà abordé le sujet dans une chronique précédente. Mais ??? [1:22:36] le fait de manière beaucoup plus détaillée et pédagogique que moi, je ne peux que vous conseiller de lire.

Frédéric Couchet : Merci Vincent pour cette découverte. Donc, on rappelle le site web : c’est solar.low-techmagazine.com. Évidemment, les références sont sur le site libreavous.org. Et comme c’est une émission qui est très cohérente, aujourd’hui, en première partie d’émission, nous avions, qui donc ? Antanak, qui est donc évidemment l’association spécialisée dans le matériel reconditionné. Donc, on voit le lien avec cette chronique. Et nous avons parlé de réemploi informatique, notamment de vieux ordinateurs portables reconditionnés, dans l’émission 70, justement avec Isabelle Carrère d’Antanak et Joyce Markoll de l’Atelier Orditux Informatique : vous trouvez la référence sur le site de l’émission libreavous.org/70.

Et je rappelle qu’Antanak est à peu près à 10 mètres du studio de la radio. Donc voilà, dommage qu’elles ne soient pas restées parce que je pense que ça leur aurait fait plaisir. Et juste pour finir, il y a pas mal de sites aujourd’hui qui fournissent des ordinateurs, enfin : beaucoup... Quelques sites qui fournissent des ordinateurs reconditionnés avec des systèmes libres. Ce n’est pas la grande majorité, mais ça existe. Ou on peut acheter des ordinateurs qui sont reconditionnés et y installer un système libre, comme par exemple dans le 18e, il y a ???, je ne sais pas si tu connais ?

Vincent Calame : Non, non. Moi pour l’instant, je maintiens au maximum les ordinateurs vivants. J’irai au reconditionnement quand ils lâcheront vraiment.

Frédéric Couchet : Exactement. En tout cas nous, c’est les pratiques qu’on a, notamment à l’April, d’acheter des matériels reconditionnés. En tout cas, merci Vincent, pour cette chronique. On se retrouve le mois prochain ?

Vincent Calame : Oui.

Frédéric Couchet : Belle journée à toi. Et puis, on va passer aux annonces de fin.

[Virgule musicale]

Quoi de Libre ? Actualités et annonces concernant l'April et le monde du Libre

Frédéric Couchet :