Open Data, les données de la démocratie avec Samuel Goëta

De April MediaWiki
Aller à la navigationAller à la recherche


Titre : Open Data, les données de la démocratie

Intervenant·s : Samuel Goëta - Jérôme Sorrel - Jean-Philippe Clément

Lieu : Émission Parlez-moi d'IA - Radio Cause Commune

Date : 18 mai 2024

Durée : 29 min 45

Podcast

Présentation du podcast

Licence de la transcription : Verbatim

Illustration : À prévoir

NB : Transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.


Transcription

Jean-Philippe Clément : Salut Jérôme.

Jérôme Sorrel : Salut Jean-Philippe.

Jean-Philippe Clément : Tu sais quoi ? Aujourd’hui on va parler open data.

Jérôme Sorrel : Open data, ce n’était pas le nom que tu voulais donner à ton émission ? Data, Parlez-moi data ou un truc comme ça ?

Jean-Philippe Clément : Oui, c’est ça. En fait, après, on a parlé IA mais, tu vas voir, c’est pareil parce que sans data, pas de chocolat, pas d’IA. La data c’est la base et l’open data c’est encore plus la base, c’est un enjeu encore plus crucial.

Jérôme Sorrel : À qui le dis-tu ! Rayons Libres et Cause Commune !

Jean-Philippe Clément : Oui et Cause Commune notamment. Tu es prêt ?

Jérôme Sorrel : Je suis prêt, incroyable.

Jean-Philippe Clément : Elisa est connectée ?

Jérôme Sorrel : Elisa est connectée, elle est impatiente.

Jean-Philippe Clément : Lançons-nous. Merci pour ta réalisation. Parlez-moi d’IA.

Diverses voix off : Mesdames et Messieurs, bonjour.
Je suis un superordinateur CARL, cerveau analytique de recherche et de liaison.
C’est une machine qui ressent les choses.
On nous raconte n’importe quoi sur l’IA !
Qu’est-ce que tu en dis ?
Moi, je n’en dis rien du tout.
La créativité, elle reste du côté humain.

Jean-Philippe Clément : Bonjour à toutes et à tous. Je suis Jean-Philippe Clément. Bienvenue sur Parlez-moi d’IA. Nous avons 30 minutes pour essayer de mieux comprendre ces nouveaux outils sous leurs aspects sociétaux, culturels, sociaux, éthiques et, pourquoi pas, politiques.
Cette semaine, nous allons nous demander quels sont les enjeux de pouvoir et de contre-pouvoir autour de l'open data avec l’auteur d’un ouvrage de référence sur le sujet, qui vient juste de sortir, qui s’appelle Les données de la démocratie.
Vous êtes bien sur Cause Commune, la radio des possibles. Un merci à notre directeur d’antenne, Olivier Grieco, de nous permettre cet espace de liberté et d’échanges. Cause Commune, que vous pouvez retrouver sur le web, causecommune.fm, ou dans son app Android et iPhone, bien sûr en FM 93.1 et en DAB+ et sur votre plateforme de podcast préférée.
Un petit like, un petit pouce, un petit truc, c’est sympa pour nous, ça nous fait plaisir, en plus ça manipule un peu les algorithmes et c’est cool de manipuler les algorithmes.

Voix off : Vous écoutez Parlez-moi d’IA.

Jean-Philippe Clément : Open data késako ? Open data ou « données ouvertes », c’est l’idée de publier, de rendre accessibles au plus grand nombre, sans restrictions, des données sur un sujet. Mais pour quoi faire ? Article 15 de la Déclaration des droits de l’homme et du citoyen du 26 août 1789 qui disait déjà : « La société a le droit de demander compte à tout agent public de son administration ». Donc, le premier objectif de l'open data, c’est la transparence des organisations, notamment de l’administration ; c’était déjà inscrit dans la Déclaration des droits de l’homme de 1789.
Autre objectif clé de l'open data, c’est la participation ou la collaboration autour des données. Forcément, si ces données sont ouvertes, on est plus nombreux à pouvoir les utiliser, à travailler ensemble.
Sur le papier tout cela c’est très bien, c’est très sympa, c’est très joli, mais comment cela s’est-il vraiment mis en place en France ? Et puis comment cela se fait-il qu’en 2023 notre pays soit classé premier pays européen dans le classement de l’Open Data Maturity Report et deuxième pays au monde dans le OURdata Index de l’OCDE. Tout cela ne s’est pas fait en un jour, d’ailleurs, cela reste encore fragile et pose de nombreuses questions vis-à-vis de notre administration, de notre économie, de notre démocratie. Notre invité du jour connaît très bien toutes ces questions puisqu’il les suit, en fait, depuis 2008. Il était encore étudiant, puis doctorant, il est désormais enseignant à Sciences Po Aix-en-Provence, activiste de la donnée et consultant dans ce domaine. Bonjour Samuel Goëta.

Samuel Goëta : Bonjour Jean-Philippe. Bonjour Jérôme.

Jean-Philippe Clément : Merci d’être avec nous, à distance, sous le soleil d’Aix-en-Provence.

Samuel Goëta : Très heureux d’être là et très heureux d’échanger avec un pionnier de l'open data.

Jean-Philippe Clément : Oui. On va voir tout ça ; je pense que tu en sais quand même beaucoup plus que moi !
Samuel, Parlez-moi data – Parlez-moi d’IA. La France premier pays européen, deuxième pays dans le monde, ça y est, c’est bon, on est les champions, circulez, c’est plié, on est les meilleurs, les plus transparents, les plus innovants ? Il n’y a plus rien à faire ?

Samuel Goëta : Non. C’est un peu tout le problème des classements et pendant un moment, au sein de l’association Open Knowledge France, on avait travaillé sur l’Open Data Index, un de ces classements qui place la France en tête des pays les plus avancés en matière d'open data Le problème de ces classements, c’est cet effet de « circulez, y'a rien à voir », qu’il peut y avoir sur l’administration en se disant « on est en tête des classements, c’est bon on l’a fait ».

Jean-Philippe Clément : On est au max.

Samuel Goëta : En fait, ce que je constate, qui est un peu une trame dans le livre, c’est qu’il y a un peu un open data à deux vitesses entre l'open data qui va favoriser l’innovation, qui est porté politiquement, et un open data avec des données qui grattent un peu plus, qui vont être un peu plus sensibles, pour lesquelles c’est beaucoup plus compliqué et où on touche à des faiblesses de la transparence administrative en France.

Jean-Philippe Clément : Mais du coup, pour tout le monde – Jérôme se posait aussi la question hors antenne –, si on prend sa casquette de consommateur, si on prend sa casquette d’acteur économique, si on prend sa casquette de citoyen, est-ce que vous pourriez dire en quoi c’est important de s’intéresser à l'open data en 2024 ?

Samuel Goëta : C’est important pour plusieurs raisons.
Déjà parce que dans notre quotidien l'open data est présent, c’est dans l’introduction du livre : à une époque, d’ailleurs quand nous nous sommes rencontrés, Jean-Philippe, quand je parlais d'open data c’était encore un peu un sujet de prospective, avec des trucs un peu bricolés, quelques petites données publiées par-ci par-là. Maintenant, quand je parle d'open data, je peux vous donner plein d’exemples, je peux vous parler de l’application Yuka qui s’est longtemps appuyée sur Open Food Facts, ou, plus largement, ce que fait Open Food Facts, son application, son rôle dans l’élaboration du Nutri-score, son rôle dans l’application NutriNet-Santé, son rôle sur les aliments ultra-transformés.

Jean-Philippe Clément : D’ailleurs, entrons dans le détail. C’est quoi exactement Open Food Facts ?

Samuel Goëta : Open Food Facts c’est un peu le Wikipédia de l’alimentation. C’est une base de données ouverte et collaborative sur tous les produits alimentaires. Le point de départ : quand vous regardez un produit alimentaire, vous avez des données dessus, vous avez une liste d’ingrédients, vous avez un tableau de données nutritionnelles et toutes ces données-là n’existaient pas en base de données et encore moins en base de données ouverte. Un Français, Stéphane Gigandet, en s’inspirant d’un commun de données comme OpenStreetMap pour la cartographie ou Wikidata qui est le versant de données de Wikipédia, a décidé de créer un commun dans lequel on va pouvoir reverser ces données-là et, à partir des données qui sont présentes sur les emballages de nos produits alimentaires, calculer des indicateurs de transformation, des indicateurs de qualité nutritionnelle, pouvoir faire des comparaisons entre les produits. Maintenant ça sert à faire des applications : l’application Open Food Facts est excellente. Ça sert aussi à faire des études, de la recherche. En fait, ça a plein d’usages.
C’est un exemple parce que ça a fait aussi émerger Yuka qui est peut-être un petit plus connu qu’Open Food Facts et qui parle à peu près à tout le monde.

Jean-Philippe Clément : En application. Il faut le savoir : la base de données qui sert à Yuka est en open data, c’est Open Food Facts. Peut-être moins maintenant, en tout cas au tout début. C’est ça ?

Samuel Goëta : C’est ça.

Jean-Philippe Clément : On va se dire tout de suite que c’est un sujet important pour nous, du coup on va se donner le temps. Donc, chers auditeurs, vous êtes là sur le premier épisode parce qu’on va en faire deux sur l'open data avec Samuel Goetta et sur ce livre qui est vraiment très important pour bien comprendre ce qu’est l'open data. Sur ce premier épisode, on va parler un peu histoire – pas trop, sinon on va faire un peu trop anciens combattants –, on va parler aussi soucis, un peu bilan critique de l'open data et on vous proposera, dans un deuxième épisode, plutôt ce qui marche le mieux et les grandes perspectives.
Si on devait s’arrêter sur deux/trois grands éléments historiques de l'open data qu’on devrait retenir et qui seraient importants de faire retenir à nos à nos grands-mères ou à des étudiants, ça serait quoi, Samuel ?

Samuel Goëta : Vous l’avez évoqué en introduction, c’est déjà la Déclaration des droits de l’homme et du citoyen, l’article 15, « La société a le droit de demander compte à tout agent de son administration. »
On a souvent tendance à présenter l'open data comme un produit d’importation, mais je pense que pas du tout. C’est inscrit dans les racines de la République et dans ses principes fondateurs. Ça a donné lieu à une loi, la loi CADA, comme Commission d’accès aux documents administratifs, en 1978.

Jean-Philippe Clément : Ça ne nous rajeunit pas non plus.

Samuel Goëta : Ça ne nous rajeunit pas. C’est un droit qui a plus de 40 ans, qui est mal connu, peu appliqué. Je travaille aussi d’un point de vue associatif avec Open Knowledge France sur un projet qui s’appelle madada.fr, dont on aura peut-être l’occasion de parler, qui vise à démocratiser le droit d’accès. C’est vraiment la possibilité de demander à toute administration les documents qu’elle produit dans le cadre de ses missions de service public. Précisons-le dès le départ, ça exclut l’accès à des données personnelles, à des données de santé ; ça exclut aussi un certain nombre de secrets protégés : le secret des affaires, le secret des délibérations du gouvernement, le secret défense. On ne peut pas avoir accès à tout, mais ça nous donne quand même plein de possibilités et c’est le socle des politiques d’open data, c’est-à-dire que déjà, avant l’ère des politiques d'open data, on avait la possibilité de demander des données.
Si on devait trouver une deuxième date, je dirais 2007, c’est là où le terme open data a émergé. C’était dans une rencontre, je vais la présenter rapidement, la rencontre qu’on appelle de Sebastopol, pas en Crimée, en Californie, chez l’éditeur Tim O'Reilly qu’on connaît assez bien, notamment pour avoir créé le terme « Web 2.0 ». Ils avaient organisé cette rencontre dans laquelle il y avait quelques figures du Libre, notamment le fondateur des Creative Commons, et ces personnes-là ont défini ensemble les grands principes de l’Open Government Data qui est devenu l'open data, c’est-à-dire l’ouverture des données telle qu’on l’entend.
Ils ont défini un certain nombre de principes et l’objectif était que ces principes soient adoptés par le futur président, Barack Obama, et c’est ce qui s’est passé. C’est-à-dire que le premier jour à la Maison-Blanche, Barack Obama a signé trois mémorandums sur l' Open Government dont un qui actait la création de Data.gov qui est le premier portail open data national.

Jean-Philippe Clément : Vous parliez des grands principes qui étaient dans cette conférence de Sebastopol. Si on doit citer deux ou trois grands principes de l’open data

Samuel Goëta : Je vais les résumer.
Le premier principe, c’est celui d’une ouverture complète des données : qu’ouvrir les données ne soit pas une exception, que ça devienne la règle. C’est ce qui s’est passé en France avec la loi pour une République numérique, la loi Lemaire du nom de la secrétaire d’État Axelle Lemaire, adoptée en 2016, et qui fixe un principe d’ouverture des données par défaut, par principe, pour toutes les collectivités de plus de 3500 habitants et les administrations de 50 agents, donc, en gros, ça concerne environ 4000 collectivités en France à l’heure actuelle. On y reviendra dans le bilan critique. Il reste des grosses fractures territoriales en France, mais, en attendant, on a un principe d'open data par défaut. C’est le premier principe qui a été traduit dans la loi.
La loi pour une République numérique acte aussi d’un autre principe qui est aussi dans cette rencontre de Sebastopol, c’est l’ouverture des formats, c’est-à-dire d’avoir accès à des formats ouverts donc, pas au format excel, plutôt le format svg, on ne va pas trop entrer dans le détail de cela. En fait, pendant longtemps, on a eu accès aux données via des fichiers PDF dont on ne pouvait pas extraire les données, qu’on ne pouvait visualiser, on ne pouvait pas créer, refaire les calculs, proposer de nouvelles interprétations,

Jean-Philippe Clément : Des données tabulaires et bien connues en termes de format, bien ouvertes en termes de format

Samuel Goëta : Voilà ! Donc des formats lisibles par les machines et des formats ouverts.
Le troisième point de cette ouverture, c’est d’avoir une licence ouverte.

Jean-Philippe Clément : On va reparler des licences.

Samuel Goëta : On va reparler des licences, c’est important, en gros qui facilitent la réutilisation, qui permettent notamment les usages commerciaux.
Je vais aborder un quatrième point qui me paraît essentiel, le quatrième point, c’est d’avoir accès aux données dans leur plus forte précision. Je pensais que c’est un point qu’on oublie tout le temps. C’est-à-dire, en gros, qu’on présente un peu l'open data comme l'open bar : on vous met à disposition des données, servez-vous, faites-en ce que vous voulez, mais il y a aussi cette idée d’avoir accès aux données dans leur plus fort niveau de précision existant, dont on dispose, leur plus grand niveau de précision.
On prend par exemple les accidents de la route, pendant longtemps on avait le nombre d’accidents à vélo, par an, dans une commune. Maintenant, depuis 2010, avec la base d’accidents corporels de la circulation que publie le ministère de l’Intérieur, pour chaque accident on a les caractéristiques des véhicules, la météo, la localisation précise ; on a le type de véhicule impliqué, les conséquences pour les victimes. Ça permet de faire plein de calculs, ça permet d’aller regarder dans sa rue où ont lieu les accidents, ça a servi – j’en parle dès l’intro, peut-être qu’on en reparlera – à l’association 40 Millions d’automobilistes pour se mobiliser contre le passage à 80 kilomètres-heure. En fait, ça change complètement la donne d’avoir accès aux données dans leur plus grand niveau de précision.
On peut parler aussi, par exemple, du diagnostic de performance énergétique : on a accès à tous les diagnostics de performance énergétique qui sont faits en France, ça permet de faire plein d’études.
Cet aspect-là, ce qu’on appelle la granularité au niveau de précision des données, accès aux données dans leur plus grand niveau de précision, c’est essentiel.
Ce sont donc les grands principes : une ouverture complète, une ouverture à la fois d’un point de vue juridique, avec les licences, d’un point de vue technique, avec les formats et avoir accès aux données dans leur plus grand niveau de précision. C’est ma deuxième date.
La troisième, je vais la faire vite, c’est, en 2016, l’élaboration d’une Charte internationale de l'open data qui, en fait, a stabilisé ces grands principes, mais qui leur a aussi fixé des objectifs un peu plus politiques. La grande faiblesse de ces principes dits de Sébastopol, c’est qu’ils s’intéressent plutôt aux formats, aux conditions d’ouverture, mais pas forcément au contenu des données. Des chercheurs ont fait un peu sur le ton de la blague, en note de bas de page un article qui m’a fait beaucoup marrer, qui disait que la Corée du Nord pourrait publier toutes les données de sa propagande en open data sans que ça contribue pour rien à la transparence et l’accountability d’un régime qui est totalement fermé.
C’est vrai que les principes de l'open data, par défaut, ne vont pas regarder le contenu des données. Là, ils ont commencé à introduire l’idée que l’ouverture des données doit participer, doit renforcer la participation citoyenne et la transparence, c’est le premier objectif, et doit favoriser un développement inclusif en partant du principe que dès lors que les données sont accessibles à tout le monde, ça permet à plus d’acteurs de s’en saisir, là où les géants du numérique, s’ils veulent avoir accès à des données, ils y ont accès, et on l’a bien vu sur les données de transport en région parisienne il y a longtemps. En fait ça permet de laisser plus d’acteurs accéder aux données.

Jean-Philippe Clément : Très bien.
On a fait une bonne première introduction à au sujet. Je vois que Jérôme est satisfait, il est désormais pleinement conscient de ce qu’est l'open data.
Je vous propose de faire une petite pause musicale, une petite pause très locale puisqu’on va écouter une chanteuse du 18e arrondissement, on a une convention particulière avec l’Arcom, on doit faire du local, donc on fait du local dans cette radio. On va écouter Victoria Flavian qui nous chante CHEERS.

Pause musicale : CHEERS par Victoria Flavian.

17’40

Jean-Philippe Clément : Merci Victoria Flavian. C’était CHEERS.