Différences entre les versions de « Quel rôle pour l'open data en temps de pandémie - Guillaume Rozier »

Version du 15 août 2021 à 09:10

Titre : Quel rôle pour l'open data en temps de pandémie ?

Intervenant·e·s : Guillaume Rozier - Claire

Lieu : Association 42l

Date : 6 mai 2021

Durée : 1 h 4 min

Vidéo

Présentation de la conférence

Licence de la transcription : Verbatim

Illustration :

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Description

Depuis près d'un an, le site internet CovidTracker est devenu la référence en matière de suivi des chiffres de la pandémie. À partir de données ouvertes et accessibles a tou·te·s, Guillaume Rozier, jeune data scientist, et son équipe de bénévoles, recensent chaque jour les chiffres de l'épidémie à travers courbes et graphiques. La plateforme, qui se voulait confidentielle, a ainsi su séduire non seulement le grand public, mais aussi les institutions, qu'elles soient ministérielles ou hospitalières, et devient, en moins d'un an, un véritable outil d'utilité publique, prenant le pas sur la communication officielle.

Transcription

Claire : On commence. On est vraiment super contents de vous recevoir aujourd’hui ??? pour aborder le sujet d’open data qu’on n’a pas l’habitude de pouvoir aborder à 42.
Pour les participants, je ne sais pas si le nom de Guillaume Rozier vous dit quelque chose, en tout cas je pense que c’est un peu inévitable, forcément, vous n’avez pas pu passer à côté de CovidTracker un outil qu’il a développé sur la dernière année.
Guillaume Rozier, pour vous présenter rapidement, vous êtes data scientist, vous venez de fêter vos 25 ans pile-poil il y a à peu près une semaine, donc bon anniversaire avec un peu de retard.

Guillaume Rozier : Exact. Merci.

Claire : Vous venez de Savoie. Pour votre parcours, vous avez fait une prépa TSI [technologie et sciences industrielles] à Grenoble. En 2016 vous avez intégré l’École d’ingénieurs TELECOM Nancy où vous vous spécialisez dans le big data avec une option « biomédical ». Et puis il y a eu mars 2020. C’est votre dernier semestre d’étude et, dans le monde, tout le monde commence à parler un petit peu du Covid. On voit que ça s’agite un petit peu du côté de nos voisins italiens. En France on n’est pas encore trop stressés, on regarde ça d’un œil un peu sceptique, on ne comprend pas trop, mais vous, vous commencez déjà à regarder les chiffres en Italie et en France, vous les comparez et vous voyez, en fait, que les courbes se superposent quasi parfaitement à huit/dix jours d’intervalle. À partir de là vous commencez à faire quelques graphiques que vous finissez par mettre un site pour automatiser un petit peu le processus. Au début vous vous dites « c’est bien, ça va faire un projet pour mon CV d’étudiant », finalement, un an après, c’est devenu la plateforme que c’est aujourd’hui.
Pour parler un petit peu de la plateforme aujourd’hui c’est neuf outils en tout. Ces derniers mois on a surtout entendu parler, évidemment, de CovidTracker mais aussi de VaccinTracker sur le suivi de la vaccination et Vite Ma Dose qui, aujourd’hui, est vraiment l’outil indétrônable puisque cet après-midi il a même promu par Emmanuel Macron, donc c’est la petite consécration, de l’outil en tout cas. On ne présente plus tous ces outils. Aujourd’hui, à côté, vous travaillez aussi comme consultant, en fait vous travaillez beaucoup depuis un an.
On va revenir peut-être un petit peu avec vous sur ce qu’est CovidTracker aujourd’hui ? Combien de personnes le visitent ? Combien de personnes le fabriquent ? Racontez-nous un petit peu, en deux mots, ce qu’est cet outil que vous construisez depuis un an.

Guillaume Rozier : Je vais juste réagir avant sur le côté open data, on peut se tutoyer, je pense.

Claire : On a le même âge en fait.

Guillaume Rozier : Tout à l’heure je ne sais plus qui a dit qu’on ne parle pas trop d’open data, etc. C’est marrant parce là je reviens d’une émission qui s’appelle Par Jupiter ! , sur France Inter pour ceux qui connaissent, c’est plutôt une émission littéraire, ce n’est pas du tout dans l’informatique, etc., et tout à l’heure j’étais à Par Jupiter ! en train de promouvoir l’open data. Ça m’a fait marrer. Si un jour on m’avait dit que j’aurais l’occasion de parler d’open data à la radio, en plus dans une émission comme celle-là, franchement je ne l’aurais jamais cru. C’est un plaisir pour moi et je pense que l’open data c’est hyper-important, c’est même crucial pour les prochaines années, l’open source de manière générale, mais notamment l’open data. Je considère que c’est vraiment un enjeu numérique des prochaines années.
Désolé, j’ai dévié un peu. Pour en revenir un peu à CovidTracker, aujourd’hui c’est toujours un site, malheureusement, qui permet de suivre l’épidémie, qui permet de savoir quelle est la gravité de l’épidémie mais surtout de contextualiser, de comprendre plus finement comment l’épidémie se développe dans chaque tranche d’âge, dans chaque département, dans chaque région et surtout quelle est la dynamique de l’épidémie. Finalement quel est le contexte, quelle est l’évolution de manière à essayer de mieux anticiper.
C’est parti de rien, comme tu l’as dit, c’est parti d’un graphique que j’ai fait en mars 2020 et qui était vraiment immonde, il n’était pas fait pour être partagé, mais que j’ai envoyé à quelques amis, du nombre de cas en France, en Italie. Je l’ai envoyé à ces gens-là et, en fait, ils étaient intéressés par ce graphique et ils voulaient que je fasse une mise à jour le lendemain, le surlendemain, le mettre à jour pour voir les nouvelles données. Et puis, de fil en aiguille, c’est devenu un site, mais un site vraiment hyper-basique, même au tout début, pour l’anecdote, c’était un read me de GitHub, c’est comme ça que ça a commencé, quelque part c’était la première version du site. Après ça s’est un peu amélioré, on a rajouté des fonctionnalités, ça a grossi, on a fait d’autres outils.
Là, au mois d’avril, on a dépassé les dix millions d’utilisateurs uniques. En termes de vues ça fait plus parce que les gens reviennent plusieurs fois et visionnent plusieurs pages, donc ça fait plusieurs dizaines de millions de vues au mois d’avril. C’est vrai que n’était pas du tout ni prévu ni anticipé et on a pu constater ce que c’était devenu vraiment cet automne, finalement c’était assez tard, c’était six/huit mois après la création du site qu’on s’est rendu compte de ce qu’il commençait à devenir, parce qu’en fait des hôpitaux ont commencé à l’utiliser, à nous appeler. Il y a un hôpital qui m’a appelé pour me dire « merci Guillaume d’avoir fait CovidTracker, on l’utilise tous les jours en cellule de crise ». C’ets là qu’on a vu qu’ill avait pris de l’ampleur. Pour moi, jusque-là, c’était un truc de niche que quelques personnes consultaient chez elles et là je me suis dit « en fait ça devient important, ça devient utile ».

Claire : Vous êtes combien aujourd’hui derrière ça ? J’imagine que vous avez un noyau dur de bénévoles et peut-être des satellites qui font parfois une pull-request ou ???

Guillaume Rozier : Exact. En fait ce n’était pas prévu, on ne s’est jamais projeté, enfin moi je ne me suis jamais projeté parce que je n’avais pas conscience de ce que c’était, je pensais que ce n’était pas grand-chose et je me disais quelque part quelqu’un d’autre va le faire, peut-être le gouvernement. Je ne viens pas du tout de l’univers du développement web, je n’avais jamais écrit une ligne de développement web, j’étais complètement incompétent en développement web et, dans ma tête, ce n’est pas à moi de faire ça.
Finalement, pendant plusieurs mois, je ne me suis jamais projeté, je ne me suis dit « tiens, je vais chercher une communauté, je vais chercher des devs, on va se mettre ensemble, on va faire un truc ouf, on va planifier, etc. », à aucun moment je ne me suis dit ça et finalement c’est très tardivement, en fin d’année 2020, que des personnes ont commencé à me proposer de l’aide et que j’ai accepté avec grand plaisir. Je me suis dit « allez, go, en fait ça a du sens, c’est utile, l’épidémie va malheureusement rester encore un peu », donc j’ai accepté l’aide. Donc depuis fin 2020 on est une dizaine, on va dire un noyau dur d’une dizaine de personnes pour CovidTracker. Pour les autres outils, par exemple Vite Ma Dose qu’on a lancé le premier avril, j’ai fait un peu un appel à développeurs sur Twitter et 110 personnes ont rejoint le truc, c’est absolument fou et sur les 110 une cinquantaine est très actives, ils sont actifs au quotidien.

Claire : C’est quel genre de profil les gens qui vous aident ? J’imagine que ce ne sont que des développeurs ou des créatifs peut-être.

Guillaume Rozier : Il y a beaucoup de développeurs, dans tous les domaines, parce que du coup il y a des back, il y a des front. Sur Vite Ma Dose il y en a qui ne sont même pas forcément dans le métier, pas forcément dans le domaine de l’informatique ou du dev, mais qui prennent de leur temps perso parce que ça les fait kiffer. On a aussi un graphiste, on a aussi des UX, des UI, des gens de la com’, des gens qui écrivent les newsletters, des gens qui font du ??? management. Oui, il y a un peu de tout. Des gens qui ne sont rien de spéciaux, Elias par exemple, je vais parler d’Élias, il est encore étudiant en école de commerce, il n’est ni dev ni com, etc., mais il aide, il donne des idées. Donc oui il y a vraiment de tout, même si on a une bonne majorité de devs parce que c’est quand même le cœur du projet au départ. Donc plusieurs dizaines de personnes.

Claire : Qui sont bénévoles et je voulais revenir là-dessus. Est-ce que la gratuité de votre service semblait aller de soi, du coup avoir un modèle derrière qui est celui de bénévoles et d’une communauté du Libre finalement ?

Guillaume Rozier : Oui pour ce projet-là. En fait, vu que ça touche à la santé, à l’épidémie, etc., on ne se sentait ni de rendre l’outil payant ni de mettre des pubs parce qu’on n’aime pas la pub et aussi parce ça attire l’attention. En fait on considère que c’est un service public donc ça doit rester gratuit et « pur » entre guillemets.
Après il nous tenait aussi à cœur que ça soit open source, notamment pour les questions de transparence et de crédibilité, enfin de confiance. On a envie que les gens aient confiance dans le site, donc on a envie que les gens puissent vérifier que les traitements qui sont faits derrière sont corrects, qu’il n’y a pas de biais, qu’il n’y a pas de données manipulées, etc.
Finalement aussi parce qu’on utilise des données qui sont en open data, les données de Santé publique France en très grande majorité, qui est l’administration qui surveille la santé publique en France, qui collecte les données par exemple le nombre de gens hospitalisés, le nombre de cas, etc. Ces données sont publiées en open data, donc, quelque part, on se sentait redevable : ces données sont publiées en open data donc nous aussi on doit faire un truc ouvert qui réutilise ces données-là. Donc voilà. C’est un beau cycle.

Claire : Du coup, justement, vous parliez de confiance en l’outil par rapport à l’outil ouvert. Ce qui est intéressant, quand on vous écoute, on vous entend dire, par exemple, que le fait d’avoir ces open data ça permet aussi, peut-être, de restaurer la confiance finalement dans les institutions, les gens qui les produisent parce que tout est vérifiable. Vous dites même que ça peut être une arme pour lutter contre le complotisme. Est-ce que vous pouvez développer un peu là-dessus, sur comment vous avez construit ça ?

Guillaume Rozier : Je pense que l’open data donne confiance à plusieurs niveaux.
Pour parler du complotisme, je dis même que c’est une arme contre le complotisme, la meilleure arme contre le complotisme. En fait il y a un peu plus d’un an, en mars 2020, quand un complotiste disait sur Twitter « le Covid ou la Covid – je ne sais pas – le ou la Covid n’existe pas il n’y a pas 20 000 cas par jour, etc. », qu’est-ce qu’on pouvait lui répondre à part « si, ça existe ; si, fais confiance au ministre de la Santé qui annonce 20 000 cas par jour », c’est tout, ce n’est pas très fort comme argument. Aujourd’hui tu lui dis « tu vas sur le site data-gouv.fr qui est la plateforme publique qui centralise l’open data en France, tu vas voir ou tu te branches à l’API pour avoir les données du nombre de cas dans ton département ou même dans ta communauté de communes – puisque ça va jusqu’à ce niveau de détail – dans ta tranche d’âge. Ensuite tu demandes à tous les laboratoires qui sont autour de chez toi et tu compares les deux chiffres. Tu verras directement si le gouvernement a modifié les données ou pas ». En fait les données ça devient vérifiable. Ça donne aussi la confiance et ça permet de comprendre et de mieux adhérer aux décisions qui sont prises. Ça permet de donner confiance dans les décisions qui sont prises. Les décisions sont prises sur des faits qui sont objectifs, donc ça permet de comprendre ces décisions, de comprendre pourquoi telle décision publique a été prise ou autre, donc de mieux y adhérer.
Finalement, en l’occurrence là dans l’épidémie, mais ça peut s’appliquer à plein d’autres domaines, ça permet aussi de mieux lutter contre l’épidémie puisque chacun peut évaluer la situation chez lui, dans son département, chacun peut voir la saturation des hôpitaux près de chez lui, etc., donc ça permet d’adapter son comportement donc de mieux lutter contre l’épidémie en fonction de la réalité de la situation. Beaucoup de gens trouvent ça très cool et me disent « merci, grâce à CovidTracker j’ai vu que la situation n’était pas bonne dans mon département, donc j’ai annulé mon anniversaire », ou l’inverse « j’ai vu que la situation était bonne dans mon département, donc je me suis permis de faire mon anniversaire alors que sinon je ne l’aurais peut-être pas fait ». Je trouve ça aussi très cool, ça permet peut-être de responsabiliser les gens et de ne pas attendre que les décisions soient prises par un politique. Responsabiliser les gens pour qu’ils se battent automatiquement.

Claire : Ce qui est intéressant c’est que, justement, les gens ne vont pas se référer à l’open data brute, ils vont choisir d’aller sur votre site. Bien sûr il y a la donnée brute, mais la donnée brute, quand on va regarder les sources ce sont des fichiers csv, ce n’est pas hyper-sexy quand on est néophyte de tomber là-dessus. Quel est, pour vous, l’enjeu de la visualisation des données dans la communication qu’on va faire justement au public des chiffres mis en open source, en open data.

12’ 45

Guillaume Rozier : En fait, d’une manière générale, c’est important. Il y a, par exemple, d’autres plateformes, il y a des plateformes officielles, il y a Géodes, il y a le flashboard d’Etalab qui s’est d’ailleurs bien amélioré, il est devenu cool. Géodes est l’outil officiel de Santé publique France pour accéder à différentes métriques. Aujourd’hui dans l’audience, dans les 31 personnes, qui connaît Géodes. Je pose la question, je ne pense pas qu’il y en ait beaucoup, alors que c’est le site officiel.

Claire : Pas beaucoup. Ah si !

Guillaume Rozier : Il y en a un qui connaît je pense. Ce sont des données brutes, ce n’est pas forcément hyper-intuitif, il faut aller naviguer dans les menus, même moi des fois je me perds, ce n’est pas tourné grand public. Donc un professionnel de santé, un médecin, un journaliste qui veut accéder à telle donnée très précise dans tel département oui, il va s’adapter. Mais un citoyen qui veut comprendre la situation épidémique chez lui sans trop réfléchir, etc., eh bien ce n’est pas fait pour lui, il va falloir qu’il navigue dans les boutons et le soir à 20 heures, après le taf, tu as envie de tout sauf de te creuser la tête pour savoir comment naviguer sur le site.
Je pense que pour le grand public il y a un besoin de pédagogie, c’est-à-dire quelque chose de compliqué de le rendre simple, de faire de la pédagogie, de clarifier, de guider, de dire « ça c’est plus important, ça c’est moins important, ça c’est grave, ça c’est moins grave », en fait faire une hiérarchisation de la donnée et une visualisation de la donnée qui est importante pour contextualiser, pour comprendre. Des fois tu as une information, avec un graphique en un coup d’œil tu la comprends, alors que si on te donne le tableau de données, il faut que tu réfléchisses dix minutes pour comprendre le phénomène. Donc oui, ce gros travail c’est aussi une hiérarchisation et une sélection des données. Quand tu vas sur CovidTracker – ce n’est pas du tout parfait, loin de là, il y a plein de défauts –, mais on a essayé de faire sur la page d’accueil qu’il y ait deux indicateurs, en gros tu as deux graphiques, alors que moi j’aurais eu envie d’en mettre 15 parce que j’estime que pour vraiment comprendre la situation il faut en regarder 15 en même temps. Mais la personne lambda qui ne s’intéresse pas forcément à la santé publique, qui ne s’intéresse pas forcément à l’épidémiologie, etc., qui a juste envie de savoir si ça va bien ou si ça ne va pas bien, elle n’a pas envie de voir 15 indicateurs sinon elle ne va même pas réfléchir, elle va partir et c’est tout. Donc des fois il faut un peu mâcher le travail et puis hiérarchiser et dire « si tu veux vraiment avoir un coup d’œil rapidement voilà les deux indicateurs, maintenant si tu veux mieux comprendre dans le détail, tu peux aller voir…». On voit à l’écran les indicateurs qu’on a mis, c’est juste des cas et la réanimation. Moi j’aurais envie d’en mettre des dizaines d’autres. Par exemple les réanimations ce sont les lits dans les réanimations. Mais c’est encore plus intéressant de regarder les admissions, c’est-à-dire les entrées quotidiennes en réanimation et puis de regarder le nombre de lits occupés à l’hôpital et les admissions à l’hôpital. Mais ça, déjà, ce sont quatre indicateurs. Si je mets quatre graphiques, l’utilisateur va être perdu. Au bout d’un moment il faut faire des choix.
Et puis des cartes. Naturellement il aimera mieux une carte pour comprendre en un coup d’œil une répartition géographique de données.

Claire : Du coup cette visualisation, bien sûr, touche le grand public, tout le monde qui a envie de se renseigner sur la question. Ce qui est hyper-intéressant et après je ne sais pas ce que vous en pensez, c’est que finalement, comme vous le disiez tout à l’heure, ça atteint carrément les institutions. C’est-à-dire que vous avez vraiment supplanté, en fait, les services du gouvernement. Je sais qu’on t’interroge quand même beaucoup là-dessus parce que forcément quelque part c’est hyper-réjouissant de voir un projet citoyen réussir à se faire entendre, mais d’un autre côté on se dit « mince, est-ce que ce n’est pas aussi le rôle de l’État de produire ce genre de choses ? » Qu’est-ce que tu penses du positionnement de CovidTracker là-dessus, que ce soit utilisé partout ?

Guillaume Rozier : Je n’ai pas de réponse. En tout cas j’ai plusieurs choses à dire.
D’abord oui, quand le premier hôpital m’a appelé pour me dire « merci CovidTracker », sur le coup j’étais hyper-content, c’est trop cool, mon site sert à quelque chose, etc. Ensuite, au bout de cinq minutes, je me suis dit « attends, tu as 24 ans, tu es étudiant, tu es en stage de fin d’études, tu n’es pas du tout développeur web. Sur ton temps perso, en quelques heures, tu as posé à l’arrache un site avec des technos nulles et tout et c’est ça qui est utilisé dans des hôpitaux pour éventuellement anticiper des besoins en matériel, anticiper des besoins humains, donc potentiellement, disons-le, sauver des vies, il y a peut-être un truc qui n’est pas normal ». Honnêtement je n’ai pas de réponse.

Claire : C’est aussi une responsabilité.

Guillaume Rozier : Oui, ça devient une responsabilité du coup. C’est sûr qu’il y a un an, quand il y avait un bug sur le site je disais « je regarde une bonne série, je dors et demain je le corrigerai ». Aujourd’hui non, s’il y a un bug, il faut le corriger maintenant, ça ne peut pas attendre.
Il y a eu beaucoup d’articles, il y a eu une réponse intéressante qui est venue sur Twitter je trouve, c’est de dire que finalement c’est peut-être le fonctionnement normal de l’open data, c’est-à-dire que l’État fait la chose qu’il est le seul à pouvoir faire, collecter des données de santé. Légalement on peut très difficilement le faire si on n’est pas l’État et puis, de toute façon, en tant que citoyen on n’a pas les ressources, moi-même je n’ai pas les ressources, ni humaines ni financières, pour le faire à sa place, donc collecter des données de santé. Par contre, ensuite, l’État doit être obligé de les agréger et surtout de les publier en open data avec un bon format, c‘est-à-dire pas en pdf, pas en image – je balance, mais comme ce que fait le ministère de l’Éducation nationale qui publie des données en pdf, il y a peu de choses qu’on puisse faire avec des pdf. Donc les publier en bon format, de façon exhaustive, avec des mises à jour quotidiennes. C’est important la fraîcheur des données, avec une bonne qualité, avec pas trop d’erreurs et j’en passe. C’est hyper-important de le faire, l’État doit le faire. Ensuite, de l’autre côté, tu as des citoyens, tu as des organisations publiques, des administrations, tu as aussi des organisations privées, des entreprises, qui peuvent s’emparer de ces données, les réutiliser et faire des outils, des sites, des produits, je n’en sais rien, qui sont utiles, qui sont innovants, créatifs et qui vont répondre à un réel besoin.
Je trouve aussi très intéressante, du coup, cette complémentarité entre l’État qui collecte les données, les stocke mais ensuite les publie – on voit bien l’importance de les publier – et, de l’autre côté, tous les autres qui réutilisent ces données et qui produisent de la valeur.

Claire : C’est intéressant que tu dises ça justement sur cette production de données. À mon avis c’est totalement spécifique à cette crise où, finalement, il y a un outil qui s’est imposé et qu’à un moment tu t’es retrouvé quasi dans un rapport de force avec le ministère à l’épisode de VaccinTracker. J’ai lu dans différents articles que, pendant une ou deux semaines, en fait tu étais la seule personne à avoir, par télégramme il me semble, les chiffres de la vaccination en France et qu’un jour c’est toi qui as dit, qui as posé, limite, un ultimatum à Olivier Véran, ce qui n’est quand même pas rien, en disant « soit ces données-là sont publiques soit moi j’arrête d’alimenter le site ». Donc ça montre quand même la puissance de l’outil à ce moment-là où tu es arrivé à être dans un raaport de force avec un ministère.

Guillaume Rozier : Oui. On a vu des articles « CovidTracker met la pression au gouvernement », il y a un article sur ??? qui avait dit ça. Non, on ne veut mettre la pression à personne !
Je ne sais pas exactement ce qui s’est passé au final. On a lancé VaccinTracker le 27 décembre quand Mauricette a été vaccinée, je pense qu’on se souvient tous de Mauricette qui se fait vacciner à la télé, c’est la première à se faire vacciner. Moi je vois ça à la télé, je me dis « mince, il faut un outil pour qu’on puisse comprendre comment avance la vaccination, à quelle vitesse, dans quels départements, par tranche d’âge, etc., donc voir où on est en est, quand est-ce que tout cela sera fini, etc. »
Donc j’ai commencé à développer ça et puis le soir, en fait, j’avais un truc qui était basique mais qui était prêt. Et là je me suis dit « en fait j’ai un petit problème, c’est qu’il n’y a pas de données », c’est-à-dire que le ministère ne nous dit pas combien de gens ont été vaccinés, combien de doses ont été livrées, en fait on ne sait rien. C’est fou !
On a quand même décidé de le sortir, mais sans données du coup. Donc on a décidé de collecter nous-mêmes les données. Concrètement on est allé voir les articles dans la presse régionale du type « Dans l’EPAD de Grenoble huit personnes ont été vaccinées aujourd’hui » et nous on a créé notamment un compteur, on faisait + 8. Et en fait, au bout de quelques jours, c’est devenu le compteur, enfin c’est seul compteur de vaccination qui, du coup, n’était pas du tout exhaustif, on ne pouvait pas compter toutes les personnes vaccinées, ce n’était pas possible, mais ça avait le mérite d’exister et c’était le seul. Donc les médias ont commencé à se baser dessus. BFM disait « 150 personnes ont été vaccinées, source VaccinTracker et tout ». Au bout de deux jours je reçois un coup de fil du directeur de cabinet d’Olivier Véran, le ministre de la Santé, pour m’expliquer plein de choses, entre autres me dire « si vous voulez on vous donne des données qui sont un peu plus exhaustives et officielles ». Moi j’ai dit « ouais, c’est trop cool, on ne veut que ça, je suis grave chaud. »
À partir de là, en fait, ils m’ont envoyé par message, ce n’était pas des données très exhaustives, tous les jours des nouvelles données, enfin presque tous les jours. Donc ce n’est pas trop mal, du coup on pouvait mettre à jour VaccinTracker avec des données qui étaient meilleures que celles que nous pouvions collecter.

Claire : Qui étaient nationales du coup ou qui étaient locales ?

Guillaume Rozier : Oui, tout à fait. Nationales, exact.
Après, au bout de quelques jours, on leur a dit « s’il vous plaît, publiez ces données. Genre faites un tweet, mettez un tableur sur le site du ministère, on s’en fout, mais faites un truc, publiez-les ! »
Ils n’y tenaient pas trop, ils ont continué avec des sms. Après on s’est rendu compte que moi j’avais des coups de fils de médias un peu énervés qui m’appelaient en disant « mais comment avez-vous ces données-là ? », je disais « c’est le cabinet du ministère de la Santé », ils me disaient « mais comment ça se fait ?, etc. », parce qu’en fait quand les médias demandaient les chiffres au ministère de la Santé, ils n’avaient pas de réponse, on leur disait « non, on ne communique pas les chiffres ».
En fait le ministère de la Santé ne donnait les chiffres qu’à nous, il ne les donnait pas aux médias, il ne les publiait pas.
Au bout des deux semaines on a dit « s’il vous plaît, on veut vraiment que vous publiiez les données », ce qu’ils n’ont pas fait. C’était un lundi, entre le 10 et le 15 janvier je pense, on a mis un message sur VaccinTracker et j’ai mis aussi un message sur Twitter en disant qu’à partir d’aujourd’hui on ne mettra à jour VaccinTracker qu’avec des données publiques, donc des données disponibles à tous. Coïncidence ou pas, on ne saura jamais, le soir ils ont fait le tout premier communiqué de presse avec le nombre de vaccinés, c’était la première fois qu’ils donnaient le nombre de vaccinés dans un communiqué de presse, et détaillé par région, de mémoire, à 23 heures 30, on ne fait pas trop de communiqués de presse à 23 heures 30. Et le lendemain l’open data était en place, c’est-à-dire que sur data.gouv.fr il y avait tous les fichiers avec les vaccinations par région je crois, je ne sais plus ce qu’il y avait exactement, mais c’était beaucoup mieux. On n’avait rien avant donc c’était forcément mieux, mais il y avait des choses.

Claire : C’est incroyable !

Guillaume Rozier : On ne saura jamais si ça a eu un effet ou pas. Ce qui compte c’est qu’on ait l’open data et aujourd’hui on l’a.

Claire : Là c’est un exemple quand même assez incroyable, en tout cas c’est une aubaine, c’est un peu triste d’avoir besoin d’une pandémie mondiale pour avoir des données de santé en open data. Est-ce que vous pensez, est-ce que vous voyez ça d’un bon œil pour la suite ? Est-ce que vous pensez que ça peut éventuellement changer des choses ?

Guillaume Rozier : Oui. En tout cas je pense que ça a permis à certaines administrations de prendre conscience de l’importance de l’open data. L’open data ce n’est pas nouveau, Etalab qui est l’organisation, en France, qui organise ça a été créée en 2010, donc ça fait quand même du temps. Il y a une loi, pour une République numérique, qui est passée en 2016, ça fait quand même déjà cinq ans. Cette loi, en fait, normalement elle change le paradigme : jusque-là, en gros, c’était les administrations ne publient aucune donnée de base, la norme c’est qu’on ne publie rien sauf, éventuellement, tel jeu de données qui peut être intéressant. La loi de 2016, pour une République numérique, normalement elle avait pour objectif de dire que la norme, à partir de maintenant, c’est de publier les données sauf, évidemment, celles qui peuvent poser des problèmes au niveau ré-identification, vie privée, etc., c’est bien normal.
Force est de constater que ce nouveau paradigme n’est pas forcément accepté, appliqué, implémenté par tout le monde, par toutes les administrations. Jusque-là, en fait, l’open data était quand même relativement abstraite, je suis peut-être un peu dur en disant ça, mais des personnes qui ne sont pas dans l’informatique se disaient « à quoi ça sert l’open data ? Ça ne sert à rien ». Le fait d’avoir ces initiatives ça permet de rendre tangible, de matérialiser vraiment, de voir l’intérêt de l’open data de façon très concrète. Je pense que ça aide à faire bouger un peu les mentalités. D’ailleurs, au niveau politique, ça semble bouger. Il y a un rapport d’un député qui s’appelle Éric Bothorel, un gros rapport.

Claire : Et une circulaire qui est passée il y a six jours.

Guillaume Rozier : Exact. En fait, il a fait un gros rapport en 2020 sur l’open data pour dire ce qu’est l’open data, à quoi ça peut servir et avec des recommandations. D’ailleurs il m’avait interrogé, en tant que créateur de CovidTracker, pour participer au rapport qu’il a remis au Premier ministre en décembre, je crois. Sur la base de ce rapport, le Premier ministre a fait passer une circulaire, comme tu l’as dit la semaine dernière, en gros pour établir une roadmap de l’open data en France et, en gros, il a demandé à tous les ministères de passer la seconde sur l’open data, même de nommer je crois un référent open data dans chaque ministère, de proposer, d’ici juin je crois, la liste de toutes les données qui seraient publiées par chaque ministère, etc. Donc je pense que là on va avoir un réel coup d’accélérateur, j’espère cette année ou l’an prochain, que ça va être très cool parce que, du coup, il y a des données qui n’ont jamais été publiées, qui vont être publiées. Et ça a commencé. L’IGN, la cartographie en France, l’Institut national géographique a mis en open data toutes ses données en janvier, je crois, donc ça a commencé et ça va continuer. Je crois que Météo France, cette année ou l’an prochain, va mettre plein de trucs en open data, donc ça va bouger. Ça peut être très cool parce qu’il y a des données qui n’ont jamais été publiées. Imaginez tout ce qu’on fait faire avec ça, on peut faire des corrélations entre la météo, la santé, on peut faire des trucs vraiment très cool.

27‘ 44

Claire : Du coup vous avez justement voulu

@@ Ligne 72 : / Ligne 72 : @@
 ==12’ 45==
-<b>Guillaume Rozier : </b>En fait, d’une manière générale,
+<b>Guillaume Rozier : </b>En fait, d’une manière générale, c’est important. Il y a, par exemple, d’autres plateformes, il y a des plateformes officielles, il y a Géodes, il y a le <em>flashboard</em> d’Etalab qui s’est d’ailleurs bien amélioré, il est devenu cool. Géodes est l’outil officiel de Santé publique France pour accéder à différentes métriques. Aujourd’hui dans l’audience, dans les 31 personnes, qui connaît Géodes. Je pose la question, je ne pense pas qu’il y en ait beaucoup, alors que c’est le site officiel.
+<b>Claire : </b>Pas beaucoup. Ah si !
+<b>Guillaume Rozier : </b>Il y en a un qui connaît je pense. Ce sont des données brutes, ce n’est pas forcément hyper-intuitif, il faut aller naviguer dans les menus, même moi des fois je me perds, ce n’est pas tourné grand public. Donc un professionnel de santé, un médecin, un journaliste qui veut accéder à telle donnée très précise dans tel département oui, il va s’adapter. Mais un citoyen qui veut comprendre la situation épidémique chez lui sans trop réfléchir, etc., eh bien ce n’est pas fait pour lui, il va falloir qu’il navigue dans les boutons et le soir à 20 heures, après le taf, tu as envie de tout sauf de te creuser la tête pour savoir comment naviguer sur le site.<br/>
+Je pense que pour le grand public il y a un besoin de pédagogie, c’est-à-dire quelque chose de compliqué de le rendre simple, de faire de la pédagogie, de clarifier, de guider, de dire « ça c’est plus important, ça c’est moins important, ça c’est grave, ça c’est moins grave », en fait faire une hiérarchisation de la donnée et une visualisation de la donnée qui est importante pour contextualiser, pour comprendre. Des fois tu as une information, avec un graphique en un coup d’œil tu la comprends, alors que si on te donne le tableau de données, il faut que tu réfléchisses dix minutes pour comprendre le phénomène. Donc oui, ce gros travail c’est aussi une hiérarchisation et une sélection des données. Quand tu vas sur CovidTracker – ce n’est pas du tout parfait, loin de là, il y a plein de défauts –, mais on a essayé de faire sur la page d’accueil qu’il y ait deux indicateurs, en gros tu as deux graphiques, alors que moi j’aurais eu envie d’en mettre 15 parce que j’estime que pour vraiment comprendre la situation il faut en regarder 15 en même temps. Mais la personne lambda qui ne s’intéresse pas forcément à la santé publique, qui ne s’intéresse pas forcément à l’épidémiologie, etc., qui a juste envie de savoir si ça va bien ou si ça ne va pas bien, elle n’a pas envie de voir 15 indicateurs sinon elle ne va même pas réfléchir, elle va partir et c’est tout. Donc des fois il faut un peu mâcher le travail et puis hiérarchiser et dire « si tu veux vraiment avoir un coup d’œil rapidement voilà les deux indicateurs, maintenant si tu veux mieux comprendre dans le détail, tu peux aller voir…». On voit à l’écran les indicateurs qu’on a mis, c’est juste des cas et la réanimation. Moi j’aurais envie d’en mettre des dizaines d’autres. Par exemple les réanimations ce sont les lits dans les réanimations. Mais c’est encore plus intéressant de regarder les admissions, c’est-à-dire les entrées quotidiennes en réanimation et puis de regarder le nombre de lits occupés à l’hôpital et les admissions à l’hôpital. Mais ça, déjà, ce sont quatre indicateurs. Si je mets quatre graphiques, l’utilisateur va être perdu. Au bout d’un moment il faut faire des choix.<br/>
+Et puis des cartes. Naturellement il aimera mieux une carte pour comprendre en un coup d’œil une répartition géographique de données.
+<b>Claire : </b>Du coup cette visualisation, bien sûr, touche le grand public, tout le monde qui a envie de se renseigner sur la question. Ce qui est hyper-intéressant et après je ne sais pas ce que vous en pensez, c’est que finalement, comme vous le disiez tout à l’heure, ça atteint carrément les institutions. C’est-à-dire que vous avez vraiment supplanté, en fait, les services du gouvernement. Je sais qu’on t’interroge quand même beaucoup là-dessus parce que forcément quelque part c’est hyper-réjouissant de voir un projet citoyen réussir à se faire entendre, mais d’un autre côté on se dit « mince, est-ce que ce n’est pas aussi le rôle de l’État de produire ce genre de choses ? » Qu’est-ce que tu penses du positionnement de CovidTracker là-dessus, que ce soit utilisé partout ?
+<b>Guillaume Rozier : </b>Je n’ai pas de réponse. En tout cas j’ai plusieurs choses à dire.<br/>
+D’abord oui, quand le premier hôpital m’a appelé pour me dire « merci CovidTracker », sur le coup j’étais hyper-content, c’est trop cool, mon site sert à quelque chose, etc. Ensuite, au bout de cinq minutes, je me suis dit « attends, tu as 24 ans, tu es étudiant, tu es en stage de fin d’études, tu n’es pas du tout développeur web. Sur ton temps perso, en quelques heures, tu as posé à l’arrache un site avec des technos nulles et tout et c’est ça qui est utilisé dans des hôpitaux pour éventuellement anticiper des besoins en matériel, anticiper des besoins humains, donc potentiellement, disons-le, sauver des vies, il y a peut-être un truc qui n’est pas normal ». Honnêtement je n’ai pas de réponse.
+<b>Claire : </b>C’est aussi une responsabilité.
+<b>Guillaume Rozier : </b>Oui, ça devient une responsabilité du coup. C’est sûr qu’il y a un an, quand il y avait un bug sur le site je disais « je regarde une bonne série, je dors et demain je le corrigerai ». Aujourd’hui non, s’il y a un bug, il faut le corriger maintenant, ça ne peut pas attendre.<br/>
+Il y a eu beaucoup d’articles, il y a eu une réponse intéressante qui est venue sur Twitter je trouve, c’est de dire que finalement c’est peut-être le fonctionnement normal de l’<em>open data</em>, c’est-à-dire que l’État fait la chose qu’il est le seul à pouvoir faire, collecter des données de santé. Légalement on peut très difficilement le faire si on n’est pas l’État et puis, de toute façon, en tant que citoyen on n’a pas les ressources, moi-même je n’ai pas les ressources, ni humaines ni financières, pour le faire à sa place, donc collecter des données de santé. Par contre, ensuite, l’État doit être obligé de les agréger et surtout de les publier en <em>open data</em> avec un bon format, c‘est-à-dire pas en pdf, pas en image – je balance, mais comme ce que fait le ministère de l’Éducation nationale qui publie des données en pdf, il y a peu de choses qu’on puisse faire avec des pdf. Donc les publier en bon format, de façon exhaustive, avec des mises à jour quotidiennes. C’est important la fraîcheur des données, avec une bonne qualité, avec pas trop d’erreurs et j’en passe. C’est hyper-important de le faire, l’État doit le faire. Ensuite, de l’autre côté, tu as des citoyens, tu as des organisations publiques, des administrations, tu as aussi des organisations privées, des entreprises, qui peuvent s’emparer de ces données, les réutiliser et faire des outils, des sites, des produits, je n’en sais rien, qui sont utiles, qui sont innovants, créatifs et qui vont répondre à un réel besoin.<br/>
+Je trouve aussi très intéressante, du coup, cette complémentarité entre l’État qui collecte les données, les stocke mais ensuite les publie – on voit bien l’importance de les publier – et, de l’autre côté, tous les autres qui réutilisent ces données et qui produisent de la valeur.
+<b>Claire : </b>C’est intéressant que tu dises ça justement sur cette production de données. À mon avis c’est totalement spécifique à cette crise où, finalement, il y a un outil qui s’est imposé et qu’à un moment tu t’es retrouvé quasi dans un rapport de force avec le ministère à l’épisode de VaccinTracker. J’ai lu dans différents articles que, pendant une ou deux semaines, en fait tu étais la seule personne à avoir, par télégramme il me semble, les chiffres de la vaccination en France et qu’un jour c’est toi qui as dit, qui as posé, limite, un ultimatum à Olivier Véran, ce qui n’est quand même pas rien, en disant « soit ces données-là sont publiques soit moi j’arrête d’alimenter le site ». Donc ça montre quand même la puissance de l’outil à ce moment-là où tu es arrivé à être dans un raaport de force avec un ministère.
+<b>Guillaume Rozier : </b>Oui. On a vu des articles « CovidTracker met la pression au gouvernement », il y a un article sur ??? qui avait dit ça. Non, on ne veut mettre la pression à personne !<br/>
+Je ne sais pas exactement ce qui s’est passé au final. On a lancé VaccinTracker le 27 décembre quand Mauricette a été vaccinée, je pense qu’on se souvient tous de Mauricette qui se fait vacciner à la télé, c’est la première à se faire vacciner. Moi je vois ça à la télé, je me dis « mince, il faut un outil pour qu’on puisse comprendre comment avance la vaccination, à quelle vitesse, dans quels départements, par tranche d’âge, etc., donc voir où on est en est, quand est-ce que tout cela sera fini, etc. »<br/>
+Donc j’ai commencé à développer ça et puis le soir, en fait, j’avais un truc qui était basique mais qui était prêt. Et là je me suis dit « en fait j’ai un petit problème, c’est qu’il n’y a pas de données », c’est-à-dire que le ministère ne nous dit pas combien de gens ont été vaccinés, combien de doses ont été livrées, en fait on ne sait rien. C’est fou !<br/>
+On a quand même décidé de le sortir, mais sans données du coup. Donc on a décidé de collecter nous-mêmes les données. Concrètement on est allé voir les articles dans la presse régionale du type « Dans l’EPAD de Grenoble huit personnes ont été vaccinées aujourd’hui » et nous on a créé notamment un compteur, on faisait + 8. Et en fait, au bout de quelques jours, c’est devenu le compteur, enfin c’est seul compteur de vaccination qui, du coup, n’était pas du tout exhaustif, on ne pouvait pas compter toutes les personnes vaccinées, ce n’était pas possible, mais ça avait le mérite d’exister et c’était le seul. Donc les médias ont commencé à se baser dessus. BFM disait « 150 personnes ont été vaccinées, source VaccinTracker et tout ». Au bout de deux jours je reçois un coup de fil du directeur de cabinet d’Olivier Véran, le ministre de la Santé, pour m’expliquer plein de choses, entre autres me dire « si vous voulez on vous donne des données qui sont un peu plus exhaustives et officielles ». Moi j’ai dit « ouais, c’est trop cool, on ne veut que ça, je suis grave chaud. »<br/>
+À partir de là, en fait, ils m’ont envoyé par message, ce n’était pas des données très exhaustives, tous les jours des nouvelles données, enfin presque tous les jours. Donc ce n’est pas trop mal, du coup on pouvait mettre à jour VaccinTracker avec des données qui étaient meilleures que celles que nous pouvions collecter.
+<b>Claire : </b>Qui étaient nationales du coup ou qui étaient locales ?
+<b>Guillaume Rozier : </b>Oui, tout à fait. Nationales, exact.<br/>
+Après, au bout de quelques jours, on leur a dit « s’il vous plaît, publiez ces données. Genre faites un tweet, mettez un tableur sur le site du ministère, on s’en fout, mais faites un truc, publiez-les ! »<br/>
+Ils n’y tenaient pas trop, ils ont continué avec des sms. Après on s’est rendu compte que moi j’avais des coups de fils de médias un peu énervés qui m’appelaient en disant « mais comment avez-vous ces données-là ? », je disais « c’est le cabinet du ministère de la Santé », ils me disaient « mais comment ça se fait ?, etc. », parce qu’en fait quand les médias demandaient les chiffres au ministère de la Santé, ils n’avaient pas de réponse, on leur disait « non, on ne communique pas les chiffres ».<br/>
+En fait le ministère de la Santé ne donnait les chiffres qu’à nous, il ne les donnait pas aux médias, il ne les publiait pas.<br/>
+Au bout des deux semaines on a dit « s’il vous plaît, on veut vraiment que vous publiiez les données », ce qu’ils n’ont pas fait. C’était un lundi, entre le 10 et le 15 janvier je pense, on a mis un message sur VaccinTracker et j’ai mis aussi un message sur Twitter en disant qu’à partir d’aujourd’hui on ne mettra à jour VaccinTracker qu’avec des données publiques, donc des données disponibles à tous. Coïncidence ou pas, on ne saura jamais, le soir ils ont fait le tout premier communiqué de presse avec le nombre de vaccinés, c’était la première fois qu’ils donnaient le nombre de vaccinés dans un communiqué de presse, et détaillé par région, de mémoire, à 23 heures 30, on ne fait pas trop de communiqués de presse à 23 heures 30. Et le lendemain l’<em>open data</em> était en place, c’est-à-dire que sur data.gouv.fr il y avait tous les fichiers avec les vaccinations par région je crois, je ne sais plus ce qu’il y avait exactement, mais c’était beaucoup mieux. On n’avait rien avant donc c’était forcément mieux, mais il y avait des choses.
+<b>Claire : </b>C’est incroyable !
+<b>Guillaume Rozier : </b>On ne saura jamais si ça a eu un effet ou pas. Ce qui compte c’est qu’on ait l’<em>open data</em> et aujourd’hui on l’a.
+<b>Claire : </b>Là c’est un exemple quand même assez incroyable, en tout cas c’est une aubaine, c’est un peu triste d’avoir besoin d’une pandémie mondiale pour avoir des données de santé en <em>open data</em>. Est-ce que vous pensez, est-ce que vous voyez ça d’un bon œil pour la suite ? Est-ce que vous pensez que ça peut éventuellement changer des choses ?
+<b>Guillaume Rozier : </b>Oui. En tout cas je pense que ça a permis à certaines administrations de prendre conscience de l’importance de l’<em>open data</em>. L’<em>open data</em> ce n’est pas nouveau, Etalab qui est l’organisation, en France, qui organise ça a été créée en 2010, donc ça fait quand même du temps. Il y a une loi, pour une République numérique, qui est passée en 2016, ça fait quand même déjà cinq ans. Cette loi, en fait, normalement elle change le paradigme : jusque-là, en gros, c’était les administrations ne publient aucune donnée de base, la norme c’est qu’on ne publie rien sauf, éventuellement, tel jeu de données qui peut être intéressant. La loi de 2016, pour une République numérique, normalement elle avait pour objectif de dire que la norme, à partir de maintenant, c’est de publier les données sauf, évidemment, celles qui peuvent poser des problèmes au niveau ré-identification, vie privée, etc., c’est bien normal.<br/>
+Force est de constater que ce nouveau paradigme n’est pas forcément accepté, appliqué, implémenté par tout le monde, par toutes les administrations. Jusque-là, en fait, l’<em>open data</em> était quand même relativement abstraite, je suis peut-être un peu dur en disant ça, mais des personnes qui ne sont pas dans l’informatique se disaient « à quoi ça sert l’<em>open data</em> ? Ça ne sert à rien ». Le fait d’avoir ces initiatives ça permet de rendre tangible, de matérialiser vraiment, de voir l’intérêt de l’<em>open data</em> de façon très concrète. Je pense que ça aide à faire bouger un peu les mentalités. D’ailleurs, au niveau politique, ça semble bouger. Il y a un rapport d’un député qui s’appelle Éric Bothorel, un gros rapport.
+<b>Claire : </b>Et une circulaire qui est passée il y a six jours.
+<b>Guillaume Rozier : </b>Exact. En fait, il a fait un gros rapport en 2020 sur l’<em>open data</em> pour dire ce qu’est l’<em>open data</em>, à quoi ça peut servir et avec des recommandations. D’ailleurs il m’avait interrogé, en tant que créateur de CovidTracker, pour participer au rapport qu’il a remis au Premier ministre en décembre, je crois. Sur la base de ce rapport, le Premier ministre a fait passer une circulaire, comme tu l’as dit la semaine dernière, en gros pour établir une <em>roadmap</em> de l’<em>open data</em> en France et, en gros, il a demandé à tous les ministères de passer la seconde sur l’<em>open data</em>, même de nommer je crois un référent <em>open data</em> dans chaque ministère, de proposer, d’ici juin je crois, la liste de toutes les données qui seraient publiées par chaque ministère, etc. Donc je pense que là on va avoir un réel coup d’accélérateur, j’espère cette année ou l’an prochain, que ça va être très cool parce que, du coup, il y a des données qui n’ont jamais été publiées, qui vont être publiées. Et ça a commencé. L’IGN, la cartographie en France, l’Institut national géographique a mis en <em>open data</em> toutes ses données en janvier, je crois, donc ça a commencé et ça va continuer. Je crois que Météo France, cette année ou l’an prochain, va mettre plein de trucs en <em>open data</em>, donc ça va bouger. Ça peut être très cool parce qu’il y a des données qui n’ont jamais été publiées. Imaginez tout ce qu’on fait faire avec ça, on peut faire des corrélations entre la météo, la santé, on peut faire des trucs vraiment très cool.
+==27‘ 44==
+<b>Claire : </b>Du coup vous avez justement voulu

Différences entre les versions de « Quel rôle pour l'open data en temps de pandémie - Guillaume Rozier »

Version du 15 août 2021 à 09:10

Sommaire

Description

Transcription

12’ 45

27‘ 44

Menu de navigation

Actions de la page

Actions de la page

Outils personnels

Navigation

Outils

Rechercher

Différences entre les versions de « Quel rôle pour l'open data en temps de pandémie - Guillaume Rozier »

Version du 15 août 2021 à 09:10

Description

Transcription

12’ 45

27‘ 44

Menu de navigation

Rechercher

Différences entre les versions de « Quel rôle pour l'open data en temps de pandémie - Guillaume Rozier »