Quel rôle pour l'open data en temps de pandémie - Guillaume Rozier

De April MediaWiki
Révision datée du 15 août 2021 à 07:39 par Morandim (discussion | contributions) (Page créée avec « Catégorie:Transcriptions '''Titre :''' Quel rôle pour l'open data en temps de pandémie ? '''Intervenant·e·s :''' Guillaume Rozier - Claire '''Lieu :''' Assoc... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)


Titre : Quel rôle pour l'open data en temps de pandémie ?

Intervenant·e·s : Guillaume Rozier - Claire

Lieu : Association 42l

Date : 6 mai 2021

Durée : 1 h 4 min

Vidéo

Présentation de la conférence

Licence de la transcription : Verbatim

Illustration :

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Description

Depuis près d'un an, le site internet CovidTracker est devenu la référence en matière de suivi des chiffres de la pandémie. À partir de données ouvertes et accessibles a tou·te·s, Guillaume Rozier, jeune data scientist, et son équipe de bénévoles, recensent chaque jour les chiffres de l'épidémie à travers courbes et graphiques. La plateforme, qui se voulait confidentielle, a ainsi su séduire non seulement le grand public, mais aussi les institutions, qu'elles soient ministérielles ou hospitalières, et devient, en moins d'un an, un véritable outil d'utilité publique, prenant le pas sur la communication officielle.

Transcription

Claire : On commence. On est vraiment super contents de vous recevoir aujourd’hui ??? pour aborder le sujet d’open data qu’on n’a pas l’habitude de pouvoir aborder à 42.
Pour les participants, je ne sais pas si le nom de Guillaume Rozier vous dit quelque chose, en tout cas je pense que c’est un peu inévitable, forcément, vous n’avez pas pu passer à côté de CovidTracker un outil qu’il a développé sur la dernière année.
Guillaume Rozier, pour vous présenter rapidement, vous êtes data scientist, vous venez de fêter vos 25 ans pile-poil il y a à peu près une semaine, donc bon anniversaire avec un peu de retard.

Guillaume Rozier : Exact. Merci.

Claire : Vous venez de Savoie. Pour votre parcours, vous avez fait une prépa TSI [technologie et sciences industrielles] à Grenoble. En 2016 vous avez intégré l’École d’ingénieurs TELECOM Nancy où vous vous spécialisez dans le big data avec une option « biomédical ». Et puis il y a eu mars 2020. C’est votre dernier semestre d’étude et, dans le monde, tout le monde commence à parler un petit peu du Covid. On voit que ça s’agite un petit peu du côté de nos voisins italiens. En France on n’est pas encore trop stressés, on regarde ça d’un œil un peu sceptique, on ne comprend pas trop, mais vous, vous commencez déjà à regarder les chiffres en Italie et en France, vous les comparez et vous voyez, en fait, que les courbes se superposent quasi parfaitement à huit/dix jours d’intervalle. À partir de là vous commencez à faire quelques graphiques que vous finissez par mettre un site pour automatiser un petit peu le processus. Au début vous vous dites « c’est bien, ça va faire un projet pour mon CV d’étudiant », finalement, un an après, c’est devenu la plateforme que c’est aujourd’hui.
Pour parler un petit peu de la plateforme aujourd’hui c’est neuf outils en tout. Ces derniers mois on a surtout entendu parler, évidemment, de CovidTracker mais aussi de VaccinTracker sur le suivi de la vaccination et Vite Ma Dose qui, aujourd’hui, est vraiment l’outil indétrônable puisque cet après-midi il a même promu par Emmanuel Macron, donc c’est la petite consécration, de l’outil en tout cas. On ne présente plus tous ces outils. Aujourd’hui, à côté, vous travaillez aussi comme consultant, en fait vous travaillez beaucoup depuis un an.
On va revenir peut-être un petit peu avec vous sur ce qu’est CovidTracker aujourd’hui ? Combien de personnes le visitent ? Combien de personnes le fabriquent ? Racontez-nous un petit peu, en deux mots, ce qu’est cet outil que vous construisez depuis un an.

Guillaume Rozier : Je vais juste réagir avant sur le côté open data, on peut se tutoyer, je pense.

Claire : On a le même âge en fait.

Guillaume Rozier : Tout à l’heure je ne sais plus qui a dit qu’on ne parle pas trop d’open data, etc. C’est marrant parce là je reviens d’une émission qui s’appelle Par Jupiter ! , sur France Inter pour ceux qui connaissent, c’est plutôt une émission littéraire, ce n’est pas du tout dans l’informatique, etc., et tout à l’heure j’étais à Par Jupiter ! en train de promouvoir l’open data. Ça m’a fait marrer. Si un jour on m’avait dit que j’aurais l’occasion de parler d’open data à la radio, en plus dans une émission comme celle-là, franchement je ne l’aurais jamais cru. C’est un plaisir pour moi et je pense que l’open data c’est hyper-important, c’est même crucial pour les prochaines années, l’open source de manière générale, mais notamment l’open data. Je considère que c’est vraiment un enjeu numérique des prochaines années.
Désolé, j’ai dévié un peu. Pour en revenir un peu à CovidTracker, aujourd’hui c’est toujours un site, malheureusement, qui permet de suivre l’épidémie, qui permet de savoir quelle est la gravité de l’épidémie mais surtout de contextualiser, de comprendre plus finement comment l’épidémie se développe dans chaque tranche d’âge, dans chaque département, dans chaque région et surtout quelle est la dynamique de l’épidémie. Finalement quel est le contexte, quelle est l’évolution de manière à essayer de mieux anticiper.
C’est parti de rien, comme tu l’as dit, c’est parti d’un graphique que j’ai fait en mars 2020 et qui était vraiment immonde, il n’était pas fait pour être partagé, mais que j’ai envoyé à quelques amis, du nombre de cas en France, en Italie. Je l’ai envoyé à ces gens-là et, en fait, ils étaient intéressés par ce graphique et ils voulaient que je fasse une mise à jour le lendemain, le surlendemain, le mettre à jour pour voir les nouvelles données. Et puis, de fil en aiguille, c’est devenu un site, mais un site vraiment hyper-basique, même au tout début, pour l’anecdote, c’était un read me de GitHub, c’est comme ça que ça a commencé, quelque part c’était la première version du site. Après ça s’est un peu amélioré, on a rajouté des fonctionnalités, ça a grossi, on a fait d’autres outils.
Là, au mois d’avril, on a dépassé les dix millions d’utilisateurs uniques. En termes de vues ça fait plus parce que les gens reviennent plusieurs fois et visionnent plusieurs pages, donc ça fait plusieurs dizaines de millions de vues au mois d’avril. C’est vrai que n’était pas du tout ni prévu ni anticipé et on a pu constater ce que c’était devenu vraiment cet automne, finalement c’était assez tard, c’était six/huit mois après la création du site qu’on s’est rendu compte de ce qu’il commençait à devenir, parce qu’en fait des hôpitaux ont commencé à l’utiliser, à nous appeler. Il y a un hôpital qui m’a appelé pour me dire « merci Guillaume d’avoir fait CovidTracker, on l’utilise tous les jours en cellule de crise ». C’ets là qu’on a vu qu’ill avait pris de l’ampleur. Pour moi, jusque-là, c’était un truc de niche que quelques personnes consultaient chez elles et là je me suis dit « en fait ça devient important, ça devient utile ».

Claire : Vous êtes combien aujourd’hui derrière ça ? J’imagine que vous avez un noyau dur de bénévoles et peut-être des satellites qui font parfois une pull-request ou ???

Guillaume Rozier : Exact. En fait ce n’était pas prévu, on ne s’est jamais projeté, enfin moi je ne me suis jamais projeté parce que je n’avais pas conscience de ce que c’était, je pensais que ce n’était pas grand-chose et je me disais quelque part quelqu’un d’autre va le faire, peut-être le gouvernement. Je ne viens pas du tout de l’univers du développement web, je n’avais jamais écrit une ligne de développement web, j’étais complètement incompétent en développement web et, dans ma tête, ce n’est pas à moi de faire ça.
Finalement, pendant plusieurs mois, je ne me suis jamais projeté, je ne me suis dit « tiens, je vais chercher une communauté, je vais chercher des devs, on va se mettre ensemble, on va faire un truc ouf, on va planifier, etc. », à aucun moment je ne me suis dit ça et finalement c’est très tardivement, en fin d’année 2020, que des personnes ont commencé à me proposer de l’aide et que j’ai accepté avec grand plaisir. Je me suis dit « allez, go, en fait ça a du sens, c’est utile, l’épidémie va malheureusement rester encore un peu », donc j’ai accepté l’aide. Donc depuis fin 2020 on est une dizaine, on va dire un noyau dur d’une dizaine de personnes pour CovidTracker. Pour les autres outils, par exemple Vite Ma Dose qu’on a lancé le premier avril, j’ai fait un peu un appel à développeurs sur Twitter et 110 personnes ont rejoint le truc, c’est absolument fou et sur les 110 une cinquantaine est très actives, ils sont actifs au quotidien.

Claire : C’est quel genre de profil les gens qui vous aident ? J’imagine que ce ne sont que des développeurs ou des créatifs peut-être.

Guillaume Rozier : Il y a beaucoup de développeurs, dans tous les domaines, parce que du coup il y a des back, il y a des front. Sur Vite Ma Dose il y en a qui ne sont même pas forcément dans le métier, pas forcément dans le domaine de l’informatique ou du dev, mais qui prennent de leur temps perso parce que ça les fait kiffer. On a aussi un graphiste, on a aussi des UX, des UI, des gens de la com’, des gens qui écrivent les newsletters, des gens qui font du ??? management. Oui, il y a un peu de tout. Des gens qui ne sont rien de spéciaux, Elias par exemple, je vais parler d’Élias, il est encore étudiant en école de commerce, il n’est ni dev ni com, etc., mais il aide, il donne des idées. Donc oui il y a vraiment de tout, même si on a une bonne majorité de devs parce que c’est quand même le cœur du projet au départ. Donc plusieurs dizaines de personnes.

Claire : Qui sont bénévoles et je voulais revenir là-dessus. Est-ce que la gratuité de votre service semblait aller de soi, du coup avoir un modèle derrière qui est celui de bénévoles et d’une communauté du Libre finalement ?

Guillaume Rozier : Oui pour ce projet-là. En fait, vu que ça touche à la santé, à l’épidémie, etc., on ne se sentait ni de rendre l’outil payant ni de mettre des pubs parce qu’on n’aime pas la pub et aussi parce ça attire l’attention. En fait on considère que c’est un service public donc ça doit rester gratuit et « pur » entre guillemets.
Après il nous tenait aussi à cœur que ça soit open source, notamment pour les questions de transparence et de crédibilité, enfin de confiance. On a envie que les gens aient confiance dans le site, donc on a envie que les gens puissent vérifier que les traitements qui sont faits derrière sont corrects, qu’il n’y a pas de biais, qu’il n’y a pas de données manipulées, etc.
Finalement aussi parce qu’on utilise des données qui sont en open data, les données de Santé publique France en très grande majorité, qui est l’administration qui surveille la santé publique en France, qui collecte les données par exemple le nombre de gens hospitalisés, le nombre de cas, etc. Ces données sont publiées en open data, donc, quelque part, on se sentait redevable : ces données sont publiées en open data donc nous aussi on doit faire un truc ouvert qui réutilise ces données-là. Donc voilà. C’est un beau cycle.

Claire : Du coup, justement, vous parliez de confiance en l’outil par rapport à l’outil ouvert. Ce qui est intéressant, quand on vous écoute, on vous entend dire, par exemple, que le fait d’avoir ces open data ça permet aussi, peut-être, de restaurer la confiance finalement dans les institutions, les gens qui les produisent parce que tout est vérifiable. Vous dites même que ça peut être une arme pour lutter contre le complotisme. Est-ce que vous pouvez développer un peu là-dessus, sur comment vous avez construit ça ?

Guillaume Rozier : Je pense que l’open data donne confiance à plusieurs niveaux.
Pour parler du complotisme, je dis même que c’est une arme contre le complotisme, la meilleure arme contre le complotisme. En fait il y a un peu plus d’un an, en mars 2020, quand un complotiste disait sur Twitter « le Covid ou la Covid – je ne sais pas – le ou la Covid n’existe pas il n’y a pas 20 000 cas par jour, etc. », qu’est-ce qu’on pouvait lui répondre à part « si, ça existe ; si, fais confiance au ministre de la Santé qui annonce 20 000 cas par jour », c’est tout, ce n’est pas très fort comme argument. Aujourd’hui tu lui dis « tu vas sur le site data-gouv.fr qui est la plateforme publique qui centralise l’open data en France, tu vas voir ou tu te branches à l’API pour avoir les données du nombre de cas dans ton département ou même dans ta communauté de communes – puisque ça va jusqu’à ce niveau de détail – dans ta tranche d’âge. Ensuite tu demandes à tous les laboratoires qui sont autour de chez toi et tu compares les deux chiffres. Tu verras directement si le gouvernement a modifié les données ou pas ». En fait les données ça devient vérifiable. Ça donne aussi la confiance et ça permet de comprendre et de mieux adhérer aux décisions qui sont prises. Ça permet de donner confiance dans les décisions qui sont prises. Les décisions sont prises sur des faits qui sont objectifs, donc ça permet de comprendre ces décisions, de comprendre pourquoi telle décision publique a été prise ou autre, donc de mieux y adhérer.
Finalement, en l’occurrence là dans l’épidémie, mais ça peut s’appliquer à plein d’autres domaines, ça permet aussi de mieux lutter contre l’épidémie puisque chacun peut évaluer la situation chez lui, dans son département, chacun peut voir la saturation des hôpitaux près de chez lui, etc., donc ça permet d’adapter son comportement donc de mieux lutter contre l’épidémie en fonction de la réalité de la situation. Beaucoup de gens trouvent ça très cool et me disent « merci, grâce à CovidTracker j’ai vu que la situation n’était pas bonne dans mon département, donc j’ai annulé mon anniversaire », ou l’inverse « j’ai vu que la situation était bonne dans mon département, donc je me suis permis de faire mon anniversaire alors que sinon je ne l’aurais peut-être pas fait ». Je trouve ça aussi très cool, ça permet peut-être de responsabiliser les gens et de ne pas attendre que les décisions soient prises par un politique. Responsabiliser les gens pour qu’ils se battent automatiquement.

Claire : Ce qui est intéressant c’est que, justement, les gens ne vont pas se référer à l’open data brute, ils vont choisir d’aller sur votre site. Bien sûr il y a la donnée brute, mais la donnée brute, quand on va regarder les sources ce sont des fichiers csv, ce n’est pas hyper-sexy quand on est néophyte de tomber là-dessus. Quel est, pour vous, l’enjeu de la visualisation des données dans la communication qu’on va faire justement au public des chiffres mis en open source, en open data.

12’ 45

Guillaume Rozier : En fait, d’une manière générale,