Fada de Data ! avec Joël Gombin
Titre : Fada de Data ! avec Joël Gombin
Intervenants : Joël Gombin - Josquin Debaz
Lieu : La Cantine Brestoise – An Daol Vras
Date : 13 mars 2023
Durée : 48 min 20
Licence de la transcription : Verbatim
Illustration : À prévoir
NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.
Description
Dans ce quarante-cinquième épisode, nous recevons Joël Gombin, cofondateur de Datactivist, société coopérative et participative, qui travaille à ouvrir les données et à les rendre utiles.
Transcription
Voix off : ???. La cantine numérique de Brest a le plaisir de vous présenter son podcast.
Josquin Debaz : Dans ce 45e épisode, nous recevons Joël Gombin, cofondateur de Datactivist, société coopérative et participative qui travaille à ouvrir les données et à les rendre utiles. Bonne écoute. Joël Gombin bonjour.
Joël Gombin : Bonjour.
Josquin Debaz : Tu es le fondateur de la coopérative Datactivist. Qu'est-ce que c’est Datactivist ? Pourquoi une coopérative ? Beaucoup de questions me viennent.
Joël Gombin : Le mieux c'est de raconter l'histoire.
En fait, je suis le cofondateur de Datactivist puisque nous étions deux, avec Samuel Goëta, à créer Datactivist en 2016. Je connais Samuel depuis longtemps, nous étions étudiants à Sciences Po Aix tous les deux, je le connais depuis cette époque. Ensuite, chacun a fait sa vie et, en 2015, on se retrouve tous les deux dans le sud de la France après avoir quitté Paris. Samuel, un petit peu avant moi, a suivi sa femme qui avait trouvé un job à Aix-en-Provence et moi j'ai suivi la mienne qui avait trouvé un job à Marseille, à côté de Marseille. On se retrouve donc tous les deux dans le sud de la France, chacun à faire des thèses et à se dire « on verra bien sur place ce qu'on pourra faire ». Nous nous sommes retrouvés, ensemble, à faire des cours à Sciences Po Aix de cartographie, de controverse, des trucs comme ça. Du coup, on a pas mal tchatché.
Samuel finissait une thèse à Télécom ParisTech sur l'open data. Moi, j'essayais de faire une thèse, je n'ai jamais réussi, ce n’est pas que ??? [2 min 05] de faire une thèse en sociologie électorale et j'ai beaucoup travaillé à partir de données publiques qui se sont progressivement ouvertes au cours de ma thèse : des résultats électoraux, des données sociodémographiques, des données géographiques, ce genre de choses. Pendant ma thèse, j'ai donc appris à traiter ces données, à les analyser, à les visualiser, les modéliser, etc. Du coup, je me suis aussi intéressé un peu indirectement au statut de ces données.
Pour donner un exemple un peu concret, quand j'ai commencé à travailler en sociologie, géographie électorale, en 2004/2005, pour obtenir les résultats du recensement, par exemple, il fallait écrire à l'Insee, par la poste, envoyer un chèque, on vous renvoyait un cédérom sur lequel il y avait les données dans un format qui n'était pas du tout ouvert à l'époque. Il fallait acheter un logiciel qui s'appelait ??? [3 min 12], quelque chose comme ça. C'était extrêmement compliqué d'accéder à ces données et puis, si vous vouliez des données géographiques pour représenter ces données socio-démographiques, il fallait écrire à l'IGN qui, pareil, vous vendait assez cher des contours géographiques des communes ou des subdivisions administratives qui vous intéressaient, etc.
Et puis j'ai vu, progressivement, toutes ces données être disponibles sur Internet, être progressivement disponibles gratuitement, librement, etc., donc ça m'a beaucoup intéressé. À mon modeste niveau, comme apprenti chercheur, j'ai aussi poussé pour pouvoir faciliter l'accès à ces données.
Josquin Debaz : C’est ce mouvement de l'open data, en particulier de l'injonction qui est faite aux administrations d'ouvrir le plus possible leurs données.
Joël Gombin : Voilà, exactement. Moi je l'ai d'abord vu côté recherche, côté scientifique, mais ça s'est fait de manière assez parallèle et puis avec des institutions qui sont à la frontière entre les deux, l’Insee en est un bon exemple.
Avec Samuel, nous parlons beaucoup d'open data et puis, progressivement, de fil en aiguille, on en arrive à la conclusion, en 2015/2016, que le moment est peut-être bon pour professionnaliser un petit peu l'ouverture des données publiques. À cette époque-là, c'est ce qu'étudiait Samuel dans sa thèse, l'ouverture des données était assez largement le fait souvent d'agents publics ou de salariés dans les organisations, qui étaient, eux-mêmes, très convaincus, très militants, qui le faisaient parfois sur leur temps perso, en tout cas rarement dans le cadre d'un mandat explicite de leur organisation, dans le cadre de leur fiche de poste, etc.
On voit que l'open data commence à s’institutionnaliser : Etalab avait été créée en 2011, Henri Verdier arrive à la direction d‘Etalab en 2013 et relance le mouvement avec une nouvelle dynamique, etc. La loi pour une République numérique n’est pas encore adoptée, mais est dans les tuyaux, qui va poser, en 2016, le principe d'ouverture par défaut des données publiques, donc on se dit « OK, il va y avoir un changement d'échelle, donc il va y avoir besoin d'aide, besoin d'accompagnement » et c'est l'objet qu'on a donné à Datactivist : on va aider les organisations qui veulent ouvrir leurs données ou qui veulent réutiliser des données ouvertes.
C'est donc un peu comme ça que naît Datactivist.
Le nom lui-même vient d'une lecture qu’on aimait beaucoup tous les deux, un livre collectif qui s'appelle Statactivisme - Comment lutter avec des nombres, un ouvrage de recherche, qui rassemble un certain nombre de contributions de recherche, qui porte sur des acteurs assez variés qui ont utilisé l'outil statistique comme outil de lutte politique, par exemple les collectifs de chômeurs, souvent alliés à des statisticiens de l’Insee, qui ont lutté sur la définition de ce qu'est le chômage et comment, grosso modo, on le compte. Il y a des gros enjeux là-dessus, c’est un exemple parmi d'autres. Nous nous sommes dit « nous aimerions bien, nous aussi, que l'open data puisse servir à de l'émancipation, puisse servir à changer la société, etc. », on a donc créé ce terme de Datactivist.
Pourquoi une coopérative ? En fait en cohérence avec ça. On avait envie que l'open data puisse être quelque chose au service du bien commun, voire, finalement, que ça constitue un commun. À l'époque, cette notion de commun était moins répandue qu'aujourd'hui et il était moins évident que l'open data pouvait constituer un commun numérique, mais on a commencé cette réflexion-là, nous n’étions pas les seuls. Nous nous sommes dit « c'est assez cohérent de faire une coopérative, c'est assez cohérent avec ces principes-là. » Par ailleurs, Samuel avait vécu aux États-Unis dans un habitat coopératif, il avait adoré, donc il avait vraiment envie de décliner ce principe-là et, moi, je m’intéressais aussi par mal aux coopératives, j'avais une socialisation politique plutôt libertaire, on va dire, ça faisait donc partie des choses qui m'intéressaient. Donc voilà, on a créé Datactivist. Voilà un peu ce qu’est Datactivist. Ça c'est en 2016, on a officiellement créé Datactivist fin 2016, novembre 2016. Aujourd'hui, presque sept ans après, c'est une coopérative de plus d'une vingtaine de salariés, qui travaille toujours, évidemment, sur les sujets d'ouverture des données, d'ouverture des données publiques, mais qui, plus largement, s'intéresse à la contribution que peuvent avoir les données au bien commun et à l'intérêt général. On a donc un petit peu élargi notre champ d'action sur des notions connexes, par exemple on travaille pas mal les données de la recherche et de la science ouverte, au-delà de l'ouverture des données, on travaille sur les notions de gouvernance des données, de partage de données, on travaille aussi sur les questions de transparence algorithmique. On a un peu petit élargi notre champ d'action, mais je crois que le projet reste assez proche de ce qu'il était au départ.
Josquin Debaz : Si je comprends bien l’idée de Datactivist, c'est que les données sont intrinsèquement politiques, de nature politique, et un enjeu de pouvoir. Ça représente à la fois, comme tu l’as dit, un argument statistique. Quand on peut définir la donnée ou définir ce qu’est la juste donnée, la manière de la compter et la manière de la transmettre, déjà on oriente ou on réoriente les problèmes publics. Et puis c'est aussi un acte symbolique de savoir qu'elle est la donnée qu'on ouvre et quelle est la donnée, finalement, qu’on laissera de côté parce que, par exemple, intermédiaire, donc non définitive, non explicitée, ou parce que sous le couvert de différentes formes de secret.
Si j’ai bien compris, l’idée c'est que les pouvoirs publics, eyx, sont tenus de rendre des comptes.
Joël Gombin : En fait, on peut même placer la discussion en amont de la question d'ouverture et se dire que c'est déjà un choix politique de savoir quelles données sont produites ou pas.
Par exemple, on a une collègue, Maëlle Fouquenet, qui s'intéresse beaucoup à la question des données et du genre. Lorsqu'on collecte des données, le fait de collecter, ou pas, des choses sur le genre est une décision extrêmement politique parce qu’elle permet de donner à voir, ou pas, des inégalités de genre. On peut évidemment remplacer le genre par d'autres variables, mais c'est assez flagrant sur le genre.
Donc, oui, les données sont un sujet intrinsèquement politique, à la fois par la visibilité ou la manière de construire tel ou tel problème public et, plus largement, parce que, aujourd'hui, les données constituent une forme de l'infrastructure, donc les données sont un outil à la fois de pouvoir et d’empouvoirement, empowerment comme on dit en anglais.
Si on prend un projet comme OpenStreetMap c'est assez flagrant. On voit bien que construire la carte du monde est, par définition même, une opération de pouvoir. Pendant très longtemps ça a été le monopole des états, ce sont essentiellement les états qui étaient capables de faire des cartes. Ensuite, éventuellement, ça a été le monopole de quelques très grandes entreprises, très puissantes, et puis, aujourd'hui, c'est une opération potentiellement distribuée, à laquelle peuvent participer tous les citoyens et, surtout, dont peuvent bénéficier tous les citoyens. De ce point de vue-là, je pense qu’OpenStreetMap a une portée politique absolument incroyable et dont assez peu de gens, au final, ont conscience. On le sait peut-être davantage sur des projets comme Wikipédia, par exemple, mais, à titre personnel, je pense qu’OpenStreetMap est un projet d'une importance et d'une ampleur assez hallucinantes.
Josquin Debaz : On entrevoit qu’ouvrir les données ce n’est pas tout, c'est-à-dire que la donnée peut être ouverte mais si c'est un fichier, un tableur en format privé qui est dans un site, qui n’a pas du tout la même structure que celle de l'institution voisine, finalement c'est un travail de dingue de la récupérer. Il faut donc la nettoyer, la rendre opérable, la rendre accessible, la documenter l'insérer dans un système plus large, et c'est tout un travail que vous faites.
12’ 49
Joël Gombin : Effectivement.