La science ouverte, d'initiatives communautaires à politique publique
Titre : La sciences ouverte, d'initiatives communautaires à politique publique
Intervenant : Lionel Maurel
Lieu : Module du MOOC science ouverte, par la Sorbonne Université
Date : 27 octobre 2022
Durée : 57 min
Licence de la transcription : Verbatim
Illustration : Copie d'écran du mooc ?
NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.
Transcription
Je dirais qu'à la base, la science ouverte, ou ce qu'on appelait à l'époque plutôt « libre accès » ou « open access », s'est créée comme un mouvement qui est venu des chercheurs eux-mêmes. Ç'a d'abord été une initiative auto-organisée et ça l'est resté pendant longtemps : une initiative d'abord portée par les chercheurs eux-mêmes qui trouvaint des moyens. Arxiv [1], par exemple, en mathématique ou en physique, est née de ces initiatives auto-organisées. Les établissements ont mis un certain temps à rejoindre la dynamique. Et pendant longtemps, on était vraiment sur une logique justement d'établissements, qui était appelés à prendre des déclarations, des engagements, université par université ou organisme de recherche par organisme de recherche. Et c'est aussi resté une phase qui a duré pendant un certain temps et qui a donné lieu à des initiatives variées, plus ou moins avancées.
Ce qui est significatif depuis quelques années, et je le dirai comme ça, la science ouverte est devenue une politique publique en tant que telle. C'est-à-dire que la grosse différence c'est que maintenant, on a une impulsion partie de l'Union européenne et qui a demandé aux États. On a eu un Appel d'Amsterdam [2] qui a eu lieu en 2016, si je me souviens bien, qui a appelé les États à prendre des initiatives, et la France a été l'un des pays qui a répondu le plus fortement. Ça nous a donné le Plan national pour la science [3], ouvert en 2018, et pour moi, ça nous fait rentrer dans une nouvelle phase où la science ouverte devient une politique publique en tant que tel. Donc, ça change la donne, parce qu'on n'est plus dans un mouvement où les chercheurs ou les établissements peuvent rejoindre la dynamique, ou pas. On est dans une politique publique, avec ce que ça comporte de systématisation de la démarche et d'incidence sur les financements, sur les évaluations et d'autres leviers qui sont, à mon sens, autrement plus puissants pour essayer d'atteindre la phase suivante.
2:29 Rapport de force entre institutions publiques et éditeurs commerciaux
On est partis d'une situation de pur rapport de force, au sens où il n'y avait pas de levier, au sens juridique du terme, qui était actionnable face aux éditeurs. On avait cette phase critique de la cession des droits par les chercheurs, qui entraîne un transfert des droits à l'éditeur. Il y avait très peu de moyens, en fait, de négocier face aux éditeurs, surtout que, pendant longtemps, la dynamique a reposé sur l'engagement du chercheur individuel. C'était le chercheur seul face à l'éditeur qui devait, qui était supposé on va dire même plutôt, négocier les termes de son contrat. On sait que, évidemment, l'auteur isolé n'est pas du tout dans une position qui lui permet d'obtenir des avancées significatives.
Donc, ensuite, on a eu une phase de rapports de force, on pourrait dire quasi syndicales, c'est-à-dire que les chercheurs se sont coalisés ensemble, toujours plus ou moins à titre individuel, pour faire des boycotts. On avait eu les fameux appels au boycott The cost of knowledge, qui avaientt été lancé à partir de certaines communautés comme les mathématiques, qui demandaient qu'on boycotte un éditeur comme Elsevier [4]. On voit que ça a eu des effets, je pense, mais pas non plus significatif.
Ensuite on est passé dans une phase où le levier actionné était celui de la négociation et de la structuration des négociations. Toute la logique des consortiums d'achat - des consortiums souvent menés par les bibliothécaires et les bibliothèques - qui entendait notamment porter la négociation à une échelle supérieure et à une échelle nationale, à travers le mécanisme dit de « licence nationale », pour là aussi essayer d'avoir un rapport de force construit sur la puissance de négociation. Alors là, oui, il y a eu des avancées : on a pu notamment, par moment, obtenir des baisses de prix, des accords plus favorables au niveau des conditions sur ce qu'on peut faire des contenus, développer des pratiques, comme la fouille de données. Il a eu des avancées qu'on ne peut pas nier. Je ne pense pas qu'on puisse dire que ça a permis de modifier significativement le rapport de force, parce que, au moins pour les grands éditeurs internationaux, on a une situation de quasi-monopole qui est extrêmement difficile à défaire, même en se coalisant pour les négociations.
Et donc, le troisième levier qui, aujourd'hui, est mis en œuvre depuis le milieu des années 2010, c'est le levier strictement juridique, c'est-à-dire que la loi a fini par rentrer dans l'équation. Et notamment la loi République numérique [5], en 2016, donne un droit - on va dire incessible - aux chercheurs de faire des dépôts en archive ouverte. Ce qui est un élément aussi très fort de rééquilibrage. En gros, le moment critique de la cession des droits à l'éditeur a été très limité dans sa portée.
Mais là aussi, ça ne suffit pas : il faut que maintenant l'exercice du droit devienne effectif. C'est-à-dire que ça ne peut jouer un rôle dans le rééquilibrage du rapport de force que si les chercheurs utilisent systématiquement cette faculté. Et on voit que certains établissements commencent à changer leurs politiques pour que les chercheurs fassent un usage systématique.
Et à côté de ça, on a aujourd'hui quand même une persistance de la logique de négociation à travers ce qu'on appelle les accords transformants, qui sont de nouvelles formes de négociation qui ont été proposées à certains éditeurs pour obtenir, par le biais de la négociation, des transformations très rapides et avec - on va dire - des effets puissants pour le libre accès. Donc actuellement je dirais : voilà, le rapport de force est sur ces deux plans, la voie juridique et la voie de ce renouvellement des formes de négociation.
Un autre élément qui peut jouer dans le rééquilibrage du rapport de force, c'est carrément la question du désabonnement qui a pu être mis en oeuvre par le passé. C'est un peu la stratégie du boycott dont je parlais tout à l'heure, mais porté au niveau collectif et au niveau des négociations. Donc, on a eu récemment le désabonnement de Springer [6] en France : certains établissements ont choisi de ne pas se réabonner parce que l'offre ne leur paraissait pas satisfaisante. C'est un élément qui peut jouer, mais je pense qu'il reste encore relativement marginal, finalement, quand on regarde le panel, il y a assez peu de désabonnements, en tout cas pour les éditeurs les plus significatifs. Et il ne faut pas non plus occulter qu'il puisse y avoir une pression des chercheurs eux-mêmes pour maintenir ces abonnements et ne pas se couper de certains accès. Donc, c'est une stratégie qui est difficile à mettre en oeuvre, je pense, pour les établissements.
Et ensuite un autre élément qui, peut-être, finira par jouer aussi dans la balance, c'est tout simplement la proportion des contenus qui sont en libre accès, notamment dans les archives ouvertes. Mais là, il faudra sûrement attendre que la démarche de dépôt en archive ouverte soit systématisée, pour qu'on puisse vraiment voir un effet. Actuellement ça dépend des disciplines : on n'a pas, à mon avis, globalement, une proportion qui permette de peser significativement encore dans la balance. On pourra revoir dans quelques années, quand les politiques d'établissement auront produit leurs effets.
7:49 Les accords transformants
Les accords transformants, c'est un sujet relativement complexe parce que c'est une dénomination qui peut recouvrir beaucoup de choses. Très rapidement : ce sont des nouvelles formes de négociation qui ont été proposées à certains éditeurs, qui, en gros, envisagent, à coût constant ou à coût maîtrisé, de provoquer un changement radical de la philosophie, c'est-à-dire de transformer en fait les coûts d'abonnement en une sorte de forfait global qui permette progressivement d'aboutir au basculement des contenus en libre accès.
De nombreuses formules existent dans le monde ou sont en cours de négociation. Et certains y voient un espoir, en tout cas pour les contenus liés aux gros éditeurs, d'arriver rapidement à une modification du paysage.
A titre personnel, je suis extrêmement dubitatif sur ces types de négociations. Je pense en fait que le terme « transformant » est très mal employé parce que, oui, on aurait une transformation au sens où les contenus arriveraient en libre accès, mais on n'aurait pas une transformation profonde du paysage. À savoir que ces accords conservent la position prédominante des grands acteurs du monde de l'édition au niveau mondial, il laisse les contenus entre leurs mains. Et notamment il ne change pas la propriété des titres, c'est-à-dire que les grands journaux restent la propriété de ces grands éditeurs, et notamment les marques que ces grands journaux peuvent avoir sur les titres. Ensuite, ce ne sont pas des accords qui modifient significativement le rapport de force en terme financier, parce que ça reste à coût constant ou à coût maîtrisé d'ailleurs, sans nous donner de garanties réelles sur la maîtrise des coûts. Parce que ces accords, quand on les regarde dans le détail, ne nous disent pas que les coûts ne finiraient pas par réaugmenter d'une manière ou d'une autre.
Moi, je le vois comme une sorte de deus ex machina, qui est présenté comme telle, comme une personne qui pense pouvoir aller vite, alors que pour moi, l'open access n'est pas quelque chose sur lequel on puisse aller si vite que ça, en fait. Ça nécessite une transformation en profondeur du paysage et, à terme, la science ouverte implique une réappropriation par la communauté scientifique de ses moyens de diffusion des résultats. Et ça, ça nécessite un travail lent et minutieux. Et peut-être même que les accords transformants nous éloignent de ce but, parce qu'une fois qu'ils seront signés, ces journaux deviendront la voie royale, en fait, pour aboutir très rapidement à l'open access. Et l'effort patient, long, difficile, de réinvestissement des moyens dans la réappropriation, notamment des fonctions éditoriales, sera peut-être découragé par ce type d'accord. Donc, j'avoue que je suis assez dubitatif sur ce point.
Édition publique en sciences humaines et sociales
Je travaille essentiellement dans le champ des sciences humaines et sociales, et en France on a l'exemple, en fait, d'une plateforme comme Openedition [7] qui, depuis maintenant vingt ans, a mis en place un système de publication tout à fait solide, crédible et très utilisé par les sciences humaines et sociales, avec un modèle d'open access qu'on appelle « diamant » [8]. C'est un modèle où ni le lecteur, ni l'auteur, le chercheur ne paient, mais les financements sont en grande partie assurés par la puissance publique et marginalement par des services commerciaux que ces plateformes offrent, mais pas sur le contenu lui-même, sur des services à valeur ajoutée. C'est un exemple qui a le mérite de montrer que c'est possible. C'est possible et ça demande par contre une vraie volonté politique de développer ce type de plateforme. Openedition, c'est vingt ans d'investissement patient et méthodique, notamment en terme de ressources humaines - c'est un service qui demande beaucoup de ressources humaines.
Donc, la question est de savoir si les pouvoirs publics sont prêts à faire ce type d'investissement. On peut penser que c'est à l'échelle de l'Union européenne, en fait, qu'il faudrait que le relais soit pris aujourd'hui, parce qu'il faut peut-être qu'on sorte de cette logique nationale si on veut avoir des moyens significatifs de raisonner au niveau mondial. C'est peut-être à l'échelle de l'Union européenne qu'il faudrait créer ce type de plateforme. Et pour moi, ça pose vraiment la question, justement, de savoir comment on dégage ces moyens. Il faut bien voir que tant que les ressources sont absorbées par les abonnements, y compris d'ailleurs si les ressources basculent sur des accords transformants, ça laisse très peu de marge de manœuvre pour faire ces investissements-là. Donc, c'est possible, et à mon avis c'est même souhaitable : je pense que l'objectif devrait être de reconstruire un système de publication soutenu par l'acteur public, mais ça nécessite un choix politique vraiment significatif de la part des pouvoirs publics.
On voit, par exemple, dans le Plan national pour la science ouverte, qu'il y a un vrai souci pour les infrastructures, au-delà des plateformes, on va dire d'édition. La science ouverte doit reposer sur des infrastructures contrôlables et contrôlées, c'est-à-dire maîtrisées. Et ça, ça passe par des structures publiques. Il faut absolument pouvoir se reposer sur des choses qui ne sont pas rachetables et pour lesquelles on ait une vue à long terme sur la pérennité.
Dans le Plan national pour la science ouverte, il y a une vraie attention là-dessus. On a vu que, dans le premier appel du Fonds national pour la science ouverte, il y a eu un volet infrastructure. Donc, je dirais que la problématique est identifiée. Maintenant le choix politique est clairement encore devant nous, parce qu'une des faiblesses du Plan national pour la science ouverte, c'est son financement. Des financements ont été annoncés, mais ils ne sont pas tout à fait à la hauteur, je pense, de l'ambition qui est poursuivie. Le financement actuel du Plan national pour la science ouverte n'est même pas l'équivalent de ce que paye une université aux grands acteurs de l'édition pour s'abonner. Donc, IL y a encore des choix en terme de financement qui restent devant nous.
En SHS, on a un tissu éditorial qui est assez particulier? parce qu'il est beaucoup moins internationalisé. Et on n'a pas cet effet de concentration quasi monopolistique dans quelques acteurs : il y a une répartition qui est beaucoup plus grande et un poids de l'édition publique qui est aussi encore beaucoup plus fort. Pendant longtemps on a dit que c'était un désavantage, notamment parce que ça nuit d'une certaine manière au rayonnement international de ces sciences-là. Mais pour aborder le virage de la science ouverte, c'est un atout parce que c'est un paysage sur lequel on a beaucoup plus la maîtrise.
Il y a la question des petites maisons d'édition privées qui sont plus sensibles à ces effets-là. Pendant la négociation de la loi République numérique, par exemple, en 2016, on a peu entendu Elsevier ou Springer se manifester dans le débat public et c'était surtout des petites maisons d'édition privées françaises, petites ou moyennes, qui étaient opposées en fait à la loi République numérique.
Ce qu'il faut bien voir, c'est que la transition a quelque chose d'un peu inéluctable, maintenant. Il faut que ces acteurs comprennent qu'un modèle économique basé uniquement sur une barrière payante n'est pas soutenable à long terme, à mon avis, et ils doivent changer de modèle. On a un certain nombre d'acteurs publics et privés, de maisons d'édition qui ont déjà rejoint, par exemple, Openedition, et qui passent par ce canal-là, à travers notamment le système du freemium [9], pour bénéficier des revenus que la plateforme Openedition arrive à dégager. Ça prouve qu'il y a des moyens, en fait, de combiner les deux. Je pense aussi qu'inéluctablement, le mouvement vers la science ouverte appelle une prise de position plus importante de l'édition publique, notamment en sciences humaines et sociales. C'est-à-dire que les presses universitaires doivent retrouver une place qu'elles ont plus ou moins perdue au fil du temps.
On a un système dans lequel l'éditeur a finalement fini par oublier qu'il a un service à rendre qui doit être effectif. Il y a beaucoup d'éditeurs, en fait, qui vivent au-delà du transfert des droits, et la question du service est passée au second plan. Maintenant, une maison d'édition privée doit faire significativement valoir qu'il y a un service à valeur ajoutée qui est fait et que ce service, c'est ce qu'on paye : pas l'exploitation des droits mais le service rendu. Et là, je pense que l'édition privée, à ce titre-là - comme un imprimeur : finalement, on paye son service - peut continuer à jouer son rôle. Mais penser qu'on peut continuer à faire de l'édition uniquement en exploitant des droits, à mon avis, dans le contexte de la science ouverte, pour le privé, c'est une impasse.
En sciences humaines et sociales, on est dans une tradition - en tout cas en France -, où les chercheurs continuent à animer eux-mêmes les comités éditoriaux. On a aussi des situations où une grande part du travail éditorial lui-même est fait par des agents publics, y compris quand les revues sont publiées ensuite par des éditeurs privés. Donc du coup, effectivement, il y a beaucoup de sociétés savantes aussi qui sont encore détentrices des droits sur les revues. Même quand elles font affaire ensuite avec un éditeur, elles ont gardé la propriété des titres. Du coup, effectivement, je pense que la maîtrise du paysage est quand même plus ancrée dans les communautés scientifiques elles-mêmes. On n'a pas ces dispositifs comme en sciences dures où l'auteur fait lui-même quasiment le travail d'édition à travers un masque de saisie sur la plateforme de l'éditeur et finalement, on transfère le fichier avec un travail éditorial qui est aussi en partie fait par l'auteur. En sciences humaines et sociales, la question de la qualité du travail éditorial, de la mise en page, des images, tout ça a une part souvent assez significative et reste en grande partie effectuée, soit par les chercheurs, soit par des structures d'édition publique.
Ouverture des données de la recherche
La loi « Pour une république numérique » est connue pour son effet sur les publications, mais elle est beaucoup moins connue pour son effet sur les données. Or, à mon avis, elle a même eu, en tout cas juridiquement, un effet plus puissant pour les données que pour les publications, au sens où elle a créé, en fait, un principe d'ouverture par défaut des informations publiques. C'est-à-dire que normalement, une administration, dans le cadre de sa mission de service public, est tenue spontanément de publier en ligne les informations qu'elle produit, et de les rendre librement réutilisables. C'est un principe qui connaît des exceptions légitimes : protéger les données personnelles, respecter les droits d'auteur, respecter les secrets administratifs. Mais voilà, l'état de la loi est assez clair. Et ce qu'a fait la loi République numérique, c'est qu'elle a intégré les données de recherche comme étant des données publiques, ce qui n'était pas nécessairement évident comme choix. Mais c'est le choix qui a été fait par le législateur.
Après maintenant quatre ans d'application de la loi, on constate que les effets sont contrastés. Le principe existe, mais la réalité est encore très loin de correspondre à ce que la loi nous dit. Ce qu'il faut voir d'abord, c'est que cette limite de l'effet de la loi République numérique n'est pas présent que pour la recherche. C'est-à-dire que les collectivités territoriales, par exemple, les ministères, les établissements publics sont aussi tenus de faire de l'open data par défaut, et les premiers audits ont montré qu'il y avait un retard assez considérable. Donc la recherche n'est pas particulièrement à blâmer, je pense, dans ce décalage.
Pourquoi est-ce qu'il y a une sorte de difficulté pour la loi à passer dans les faits ? Déjà, je pense que peu d'acteurs savent tout simplement, y compris d'ailleurs dans les instances décisionnaires des établissements d'enseignement supérieur et de recherche, que cette loi existe et qu'elle a ces effets-là. Il y a eu un problème, à un moment donné, de communication et d'explication de ce que signifie vraiment la loi.
Ensuite il y a une vraie question de réorganisation des établissements. Et on le voit d'ailleurs dans les établissements publics, en dehors de la recherche. Ouvrir les données, ça oblige à ce que les données deviennent un enjeu significatif dans la structure, que la structure se préoccupe de ses données, sache les données qu'elle possède, fassent des analyses sur l'état des données, soit capable ensuite de définir tout un protocole qui permette d'assurer la mise en ligne et l'ouverture. Et donc ça, ça oblige à faire des réorganisations, ça demande des moyens humains. Et je pense que ça demande aussi une volonté d'établissement. C'est à dire qu'on ne peut pas compter sur la volonté individuelle des chercheurs d'ouvrir les données - si tant est que cette volonté existe - pour avoir un résultat. Ça doit être une logique d'établissement, en fait.
Ce qu'on commence à voir, ce sont des établissements qui prennent des chartes de science ouverte avec des volets sur les données. Et là encore, j'imagine qu'on va entrer dans une phase où il y aura des actions institutionnelles qui vont se mettre en place. Mais nous n'y sommes pas tout à fait encore. Et il faut voir aussi que le paysage - je dirais des infrastructures - n'est pas encore tout à fait structuré, en tout cas pas du tout de la même manière que pour les publications. On n'a pas l'équivalent d'un HAL [10], par exemple, pour les données. On a parlé de cheminement naturel et bien balisé qui nous permettrait de savoir comment publier les données et où. Ça aussi, à mon avis, c'est un enjeu : le jour où on aura des infrastructures bien balisées, il sera beaucoup plus simple d'appliquer le principe d'ouverture par défaut.
Un des intérêts souvent mis en avant d'ouvrir les contenus, c'est de favoriser les usages extra-académiques dans une logique de science citoyenne, de la participation du public à la science dans des usages extra-académiques. On peut penser aussi aux réutilisations par les entreprises, qui sont parfois mises en avant pour justifier ou mettre en avant l'intérêt des politiques d'ouverture des données. Globalement, j'ai l'impression quand même que ça reste assez marginal. Aujourd'hui, il faut dire que l'ouverture des données de recherche en elle-même est assez limitée en fait : les réutilisations académiques sont encore assez assez limitées et les réutilisations extra académiques le sont encore plus. À mon avis, il faudrait attendre déjà qu'une masse significative de nouvelles recherches soit ouverte pour vraiment pouvoir parler de réutilisation de ces données-là par la société civile, par des associations.
Ceci étant dit, on a déjà quelques exemples. J'ai en tête des exemples dans le champ, par exemple, de la botanique, où on a des associations actives. Il y a une association qui s'appelle Tela Botanica [11] qui produit des données et qui réutilise des données aussi de recherche : elle montre qu'on peut avoir des synergies entre des initiatives portées par la société civile et... Mais je pense en fait qu'on soupçonne encore mal, justement, les réutilisations possibles par la société civile, tout simplement parce qu'il n'y a pas assez de données de recherche qui sont réellement ouvertes, au sens fort du terme.
La question des infrastructures pour le stockage et la diffusion des données est un sujet complexe. Je ne pense pas qu'on puisse raisonner en matière de données exactement comme on l'a fait pour les publications. C'est à dire que les publications sont quand même des objets qui sont relativement standardisés, même si on a de la diversité aussi dans les publications. Mais quand même, j'ai l'impression que c'est relativement standardisé, alors qu'en fait le terme « données », qui est un peu trompeur, peut renvoyer à des objets qui sont d'une variété sans fin. Une donnée de recherche peut aussi bien être des chiffres, des mesures quantitatives, des statistiques, des images, des enregistrements sonores, des données d'enquêtes, ça peut être 1001 choses : j'ai déjà vu des archéologues qui considèrent que les tessons de poterie qu'ils retrouvent sur le terrain sont des données de recherche. Donc pour moi, c'est difficile, notamment, d'imaginer qu'on puisse refaire ce qu'on a fait avec HAL pour les publications. Je vois mal, en fait, une infrastructure qui finirait par être l'entrepôt de référence au niveau national.
Donc, actuellement, on a une situation qui ressemble un peu à celle qu'on a connu il y a quelques années sur les archives ouvertes, où les établissements, certains en tout cas, montent un entrepôt institutionnel. On a des entrepôts qui sont plus disciplinaires, qui peuvent être au niveau national ou international. En sciences humaines et sociales on a Huma-Num [12], par exemple, qui fait ça. On a des initiatives privées et on a des éditeurs privés aussi, qui mettent en place des entrepôts. Donc, je pense qu'il y a vraiment un enjeu très fort à avoir des infrastructures publiques. Mais savoir s'il faut que ces infrastructures soient le plus appropriées au niveau local, au niveau national, au niveau disciplinaire, c'est une question qui est encore devant nous et, à mon avis, il faut laisser un peu de temps aussi à la structuration - on va dire un peu naturelle - du paysage, avant de prendre des grandes décisions top-down sur le sujet.
Alors, oui, il est vrai que, quelque part, la France est un des pays qui a le plus avancé sur ces questions d'ouverture des données depuis la loi de 2016. La question peut se poser au niveau international, de savoir si une forme de réciprocité sur l'accès et la réutilisation de données va se mettre en place. Déjà, normalement, l'année prochaine ou dans les années à venir, on a une transposition de directives européennes, une nouvelle directive sur les informations du secteur public qui devrait harmoniser les conditions d'ouverture et de réutilisation au niveau de l'union européenne. Et on peut penser que tous les pays européens auront plus ou moins le même cadre que le cadre français. Déjà au niveau de l'Europe ça nous garantira une certaine forme de réciprocité.
Au niveau international, on commence à voir, par exemple, l'Unesco qui est en train de préparer une déclaration sur la science ouverte qui pourrait conduire en fait à un traité : quand on lit la déclaration, c'est un peu ce qui est sous-entendu. Effectivement, ce serait extrêmement intéressant, mais je pense que c'est un processus qui risque d'être très long. Donc, on risque effectivement de se trouver dans une situation où il n'y aura pas nécessairement de réciprocité automatique avec des pays comme les États-Unis ou la Chine. J'ai tendance à penser que cette question n'en est peut-être pas une, parce que les études qu'on a, par exemple, montrent qu'une publication est plus citée si les données liées à la publication sont accessibles et même significativement plus cités. Et que les effets en terme de rayonnement, en terme de visibilité et en termes de collaboration, seront supérieurs aux effets de passagers clandestins - on parle toujours de pillage des données - qui pourraient réutiliser les données. Dans le monde scientifique, théoriquement, on ne peut pas réutiliser des données sans citer leur origine, sinon il y a un problème de méthodologie scientifique et j'ai l'impression que cette citation des données en elle-même garantit beaucoup de choses.
Donc voilà, j'ai l'impression qu'il ne faut pas trop s'inquiéter des risques de non-réciprocité. Par contre, à mon avis, un enjeu stratégique - et je pense qu'on en est loin en France - c'est qu'il faut absolument apprendre à nos chercheurs à réutiliser des données. Parce qu'on est encore dans une logique où le chercheur produit des données lui-même, les exploite, publie sur les données qu'il a produit. Il y a encore très peu, je trouve, de formations à la réutilisation des données. Et, à mon avis, les communautés scientifiques qui deviendront les plus habiles et les plus à même de réutiliser des données, de savoir les identifier et de savoir les mettre en valeur, auront un avantage demain. Donc former à la réutilisation des données, ça me paraît un enjeu très important.
Licences, cession et protection du droit d'auteur
Cette question des licences est importante et on pourrait dire qu'elle a longtemps été perdue de vue, si on relit les grandes déclarations sur l'open access. Budapest, Berlin : on voit que les rédacteurs originaires qui ont conceptualisé l'open access, n'en faisaient pas qu'une question d'accès. Ils avaient tout à fait conscience que la logique de l'open access impliquait aussi une possibilité de réutiliser les contenus, et donc ils avaient intrinsèquement lié, à la base, l'open access à cette question de la libre réutilisation. Et en cours de route, peut-être parce que le terme open access finalement n'était pas celui qui était le plus approprié - moi je suis tout à fait content qu'on parle maintenant de science ouverte plutôt que d'open access, parce que ça dissipe ce malentendu - en cours de route on a oublié l'enjeu des licences en fait. Et pendant très longtemps, par exemple dans HAL, on ne pouvait pas choisir de licence sur les contenus, on ne pouvait pas choisir la licence Creative Commons [13]. Ce n'est que dans sa troisième version que HAL a donné la possibilité aux chercheurs de choisir une licence Creative Commons.
Cet enjeu est en train de changer, il revient sur le devant de la scène à travers la question des données. Parce que l'ouverture des données implique la réutilisation : on ne peut pas faire de l'ouverture des données si on se contente de mettre les données accessibles en ligne sur Internet. Le concept même d'open data, qui est celui qui a, on va dire, configuré la question de l'ouverture des données, implique intrinsèquement la réutilisation. Et du coup, la question va se poser de savoir quelles sont les licences qu'on peut choisir. On a tout un ensemble de choix possibles : en France, on a un décret d'application de la loi République numérique qui liste les licences qui peuvent être utilisées et qui recommande notamment d'utiliser la licence ouverte qui a été faite par la France pour encadrer son processus d'ouverture des données : une licence qui permet la réutilisation des données à toutes fins, avec pour seule limite de citer la source et de ne pas dénaturer les données.
On a aussi notre licence, qui s'appelle l'ODBL, open database license, une licence très inspirée des licences de logiciel libre qui permet la réutilisation à condition de repartager les données à l'identique en cas d'enrichissement ou de modification.
On a donc ces choix-là et on a aussi, dans le paysage, les licences Creative Commons qui sont des licences qui existent depuis maintenant plus d'une vingtaine d'années et qui offrent des options pour permettre d'indiquer les restrictions qu'on souhaite laisser à la réutilisation. Dans le cadre de la loi française, les seules licences qui sont compatibles avec l'esprit de la loi française, sont :
- la licence CC BY : réutilisation possible à toutes fins, à condition de citer la source ;
- la licence CC BY SA, SA ça veut dire share alike, partage à l'identique. C'est l'équivalent de la licence ODBL dont je vous parlais tout à l'heure : on peut réutiliser à toutes fins, à condition de repartager sous la même licence tous les enrichissements qu'on aurait fait sur les données qu'on a récupérées ;
- Et il y a une licence qui s'appelle CCO, qui lève toutes restrictions à la réutilisation, y compris la mention de la source.
-
Voilà, en gros, le paysage des licences. Je terminerai en disant qu'un autre élément qui va remettre un gros coup d'actualité sur les licences, c'est la mise en œuvre du Plan S [14], qui porte sur les publications, mais qui demande à ce que les publications financées par des agences type ANR [Agence nationale de la recherche] [15] soient obligatoirement placées sous la licence CC BY, ce qui n'est qu'une sorte de retour aux sources, en fait, de l'open access tel qu'il était dans la déclaration de Berlin ou de Budapest.
Alors l'accent qui est mis par le Plan S sur les licences type CC BY, à mon sens, est un tournant vraiment décisif dans le rééquilibrage du rapport de force avec les éditeurs. Pourquoi ? Depuis le début, le problème, c'est la question de la cession des droits. C'est-à-dire que, en gros, l'éditeur ne peut s'appuyer que sur les droits de l'auteur pour capter la propriété intellectuelle sur les contenus. Ce moment-là est critique, parce que l'auteur à la base possède ses droits, mais par la cession, il peut s'en déposséder. Et toute la question de l'open access est conditionné par ça, en fait. C'est ce moment critique qui entraîne tout le reste. Donc la stratégie de la coalition S est intéressante, parce que leur objectif était d'arriver à un open access immédiat, et on sait qu'actuellement on n'a pas le cadre législatif qui nous permet d'arriver à cet objectif. C'est à dire que la loi République numérique continue à ménager des délais que les éditeurs peuvent continuer à revendiquer : un délai de six mois pour les sciences et techniques, et de douze mois pour les sciences humaines et sociales. Comment faire sans toucher la loi pour arriver à un open access immédiat ? Et là, ce qu'a imaginé la coalition S, c'est que l'auteur fournisse à l'éditeur son manuscrit déjà placé sous une licence Creative Commons CC BY. Et je trouve que c'est extrêmement habile parce qu'en fait ça nous montre à quel point l'ouverture protège, ce qui est très contre-intuitif. On a l'impression qu'ouvrir les contenus, c'est quelque chose qui va vous menacer, mais en fait non, parce que si vous abandonnez ce droit patrimonial - parce que c'est ce que fait la licence CC BY : vous renoncez à exercer ce droit patrimonial -, ensuite, l'éditeur n'a plus rien à capter.
C'est une stratégie à la Gandhi, de non-violence juridique, on pourrait dire, c'est-à-dire que je renonce à garder mes droits de sorte qu'il n'y ait plus rien à capter. Et donc, du coup, les éditeurs vont se retrouver dans le choix, soit de refuser ces manuscrits, mais s'il les accepte, ils ne pourront plus s'opposer à l'open access immédiat. Il sera très intéressant de voir ce que va donner l'entrée en vigueur du Plan S.
- ↑ Arxiv
- ↑ Appel d'Amsterdam, EN
- ↑ Plan national pour la Science ouverte
- ↑ Elsevier
- ↑ Loi pour une République numérique
- ↑ Springer Verlag
- ↑ Openedition
- ↑ OpenEdition soutient le plan d’action d’accès ouvert « diamant »
- ↑ Freemium
- ↑ HAL
- ↑ Tela Botanica
- ↑ Huma-Num
- ↑ Licence Creative Commons
- ↑ Plan S
- ↑ ANR
- ↑ Robert Merton
- ↑ Open peer review
- ↑ Le rapport Trojette dans la Gazette des Communes
La recherche scientifique comme bien commun
Est-ce que la recherche scientifique constitue un bien commun ? C'est une phrase qui figure dans le Plan national pour la science ouverte : il y est dit que l'objectif est de faire des résultats de la recherche un bien commun de l'humanité. C'est une question qui est assez complexe parce que savoir ce qu'est un bien commun peut être discuté, on a plusieurs écoles de définition. À mon sens, c'est quelque chose qu'il faut voir au sens large. Quand on dit : « la science est un bien commun », on se concentre souvent uniquement sur les résultats de la recherche, les publications, les données, qui seraient des biens communs au sens où on voudrait qu'ils soient le plus largement partagés et réutilisés. Mais pour moi, la recherche relève du champ des communs dans un sens bien plus profond, en fait. Quand on regarde les communautés de recherche, elles ont, en grande partie à cause du statut des chercheurs, une réelle capacité d'auto-organisation. C'est ça, en fait, qui fait surtout pour moi le rattachement à la question des communs. C'est-à-dire que les communautés scientifiques, et ça vaut aussi bien à l'échelle d'un laboratoire qu'au niveau national ou international, ont une réelle capacité d'auto-organisation qui tient à la protection en fait de la liberté académique et au fait que les chercheurs ne sont pas soumis, notamment à des obligations de respect du pouvoir hiérarchique, comme peuvent l'être des agents publics normaux. Et ce statut en fait protecteur, leur donne une capacité d'auto-organisation : donc, ce ne sont pas seulement les résultats de la recherche qui sont un bien commun, c'est le fonctionnement même de la communauté scientifique qui, par ce pouvoir d'auto-organisation, relève, à mon sens, d'une certaine forme de logique de communs, de production de connaissances.
Donc je pense que, dans la logique de la science ouverte, il faut absolument garder ça en tête. Si on a des politiques publiques de science ouverte, il faut toujours qu'elles gardent à l'esprit qu'il faut préserver cette capacité d'auto-organisation des comités de recherche. Il ne faut pas déterminer l'ensemble des politiques publiques d'en haut, il faut aussi qu'il y a une réelle capacité des communautés à garder cette dynamique d'auto-organisation, y compris dans la science ouverte.
Il y a plusieurs définitions possibles de ce qu'on appelle les communs, qui peuvent ensuite s'appliquer aux communs de la connaissance. Une qui est peut-être un peu simplificatrice mais qui tend quand même à faire un peu consensus, c'est une définition en trois éléments. On dit qu'un commun, c'est une ressource partagée, qui fait l'objet en fait de règles définies par une communauté, qui se donne une gouvernance pour auto-déterminer ses règles.
Et il faut bien voir qu'on n'a un commun que si ces éléments-là sont réunis. On ne peut pas juste avoir un seul des éléments, sinon ce n'est pas complètement dans une logique de communs. De ce point de vue-là, l'activité scientifique correspond assez bien en fait à cette définition, au sens où on a bien des ressources partagées qui vont être les connaissances qui sont produites, et qui s'incarnent dans des publications, des données, des logiciels, tous les résultats de recherche. Ensuite, on a bien des communautés scientifiques, et on a tout un ensemble de règles qui sont en train de se mettre en place. Les licences de réutilisation en sont une, et les communautés académiques obéissent à des règles en général disciplinaires, aussi, toutes les questions d'éthique de la recherche, de méthodologie scientifique, qui sont très largement formalisés.
Et je dirais que le point de rapprochement qui est important, c'est la capacité d'auto-organisation des communautés. Les communautés de recherche ont cette capacité-là, à travers le statut des chercheurs qui leur permet d'avoir une certaine forme de liberté dans leur activité, qui leur garantit cette possibilité d'auto-organisation.
Quand on envisage la communauté concernée par la question de la science, elle est plus large que les seuls chercheurs eux-mêmes. C'est déjà en soi un vrai sujet : l'organisation des communautés scientifiques, leurs rapports aux pouvoirs publics. Mais si on passe dans un paradigme de science ouverte, la question scientifique et la question de la réutilisation des résultats de recherche concernent aussi des associations, des entreprises et d'autres acteurs qui peuvent soit participer à la production, soit se saisir des résultats.
Donc, oui, si on veut rester dans une logique de commun de la connaissance, il faudrait que la gouvernance fasse une place aussi aux ré-utilisateurs. Je crois que là, tout est à inventer et tout est à mettre en place sur le sujet. Pour l'instant, c'est assez significatif de voir, quand on lit le Plan national pour la science ouverte, la dimension science participative et science citoyenne n'est pas évoquée. Ce n'est pas quelque chose qui a été d'emblée visée par le plan. Et à mon avis, c'est une limite, c'est une lacune, qui est sûrement due au fait que c'était déjà relativement difficile d'avancer sur les autres terrains du plan. Mais on ne pourra pas faire l'impasse indéfiniment sur cette question et il faudra - si on met en place un volet sciences citoyennes - se poser la question justement de quelles instances, quelles institutions on se donne pour permettre de faire participer. j'ai noté récemment qu'il y a toute une mobilisation d'associations qui parlent de ce qu'elles appellent le tiers secteur de la recherche, qui ne serait pas de la recherche publique ni de la recherche privée, mais toute la recherche qui se fait dans des tiers lieux associatifs, etc., et qui demande à exister et à être reconnue en tant que telle. Donc, il y aura des conversations à avoir avec les acteurs de ce mouvement pour voir comment les intégrer dans le dispositif.
Les valeurs de la science ouverte
Oui, il y a une filiation entre la science ouverte et, on va dire, les mouvements autour du logiciel libre. Je pense qu'à la base, si l'open access s'appelait open access, c'est aussi par référence à l'open source dans le monde du logiciel. L'open data s'est lui-même appelé comme ça par référence à l'open source.
Les points de contact avec le mouvement de la science ouverte ? Il faut voir qu'à la base, les communautés du logiciel libre réagissaient à une forme d'accaparement et un risque lié à la privatisation des logiciels. À partir des années 80, on commence à voir se structurer des grandes sociétés qui développent des logiciels et qui ferment les codes et empêchent le travail communautaire autour des codes partagés. Et je pense que l'analogie vaut tout à fait pour la science ouverte et cette nécessité de sortir des restrictions et des accaparements qu'on peut voir, par rapport aux grands groupes éditoriaux. Philosophiquement, on appelle cette idée de lutter dans le mouvement des communs « lutter contre l'enclosure de la connaissance », cette fermeture imposée sur la connaissance. Elle est partagées dans le champ scientifique et dans le champ à l'origine des développeurs informatiques, il y a une filiation forte.
Moi, j'aime bien le rapprochement qui est fait aussi avec ce que disait un spécialiste des sciences qui s'appelait Robert Merton [16], qui travaillait dans les années 50 et parlait de l'éthos de la science. Il explique que la science en fait repose sur des valeurs, et dans les grandes valeurs il met le communisme de la science, comme il appelle ça, c'est-à-dire le fait de considérer que les résultats scientifiques forment un bien commun au sens où il ne peut pas faire l'objet d'une appropriation limitée par ceux qui le produisent. C'est-à-dire que la science est cumulative, on ne fait jamais qu'augmenter quelque chose qui était déjà là et qu'on passe ensuite aux générations suivantes. Et donc, du coup, ça veut dire qu'on doit reconnaître l'apport qui est fait par les chercheurs individuels, mais que ceux-ci ne peuvent pas aller jusqu'à une appropriation complète des résultats de recherche qui doivent être reversés dans un fonds commun qui progresse au fil du temps.
Ça vaudrait la peine de relire la science ouverte comme une sorte de retour aux sources, à l'éthos de la science que Merton avait décrit.
Je disais au début, que la science ouverte a longtemps été un mouvement, au sens où c'était porté par les chercheurs eux-mêmes qui se sont organisés pour essayer de peser aussi sur les décisions et les politiques publiques. Il y a eu effectivement une forme de militantisme associé à l'open access science ouverte, qui a eu des effets. Par exemple la loi République numérique a aussi été votée parce qu'il y a eu une vraie mobilisation structurée autour du texte, qui ne venait pas seulement du monde de la recherche : on a eu aussi des engagements associatifs autour de ce texte.
Ça reste important qu'il y ait un soutien à ces politiques-là qui vienne dans une forme d'engagement des chercheurs, mais pas que des chercheurs. La question est un peu en train d'évoluer, parce que la science ouverte est en train de devenir une politique publique structurée. Aujourd'hui, la science ouvert n'est pas une question de militants : c'est une orientation officielle du Ministère de la recherche, c'est une orientation officielle de l'Union européenne. On n'est donc plus dans une phase où la science ouverte serait portée uniquement par des militants qui essayeraient d'obtenir des avancées auprès des pouvoirs publics : ce sont les pouvoirs publics eux-mêmes qui ont endossé cet objectif. Et ça, je pense que ça change quand même significativement la donne, et peut-être que ce sont ceux qui s'opposent à la science ouverte qui sont des militants aujourd'hui.
On est en fait au début d'un mouvement dont, je pense, on ne voit pas toujours bien exactement les conséquences qu'il pourrait provoquer, à terme, sans pousser la logique jusqu'au bout. On commence à voir des initiatives qui se raccrochent à la science ouverte, qui touchent le processus même de la recherche scientifique. Tous les logiques d'open peer reviewing [17], par exemple, le fait de faire l'évaluation des articles en mode ouvert, en permettant d'avoir vraiment une transparence totale sur les échanges, lever la boîte noire de l'évaluation, c'est, je pense, une transformation profonde.
Il y a la question aussi de savoir si ce peer reviewing ne devrait pas être ouvert au-delà des chercheurs eux-mêmes ; c'est-à-dire qu'à un moment donné, on puisse avoir des contributions dans l'évaluation des articles qui viennent de manière complètement ouverte aussi, de personnes qui ne sont pas dans le monde de la recherche elle-même.
Là, ça nous ouvre des perspectives qui sont quand même vraiment significatives, en termes de changement.
On peut se demander : imaginons qu'on ait réellement les articles scientifiques vraiment placés sous licence libre, et imaginons qu'ils soient sur des interfaces qui permettent d'exercer réellement notamment le droit à la modification. On pourrait imaginer ce que j'appelle une wikification de la science, qui nous amènerait à avoir, en fait, des travaux scientifiques à peu près dans le même état que l'est l'encyclopédie Wikipédia. Non seulement tout le monde pourra lire les travaux scientifiques, on aura atteint le but de l'open access, mais en plus on arrivera à un stade où les travaux seraient modifiables.
Ça peut paraître assez perturbant comme idée, que n'importe qui puisse aller modifier un article de recherche. Mais si on regarde comment fonctionne Wikipédia en tant que tel, on peut avoir des processus tout à fait normalisés d'incorporation des contributions et d'évaluation, en fait, des contributions. Ce n'est pas parce qu'un contenu est modifiable en ligne que Wikipedia est modifiable en ligne : on dit souvent que n'importe qui peut modifier Wikipédia, c'est beaucoup plus complexe, en fait. Il y a tout un processus de validation des contributions, et quand les communautés sont bien et solidement organisées, elles sont capables d'effectuer cette modération qui assure la validation des connaissances. On dit souvent que le seul endroit sur Internet qui a vraiment résisté au déluge de fake news, au moment de la crise du Covid, c'est Wikipédia.
Donc, à terme, je pense qu'on pourrait imaginer des plateformes qui arrivent à intégrer des contributions très ouvertes, y compris sur des articles scientifiques. Mais là, le vrai défi, c'est d'avoir l'organisation communautaire derrière qui assure en fait une sorte de peer reviewing constant sur les contributions et qui soit capable, collectivement, de décider des règles de modération. Et là peut-être qu'on arriverait à ce qu'on pourrait appeler une ??? [49:50] de la science.
On peut se demander quelle est l'inspiration politique derrière la question de la science ouverte. Il y a notamment un point qui est souvent mis en avant, c'est que, effectivement, quand on parle d'ouverture des données de recherche, ça implique la libre réutilisation au sens fort du terme, c'est-à-dire y compris par les entreprises. Depuis longtemps, on a une critique notamment de l'open data qui explique que c'est une sorte de cadeau qui est fait par le secteur public au secteur privé. Parce que, dans les faits, ça va aboutir à une possibilité de libre réutilisation des données publiques et certains y voient même une sorte de mise en œuvre d'un projet néolibéral qui viendrait offrir des productions faites par le public, au secteur privé.
Je pense que ça n'est pas une bonne manière de poser cette question-là. Il faut voir qu'avant la politique d'ouverture des données publiques en 2016, il y a eu des travaux de la Cour des comptes qui sont extrêmement intéressants à regarder. Notamment le rapport Trojette [18], qui avait fait un audit des redevances fixées sur les données publiques. À l'époque, les données publiques faisaient l'objet de réutilisation payante, donc il y avait des redevances qui étaient demandées. Mais le constat de ce rapport était : appliquer des redevances provoque une très forte limitation de la réutilisation. Le potentiel de réutilisation des données était drastiquement abaissé par la barrière d'entrée et pas seulement pour les acteurs économiques, mais aussi pour la société civile. Deuxièmement, c'était extrêmement peu rentable pour l'État, il y avait très peu de redevances qui produisaient de réels bénéfices. Et enfin, qu'est-ce que ça permettait ? Ça permettait en fait en général à de gros acteurs positionnés sur le marché de conforter leur position. C'est-à-dire qu'il y avait seulement certains acteurs économiques qui pouvaient se payer le prix de l'édition et ça créait un effet d'éviction sur certains marchés, sur les acteurs plus petits.
Donc, même d'un point de vue strictement économique, je vois difficilement l'ouverture comme une stratégie néolibérale. Parce qu'en fait, la possibilité pour un acteur économique de capter un actif public et de s'arroger dessus une exclusivité, est au contraire pour moi typique d'une stratégie néolibérale. Je prendrai un exemple : en Grèce, quand le pays a subi les transformations qui ont été les siennes, les acteurs privés ont dépecé les structures publiques et les ont racheté pour avoir sur elle un contrôle. Si vous entrez dans une logique où il n'y a plus rien de rachetable, parce que c'est ça que va provoquer la politique de science ouverte, aucun acteur ne pourra plus obtenir d'exclusivité sur les données de recherche. À ce moment-là, vous avez une situation qui déverrouille complètement le paysage et qui à mon sens évite la constitution de grandes positions dominantes.
Donc, je pense qu'il faut rester vigilant sur ce point-là. Notamment la question de la réciprocité pourrait se poser, mais d'une autre façon. Plutôt que de fermer les données de recherche qui pourraient être demandées à un moment, se dire que les acteurs privés aient aussi des obligations d'ouverture. Et notamment, il y a un concept qui revient souvent, celui des données d'intérêt général où on pourrait envisager qu'un élément d'équilibrage du paysage serait que des acteurs privés aient aussi des obligations d'open data. Je pense qu'un jour il faudra se poser la question, même vis-à-vis de la recherche privée. Et au contraire, tout retour en arrière qui consisterait à fermer les données nous expose au risque d'une captation par les acteurs publics.
L'évaluation de la recherche
Un des points de vigilance à avoir, je pense qu'il est vraiment sur la question de l'évaluation. C'est-à-dire que même dans un monde, on va dire, où tout serait ouvert, il y aurait sans doute encore possibilité d'avoir une sorte de gouvernance néolibérale de la recherche si on continuait à évaluer les chercheurs par des méthodes quantitatives - bibliométrie, facteurs d'impact, etc., qui peut tout à fait continuer à exister dans un monde où tous les contenus seraient ouverts. Et c'est pour ça qu'à mon avis, il est vraiment indispensable de coupler le développement de la politique de science ouverte à une profonde révision des moyens par lesquels on évalue la recherche. Et notamment qu'on sorte de la logique d'évaluation quantitative me parait une garantie.
Recommandations aux doctorant·es et jeunes chercheuses·cheurs
Au niveau des doctorants, je pense que c'est vraiment une étape décisive, parce que c'est là où les premiers choix vont être faits : il y a donc vraiment une attention particulière à avoir vis-à-vis du doctorant. La première question qui va se poser pour eux, c'est de savoir s'ils veulent mettre leur thèse en libre accès ou pas. Ça reste une faculté, aujourd'hui, du doctorant, ce n'est pas une obligation. Je pense que ce choix devrait être fait de manière vraiment mûrement réfléchi : on a souvent des retours de doctorants qui disent que c'est un choix auquel ils réfléchissent à la toute fin, voire quasiment au moment où on leur tend le formulaire où ils doivent cocher la case.
Là il y aurait peut-être un conseil à donner, pas seulement aux doctorants eux-mêmes, mais aux laboratoires et aux écoles doctorales : il faudrait absolument que cette question-là soit envisagée bien avant. Je pense qu'il y a une question particulière à poser sur les données, parce qu'on voit de plus en plus de doctorants produire des données, évidemment, pour la recherche. Cette question des données des doctorants me paraît encore vraiment un peu en dehors du radar. Et pourtant, je trouve qu'elle est très importante parce que c'est quand même le premier pas du chercheur dans cette question de la science ouverte. Donc, se préoccuper de ses données et savoir ce qu'on veut en faire, ça me paraît important. J'avoue que moi, un de mes rêves, ce serait quand même qu'on demande aux doctorants de réaliser une sorte de plan de gestion de données. Peut-être pas un plan de gestion de données complet, mais qu'il y ait quand même quelque chose où on demande aux doctorants, à l'entrée dans la thèse, de réaliser un document où ils puissent se projeter sur la gestion de leurs données. Je trouve que ça apporterait beaucoup.