« Goûter les archives et les humanités numériques » : différence entre les versions

De April MediaWiki
Aller à la navigationAller à la recherche
Aucun résumé des modifications
Ligne 60 : Ligne 60 :
<b>Josquin Debaz : </b>Cette démarche s’inscrit dans le cadre de ce qu’appelle depuis 10/15 ans les humanités numériques ?
<b>Josquin Debaz : </b>Cette démarche s’inscrit dans le cadre de ce qu’appelle depuis 10/15 ans les humanités numériques ?


<b>Frédéric Clavert : </b>Je vais beaucoup te décevoir, mais, en fait, ce n’est pas un projet d’humanités numériques ; ça dépend, c’est toujours la même chose, ça dépend de comment on définit les humanités numériques, l’histoire numérique, etc. Ce qui nous intéresse ici c’est de regarder ce qui se passe entre les quelques historiens/historiennes qui restent qui refusent les évolutions numériques : on a organisé une journée où Arlette Farge débattait avec Sean Takats, qui est aujourd’hui un collègue de l’Université de Luxembourg, qui fait partie de ceux qui ont dirigé le projet Zotero, un logiciel de gestion des références bibliographiques et ensuite avec ??? [8 min 20], Tropy qui, justement, est un logiciel qui gère les photos qu’on prend en centre d’archives, qui est beaucoup plus historien que Zotero. Et, en tout cas quand on lui dit que telle collection d’archives a été numérisée, comme elle connaît très bien les archivistes, Arlette  Farge va voir les archivistes et leur demande les originaux. Elle les connaît très bien, elle a expliqué qu’elle arrivait dans ces cas-là à travailler quand même souvent sur la version papier.<br/>
<b>Frédéric Clavert : </b>Je vais beaucoup te décevoir, mais, en fait, ce n’est pas un projet d’humanités numériques ; ça dépend, c’est toujours la même chose, ça dépend de comment on définit les humanités numériques, l’histoire numérique, etc. Ce qui nous intéresse ici c’est de regarder ce qui se passe entre les quelques historiens/historiennes qui restent qui refusent les évolutions numériques : on a organisé une journée où Arlette Farge débattait avec Sean Takats, qui est aujourd’hui un collègue de l’Université de Luxembourg, qui fait partie de ceux qui ont dirigé le projet Zotero, un logiciel de gestion des références bibliographiques et ensuite, avec Abby Mullen, Tropy qui, justement, est un logiciel qui gère les photos qu’on prend en centre d’archives, qui est beaucoup plus historien que Zotero. Et, en tout cas quand on lui dit que telle collection d’archives a été numérisée, comme elle connaît très bien les archivistes, Arlette  Farge va voir les archivistes et leur demande les originaux. Elle les connaît très bien, elle a expliqué qu’elle arrivait dans ces cas-là à travailler quand même souvent sur la version papier.<br/>
Entre ces quelques cas un peu extrêmes et puis l’autre côté, c’est-à-dire les gens à la rigueur comme moi, c’est-à-dire qui ne travaillent quasiment plus sur les archives que par leur ordinateur, ce qui nous intéresse c’est de regarder tous ceux qui sont entre, c’est-à-dire tous ceux qui sont entre les historiens qui sont dans le monde d’Arlette Farge d’une manière et les historiens qui sont dans le monde des humanités numériques et regarder les pratiques informatiques entre ces deux extrêmes. Ce sont finalement ces pratiques-là qui nous intéressent avec une focalisation sur l’archive, mais on étend aussi un peu parce que je pense que le passage de l’écriture à la main, puis à la machine à écriture puis à l’ordinateur change aussi l’écriture, il n’y a pas que la lecture des archives ou leur analyse.
Entre ces quelques cas un peu extrêmes et puis l’autre côté, c’est-à-dire les gens à la rigueur comme moi, c’est-à-dire qui ne travaillent quasiment plus sur les archives que par leur ordinateur, ce qui nous intéresse c’est de regarder tous ceux qui sont entre, c’est-à-dire tous ceux qui sont entre les historiens qui sont dans le monde d’Arlette Farge d’une manière et les historiens qui sont dans le monde des humanités numériques et regarder les pratiques informatiques entre ces deux extrêmes. Ce sont finalement ces pratiques-là qui nous intéressent avec une focalisation sur l’archive, mais on étend aussi un peu parce que je pense que le passage de l’écriture à la main, puis à la machine à écriture puis à l’ordinateur change aussi l’écriture, il n’y a pas que la lecture des archives ou leur analyse.


Ligne 73 : Ligne 73 :
==12’ 08==
==12’ 08==


<b>Caroline Muller : </b>Après, de fait, on dit qu’on n’est pas un projet en humanités numériques au sens où on n’est pas sur les mêmes questions que les projets qui s’affichent en humanités numériques, mais on brasse des questions qui sont tout à fait liées, que ce soit par exemple dans le chapitre que Frédéric a pu écrire sur ce que c’est que faire une requête à l’ ??? [12 min 30] quand on fait de la recherche, en passant par les archivistes qui nous expliquent ce que c’est que d’absorber massivement des données d’archives nativement numériques à partir des services administratifs, puisque c’est aussi un des volets du projet. On essaye de faire émerger un dialogue entre les disciplines qui tournent autour des archives et de l’histoire. En fait, on parle tout le temps de questions de données, de requêtes, de moteurs de recherche. Pareil, aujourd’hui il n’y a quasiment plus d’historien ou d’historienne qui n’utilise pas quasi quotidiennement un moteur de recherche. Or, on s’est rendu compte que le passage par le moteur de recherche, ce qu’on y fait, comment on questionne, comment on pose sa question, tout ça c’est encore sous les radars des réflexions méthodologiques.<br/>
<b>Caroline Muller : </b>Après, de fait, on dit qu’on n’est pas un projet en humanités numériques au sens où on n’est pas sur les mêmes questions que les projets qui s’affichent en humanités numériques, mais on brasse des questions qui sont tout à fait liées, que ce soit par exemple dans le chapitre que Frédéric a pu écrire sur ce que c’est que faire une requête à une API quand on fait de la recherche, en passant par les archivistes qui nous expliquent ce que c’est que d’absorber massivement des données d’archives nativement numériques à partir des services administratifs, puisque c’est aussi un des volets du projet. On essaye de faire émerger un dialogue entre les disciplines qui tournent autour des archives et de l’histoire. En fait, on parle tout le temps de questions de données, de requêtes, de moteurs de recherche. Pareil, aujourd’hui il n’y a quasiment plus d’historien ou d’historienne qui n’utilise pas quasi quotidiennement un moteur de recherche. Or, on s’est rendu compte que le passage par le moteur de recherche, ce qu’on y fait, comment on questionne, comment on pose sa question, tout ça c’est encore sous les radars des réflexions méthodologiques.<br/>
Autrement dit on n’est pas la ??? machine ou la ??? machine [13 min 25], c’est-à-dire qu’on n’est pas dans des projets qui visent à restituer des formes de réalité, équipées, etc., mais on pose des questions qui sont des questions de fond qui sont communes aux humanités numériques. Je pense Frédéric qu’on peut dire, tu me corriges si je m’égare.
Autrement dit on n’est pas la ??? machine ou la ??? machine [13 min 25], c’est-à-dire qu’on n’est pas dans des projets qui visent à restituer des formes de réalité, équipées, etc., mais on pose des questions qui sont des questions de fond qui sont communes aux humanités numériques. Je pense Frédéric qu’on peut dire, tu me corriges si je m’égare.



Version du 6 mars 2023 à 12:37


Titre : Goûter les archives et les humanités numériques, avec Caroline Muller et Frédéric Clavert

Intervenant·e·s : Caroline Muller - Frédéric Clavert - Josquin Debaz

Lieu : La Cantine numérique Brestoise

Date : 15 novembre 2023

Durée : 37 min 17

Podcast

Licence de la transcription : Verbatim

Illustration : à prévoir

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Présentation

Quarante-troisième épisode. Nous recevons Caroline Muller, maîtresse de conférence à l’Université Rennes 2 et Frédéric Clavert, Assistant Professor au C2DH de l’Université du Luxembourg, pour leur travail sur le livre numérique Le Goût de l’archive à l’ère numérique. Ils nous parlent de l’évolution du métier d’historien, au travers de nouvelles pratiques et méthodes liées aux outils numériques, en rapport avec les archives, vous l’aurez supposé, mais aussi avec les collectifs de recherche et les modes de publication. On évoque encore les mouvements des humanités numériques et de la science ouverte.
Bonne écoute.

Transcription

Josquin Debaz : Caroline Muller, Frédéric Clavert, bonjour.

Frédéric Clavert : Bonjour.

Caroline Muller : Bonjour.

Josquin Debaz : Vous êtes docteur et doctoresse en histoire contemporaine. Frédéric Clavert tu es équivalent de maître de conférences à l’Université de Luxembourg au C2DH.

Frédéric Clavert : Le C2DH c’est donc pour Centre for Contemporary and Digital History. C’est, disons, un centre de recherche qui est centré à la fois sur l’histoire du temps présent et sur les nouvelles méthodologies numériques que l’on peut appliquer particulièrement à l’histoire contemporaine.

Josquin Debaz : Et Caroline Muller, tu es maîtresse de conférences à l’Université de Rennes 2.

Caroline Muller : Oui, tout à fait, où j’enseigne aussi l’histoire contemporaine.

Josquin Debaz : Nous vous recevons aujourd’hui par rapport à un de vos projets communs, qui s’appelle Le goût de l’archive à l’ère numérique, qui fait écho à un livre de référence, écrit par Arlette Farge en 1989, qui met en avant l’archive comme un peu une spécificité des travaux d’historien et de toutes les facettes qu’il peut avoir, ce rapport à l’archive un peu comme une signature de leur métier, mais aussi comme un rapport corporel à une certain intimité, en fait, à leur objet.

Frédéric Clavert : Le goût de l’archive, dans ce qu’elle qualifie elle-même de petit livre, qui a eu énormément de succès, qui a été traduit en anglais, en allemand au moins et dans d’autres langues, Arlette Farge décrit un peu les conditions matérielles de consultation des archives. Quand on entend matériel, ça va du choix de la table dans la salle de lecture, de la place dans la salle de lecture du centre d’archives, à la matérialité de l’archive : la boîte qu’on ouvre, le papier, l’odeur du papier, la couleur du papier. Elle met ça en relation avec la manière dont on est capable, en tant que historien historienne, quand on est dans la salle de lecture du centre d’archives, de comprendre les acteurs – pour Arlette Farge ce sont souvent des femmes qui ont été emprisonnées donc actrices – de se mettre à leur place, de les faire parler, en fait de les laisser parler.
Elle part du principe que l’interprétation des archives, parce qu’on interprète toujours les archives qu’on consulte comme historien et historienne, commence toujours par les conditions matérielles de consultation des archives et par le lien matériel, physique, que l’on instaure avec l’archive.
C’est quelque chose qui définit quasiment notre métier aujourd’hui, de fait, ce livre d’Arlette Farge, c’est l’image qu’on se donne de nous-mêmes, la plupart du temps, c’est vraiment l’image de la profession. J’ai commencé mes recherches pour ma thèse à la toute fin des années 90, le problème c’est que si moi j’ai encore connu un peu le monde d’Arlette Farge et encore, je ne recopiais pas mes archives sur du papier, je prenais déjà mes notes sur un ordinateur, je pense que Caroline qui est un peu plus jeune, ne l’a jamais connu. C’est un monde qui n’existe plus vraiment, sauf quand on est dans les quelques centres d’archives qui imposent encore le crayon et le papier, mais, en fait, on ne travaille plus du tout comme ça dans les salles de travail des centres d’archives.

Josquin Debaz : Ça veut dire qu’on ne peut plus être historien ?

Caroline Muller : Ça veut dire que je ne suis pas historienne dans ce cas-là !
Concrètement, si vous voulez, quand j’ai écrit ma thèse, mon premier travail de recherche d’ampleur puisque c’est un petit peu la clef pour accéder à une carrière universitaire en France, pour devenir historien professionnel, quand j’ai fait ma thèse j’ai passé très peu de temps à fouiller dans les centres d’archives pour consulter des documents simplement parce que j’ai pris des photographies en masse des documents et je les ai lus sur mon ordinateur à la maison, à la bibliothèque mais finalement très peu dans le centre d’archives.
En fait le fond de notre projet a d’abord été de réexaminer ça, cette possibilité de rapporter le document avec soi à la maison sans l’avoir véritablement lu en centre d’archives, qu’est-ce que ça change dans la manière dont on choisit nos sujets, dans nos rythmes de travail, dans les histoires qu’on produit et qu’on écrit ? Notre idée, notre hypothèse de base c’était de dire que ça change tout, en tout cas ça change beaucoup de choses : on prend au sérieux l’hypothèse de la recherche dans laquelle les conditions matérielles d’exercice ont un effet sur ce qu’on écrit à la fin, sauf qu’avec l’entrée dans l’ère numérique, eh bien tout a changé, ou presque.

Josquin Debaz : Du coup, comme tout a changé vous avez décidé de mettre en place un dispositif ad hoc pour pouvoir en parler.

Caroline Muller : D’abord, avec Frédéric on ne se connaissait pas avant de lancer le projet. J’ai twitté mes interrogations sur le sujet et Frédéric a saisi le tweet au bond. En fait, on a commencé à travailler ensemble déjà à distance via Twitter sans s’être rencontrés auparavant. C’est déjà un premier indice de mutation de la manière dont on travaille ensemble à l’ère numérique. Et puis, effectivement, on s’est dit qu’en travaillant sur des objets un petit peu nouveaux, on ne voulait pas s’enfermer dans les formats classiques de l’université, par exemple un livre écrit, stable ou juste un colloque. On a donc ouvert un livre en ligne, un livre en fait fluide au sens où les auteurs et les autrices ont la possibilité de le réécrire, de modifier leur article ou leur chapitre en permanence, en particulier en suivant les suggestions ou commentaires de gens qui passeraient, qui seraient intéressés et qui voudraient interagir.
L’idée, finalement, c’est aussi d’adapter la proposition d’écriture à l’objet auquel on s’intéresse.

Josquin Debaz : Cette démarche s’inscrit dans le cadre de ce qu’appelle depuis 10/15 ans les humanités numériques ?

Frédéric Clavert : Je vais beaucoup te décevoir, mais, en fait, ce n’est pas un projet d’humanités numériques ; ça dépend, c’est toujours la même chose, ça dépend de comment on définit les humanités numériques, l’histoire numérique, etc. Ce qui nous intéresse ici c’est de regarder ce qui se passe entre les quelques historiens/historiennes qui restent qui refusent les évolutions numériques : on a organisé une journée où Arlette Farge débattait avec Sean Takats, qui est aujourd’hui un collègue de l’Université de Luxembourg, qui fait partie de ceux qui ont dirigé le projet Zotero, un logiciel de gestion des références bibliographiques et ensuite, avec Abby Mullen, Tropy qui, justement, est un logiciel qui gère les photos qu’on prend en centre d’archives, qui est beaucoup plus historien que Zotero. Et, en tout cas quand on lui dit que telle collection d’archives a été numérisée, comme elle connaît très bien les archivistes, Arlette  Farge va voir les archivistes et leur demande les originaux. Elle les connaît très bien, elle a expliqué qu’elle arrivait dans ces cas-là à travailler quand même souvent sur la version papier.
Entre ces quelques cas un peu extrêmes et puis l’autre côté, c’est-à-dire les gens à la rigueur comme moi, c’est-à-dire qui ne travaillent quasiment plus sur les archives que par leur ordinateur, ce qui nous intéresse c’est de regarder tous ceux qui sont entre, c’est-à-dire tous ceux qui sont entre les historiens qui sont dans le monde d’Arlette Farge d’une manière et les historiens qui sont dans le monde des humanités numériques et regarder les pratiques informatiques entre ces deux extrêmes. Ce sont finalement ces pratiques-là qui nous intéressent avec une focalisation sur l’archive, mais on étend aussi un peu parce que je pense que le passage de l’écriture à la main, puis à la machine à écriture puis à l’ordinateur change aussi l’écriture, il n’y a pas que la lecture des archives ou leur analyse.

Caroline utilise des mots plus élaborés pour ça, moi j’appelle ça « le ventre mou » des historiens et historiennes qui, en fait, ont intégré énormément de pratiques informatiques sans les documenter. C’est pour ça qu’on a essayé de mettre en avant, dans les articles les plus récents, la notion de pratique informatique discrète, toutes ces pratiques informatiques qu’on a de fait adoptées sans les expliciter, en partant du principe que dans ces pratiques informatiques – prendre des photos en centre d’archives ça pose aussi la question de comment on les classe sur l’ordinateur donc comment on les retrouve ou comment on les perd ; écrire avec un traitement de texte et non plus à la main ou à la machine à écrire, parce qu’après la notion de brouillon n’est plus du tout la même ; utiliser les réseaux sociaux numériques pour communiquer et interagir entre chercheurs – toutes ces pratiques changent, pour nous, la manière dont on fait de l’histoire et c’est ça qui nous intéresse.
On n’est pas sur des projets comme la Time Machine, par exemple, qui ambitionne de tout numériser et de restituer ça, on ne sait pas encore très bien comment, d’une manière un peu interactive. On n’est pas non plus dans les centres d’archives à se concentrer uniquement sur l’objet papier, on est vraiment entre les deux. Qu’est-ce que ça change d’avoir son appareil photo ou son archive ?

Josquin Debaz : Les humanités numériques est un terme un peu fourre-tout quand même, quelquefois qualifié de parapluie pour englober un peu tout ce qui n’était pas encore documenté, on va dire, par la tradition de certaines disciplines. Vous, vous le voyez plutôt comme un creuset de nouvelles approches, d’un renouveau ou, peut-être, d’un grain de sel qui est mis dans des pratiques plus anciennes.

Frédéric Clavert : Le terme de grain de sel est assez intéressant. Du coup ce n’est pas un grain de sel, c’est toute la salière ! Je reprends l’exemple de l’appareil photo qui est très parlant parce qu’en fait, maintenant, on n’y va plus avec un appareil photo, on y va avec son smartphone pour prendre les photos et le smartphone c’est aussi l’intelligence artificielle qu’on emmène dans la salle de lecture. Dans quelle mesure ça change la manière dont on approche les archives, on ne sait pas encore, on ne sait pas nécessairement. On a quand même quelques idées sur quelques phénomènes, c’est juste qu’il faut s’y intéresser si on veut savoir quels sont les biais qu’on apporte aussi avec ces dispositifs.

12’ 08

Caroline Muller : Après, de fait, on dit qu’on n’est pas un projet en humanités numériques au sens où on n’est pas sur les mêmes questions que les projets qui s’affichent en humanités numériques, mais on brasse des questions qui sont tout à fait liées, que ce soit par exemple dans le chapitre que Frédéric a pu écrire sur ce que c’est que faire une requête à une API quand on fait de la recherche, en passant par les archivistes qui nous expliquent ce que c’est que d’absorber massivement des données d’archives nativement numériques à partir des services administratifs, puisque c’est aussi un des volets du projet. On essaye de faire émerger un dialogue entre les disciplines qui tournent autour des archives et de l’histoire. En fait, on parle tout le temps de questions de données, de requêtes, de moteurs de recherche. Pareil, aujourd’hui il n’y a quasiment plus d’historien ou d’historienne qui n’utilise pas quasi quotidiennement un moteur de recherche. Or, on s’est rendu compte que le passage par le moteur de recherche, ce qu’on y fait, comment on questionne, comment on pose sa question, tout ça c’est encore sous les radars des réflexions méthodologiques.
Autrement dit on n’est pas la ??? machine ou la ??? machine [13 min 25], c’est-à-dire qu’on n’est pas dans des projets qui visent à restituer des formes de réalité, équipées, etc., mais on pose des questions qui sont des questions de fond qui sont communes aux humanités numériques. Je pense Frédéric qu’on peut dire, tu me corriges si je m’égare.

Frédéric Clavert : Oui. D’autre part, on ne s’interdit pas d’utiliser des méthodologies issues des humanités numériques, puisqu’on a fait une analyse sur la base d’une méthodologie qui est proche de ce qu’on appelle le topic modeling, sur par exemple, un livre qui relate des expériences d’historien pour essayer de trouver quelle est l’importance du sujet informatique. Le topic modeling est un processus informatique, c’est de la statistique en gros, qui permet de voir par association de mots, de séquences de mots, un peu les grands sujets qui sont discutés dans un corpus de texte. Je vais tuer l’insoutenable suspense, mais, en règle générale, on a trouvé très peu de traces d’usages de l’informatique alors même que l’on sait, puisque qu’on connaît personnellement certains des historiens dont il est question, qu’ils utilisent intensément cet outil informatique.

Josquin Debaz : Donc, ce n’est pas toujours discret, c’est même parfois clandestin !

Frédéric Clavert : Oui, parfois c’est même clandestin. On a même trouvé, ça nous vient toujours de notre collègue Sean Takats, des faux récits d’archives. Je ne sais pas si tu veux expliquer, Caroline, ce qu’est un faux récit d’archives.

Caroline Muller : Le faux récit d’archives c’est la façon dont des collègues vont, dans certaines introductions de livres, quand ils explicitent les fonds qu’ils ont vus, etc., raconter des récits en archives qui n’ont pas eu lieu.

Frédéric Clavert : Des récits d’archives qui n’ont pas eu lieu, c’est-à-dire que lorsqu’on regarde précisément comment le document d’archive est cité, on s’aperçoit, en fait, que c’est sa version numérique qui est citée, ce n’est pas sa vraie version en centre d’archives. À la fin d’un livre d’histoire de « professionnels », entre guillemets, il y a toujours la liste des archives consultées et, quand on regarde, on s’aperçoit que les archives consultées, en fait, sont des corpus numérisés d’archives, ce ne sont pas les archives en centre d’archives qui ont été consultées ; ces archives n’ont pas été consultées dans une salle de lecture physique. Ça pose problème de différentes manières. Il y a quand même un élément méthodologique derrière : on ne lit pas toujours la même chose, on ne lit pas à l’écran comme on lit dans une salle de lecture, mais c’est aussi la manière dont on se représente. Le récit d’archives est un récit initiatique surtout quand il est dans les thèses, ça veut dire qu’on adapte un récit initiatique à l’idée qu’on se fait de la profession et qui est issue de ce livre, entre autres, d’Arlette Farge, ce n’est pas le seul livre, mais, entre autres, issus du Goût d’archives d’Arlette Farge. On se conforme à l’idée que la profession a d’elle-même.

Caroline Muller : Une image de profession des vieux papiers et des archives.

Josquin Debaz : Cette numérisation permet aussi un accès bien plus facile à l’archive ; je pense, en particulier, à des personnes qui, par manque de ressources, parce qu’elles habitent loin des centres d’archives, dans d’autres pays par exemple. Est-ce que ça peut aussi changer un peu la démographie des historiens ?

Frédéric Clavert : J’ai des doutes sur la démographie. Je pense que la démographie des historiens est plutôt liée au poste.

Josquin Debaz : Donc elle est en chute libre puisqu’il y a moins de postes.

Caroline Muller : Cela dit, là où ça change, à mon avis, le caractère d’ensemble de la profession, comme on est dans un contexte de concurrence extrême, justement, pour ces postes qui sont indexés sur le nombre de publications, c’est que ça conduit effectivement beaucoup de jeunes collègues à se reporter d’abord vers ce qui est numérisé parce que, tout simplement vous l’avez dit à l’instant, aller dans un centre d’archives pour voir un fond ça prend du temps, ça prend de l’argent. Si on a la possibilité de faire une bonne recherche à partir d’un fond numérisé, entre le fond numérisé et le déplacement et tout ce qu’il implique, ce sera bien plus rentable, à bien des égards, de consulter le fond numérique.

Josquin Debaz : À l’opposé ou en contre-coup on risque d’avoir peut-être moins tendance à aller voir ces archives qui ne sont pas numérisées. On a, d’un côté, un aspect un peu boulimique, tout semble à disposition, donc on a envie de tout voir, de tout rechercher et, de l’autre côté en même temps, comme vous le dites, dans un contexte assez tendu on va peut-être tout simplement aller au plus efficace.

Caroline Muller : On a déjà des exemples de ça – Frédéric pourra en parler parce qu’il a un livre qui sort sur le sujet ces temps-ci – en particulier autour de la presse numérisée. On sait désormais que les corpus de presse numérisée font l’objet de ce qu’on pourrait appeler des sur-enquêtes au sens où, par exemple, les étudiants qui vont préparer leur mémoire de fin d’études vont pouvoir très facilement utiliser ces corpus, mais qu’ils vont laisser dans l’ombre tout un tas d’autres corpus qui, eux, ne sont pas numérisés. C’est ce que Claire Lemercier avait proposé d’appeler le syndrome du lampadaire, c’est-à-dire le fait de ne plus voir que ce qui est numérisé et ça a déjà un effet, bien sûr, sur un certain nombre de pratiques de recherche.

Frédéric Clavert : Un exemple célèbre est un article de Yann ???, si mes souvenirs sont bons, de 2013, où il montre pour la presse canadienne – c’est un collègue canadien de l’Université de ??? [19 min 30] – qu’en fait les journaux anglophones ont été mieux numérisés que les journaux francophones au Canada et les collègues canadiens avaient tendance à beaucoup plus citer, désormais, la presse numérisée par rapport à la presse non numérisée, donc ça déplaçait le point de vue. Si on travaille sur le Québec, on déplaçait le point de vue de Montréal vers Toronto. Mais même à Toronto, en fait on déplaçait le point de vue puisque le 19e siècle est une période où il y a énormément de presse, de types de journaux par rapport à ce qu’on connaît aujourd’hui, mais les petits titres des quartiers populaires n’avaient pas été numérisés. Donc ça déplaçait aussi le point de vue à Toronto en favorisant le point de vue des élites, les principaux journaux nationaux.
Aujourd’hui c’est différent. Au Canada la numérisation a énormément progressé et maintenant les journaux francophones sont aussi bien numérisés, mais pendant un temps il est clair, Yann ??? a montré que les collègues canadiens favorisaient ce qui était numérisé.

J’aimerais juste bien contrebalancer parce qu’on est sur un point qui est négatif et, à juste titre, il faut le mettre en avant, mais on a quand même sur le livre en ligne un chapitre de Claire-Lise Gaillard, dont une version étendue qui a été publié chez ??? [21 min] dans le livre auquel faisait référence Caroline. Claire-Lise travaille sur les annonces, le marché de la rencontre, du 19e jusqu’à l’entre-deux-guerres, si mes souvenirs sont bons. C’est un sujet très intéressant mais qui aurait été impossible sans la numérisation, parce qu’il aurait fallu, avant la numérisation, un type de presse. On savait, par exemple, qu’il fallait rechercher quelque chose pendant un an, il fallait prendre tous les titres pendant un an, un par un, et regarder ce qu’il y avait dedans. Je l’ai fait. Mon tout premier mémoire à Sciences Po Strasbourg était sur The Economist et, sur quatre ans, j’ai dépouillé tous les The Economist pour trouver tous les articles dans cet hebdomadaire sur la France. C’est d’ailleurs pour ça qu’on avait pris un hebdomadaire et pas un quotidien, ça aurait été trop difficile, trop long, pour un mémoire, quelqu’un qui est en troisième/quatrième année. Pour les petites annonces ça aurait été absolument gigantesque à faire ou alors, il aurait fallu que Claire-Lise Gaillard se cantonne sur quelques titres de presse. Là, elle a pu aller beaucoup plus loin et prendre l’ensemble de la presse numérisée de l’époque pour trouver ses sources et faire sa thèse.
On perd toujours quelque chose, mais on gagne aussi quelque chose. Du coup ça déplace la manière dont on fait de l’histoire, ça déplace la focale, ça déplace le sujet qu’on étudie.

Josquin Debaz : Ça permet de faire la balance sans cesse, des allers-retours, d’aller au plus près, au petit détail et, en même temps, de faire des analyses plus larges, voire systématiques, en tout cas une fois qu’on a délimité sa source. Et ces allers-retours doivent être particulièrement heuristiques.

Caroline Muller : Oui, c’est ce qu’on appelle lecture proche et lecture distante, c’est-à-dire le fait d’apprendre à lire sans lire, c’est-à-dire à demander à la machine de brasser des gros volumes de données pour pouvoir nous les restituer dans un format lisible, par exemple dans des tableaux, dans des cartes. On parlait tout à l’heure de topic modeling, on peut demander à des logiciels de nous restituer les grandes thématiques qui vont émerger d’un corpus. Ça va être toute une série d’outils qui appartiennent à la lecture distante. Apprendre, en fait, à ne pas lire directement, si on est un peu provocateur. Évidemment ce n’est pas le moi qui le dis, il y a toute une littérature là-dessus. Et puis, associer à cette lecture distante une lecture qu’on dira proche qui est la lecture plus traditionnelle au sens où on prend le document et on le lit d’une manière individuelle, en lisant le journal en long en large et en travers si vous voulez.
Les deux approches ne s’excluent pas, voire c’est souvent là que ça devient très intéressant. Vous pouvez en parler à Frédéric puisque Frédéric travaille beaucoup dans cet aller-retour dans cette lecture proche et lecture distante. Moi un peu moins, je suis plutôt une historienne qui travaille plus en lecture proche.

24’ 15

Frédéric Clavert : Il y a même clairement des cas où la lecture distante est une condition de la lecture proche.
Deux collègues autrichiennes ont, par exemple, travaillé sur les grands corpus de presse numérisée. On parle beaucoup de la presse numérisée parce que c’est ce qui a été le mieux et le plus numérisé. Ce qui les intéresse ce sont les migrations de retour : les gens qui changent de pays et qui, à un moment, rentrent chez eux, qui rentrent dans leur pays d’origine. Elles ne vont pas commencer à faire leurs analyses sur l’ensemble de la presse. Il faut d’abord qu’elles restreignent leur corpus pour avoir quelque chose qui concerne plus le sujet. Dans ce cas, elles font du topic modeling sur l’ensemble des corpus. Le topic modeling leur permet de chercher, d’avoir les articles qui vont les intéresser et là elles peuvent commencer à travailler y compris en lecture proche. Sans cela, elles auraient du mal à faire la lecture proche.

Caroline Muller : Ce qui implique néanmoins d’avoir déjà une très bonne connaissance de sa question et de son sujet avant, sinon on ne sait pas comment chercher, on ne sait pas quoi demander. À mon avis il y a quand même déjà pas mal de la lecture proche, mais ça oblige à avoir une familiarité qui ne peut pas émerger véritablement avant d’avoir fait un peu de lecture proche. Si je me permets de lancer la discussion avec Frédéric.

Frédéric Clavert : Oui, c’est évident. Maintenant ce n’est pas tout à fait « comme avant », entre guillemets, dans la mesure où les hypothèses peuvent être plus larges, en fait moins bien définies. On travaille sur hypothèse. À un moment on s’intéresse à un sujet, donc, la première hypothèse, c’est que le sujet est intéressant, déjà ! Il y a toujours une hypothèse à un moment. Simplement les hypothèses peuvent être un peu moins précises, on peut laisser « parler » un peu plus les archives, entre guillemets, par la lecture distante.
Attaquer un corpus sans aucune question préalable ça risque de tomber dans des extrémités regrettables comme cette équipe qui a dit qu’elle avait trouvé dans le corpus de Google Books de nouvelles orthographes de certains mots. En fait ce sont des erreurs d’OCR, de reconnaissance optique des caractères

Josquin Debaz : Je vous propose de revenir un petit peu au projet du Goût de l’archive à l’ère numérique. C’est donc un livre en ligne collectif. Combien de personnes participent ?

Caroline Muller : On avait une douzaine de textes, plus que ça maintenant, une vingtaine. En plus, il y a encore un chapitre dans les soutes qu’il faut qu’on lise et qu’on mette en ligne.

Frédéric Clavert : On a 20 chapitres hors introduction, avant-propos et hors bibliographie. Sur ces 20 chapitres, deux sont d’ailleurs traduits en polonais puisqu’on avait l’occasion de le faire. Ça fait une vingtaine de chapitres. Certains chapitres ont effectivement des autrices et auteurs seuls, d’autres en ont plusieurs. Ça fait plus de 20 auteurs ; ça a fait entre 20 et 30 auteurs et autrices.

Josquin Debaz : À chaque fois c’est ouvert aux commentaires ?

Frédéric Clavert : C’est un dispositif technique très simple que Wordpress permet. La dernière fois que j’avais regardé des statistiques : un site sur deux qui est ouvert aujourd’hui est ouvert sous Wordpress. C’est vraiment un logiciel très répandu, plutôt simple à utiliser et on y rajoute un plugin qui fait qu’on peut commenter les textes paragraphe par paragraphe ou dans leur globalité. C’est très intéressant. Caroline a un peu plus regardé les commentaires. Si mes souvenirs sont bons on en a entre 300 et 350, sur certains chapitres de vraies discussions méthodos, interdisciplinaires, parce qu’il n’y a pas que des historiens, il y a aussi une philologue, des archivistes qui ont publié. Entre philologues et historiens c’est une longue histoire et là il y a carrément des questions de vocabulaire qui se posaient.

Josquin Debaz : Ensuite, à partir de ce travail qui reste encore ouvert, vous avez publié à la fois dans un numéro spécial de La Gazette des archives et vous venez aussi de publier un chapitre dans l’ouvrage de Clarisse Bardiot, Émilien Ruiz et Esther Dehoux, La fabrique numérique des corpus en sciences humaines et sociales qui vient de paraître l’année dernière. C’est aussi quelque chose qui sort, qui échappe, en fait, à cette première plateforme.

Caroline Muller : Oui, complètement. Le projet a maintenant un petit peu de temps derrière lui. On a eu le temps, disons, d’expérimenter différentes formes. D’abord effectivement ce numéro dans La Gazette des archives parce que, comme vous l’avez précisé, on tient beaucoup à ce dialogue interdisciplinaire en particulier avec les archivistes. Ça nous paraissait assez logique, finalement, de restituer aussi les résultats du projet au sein de la communauté des archivistes puisque La Gazette des archives c’est d’abord un opus qui est édité pour la communauté des archivistes.
Ensuite, effectivement, on a écrit différents articles à partir de ce qu’on avait pu lire et comprendre des chapitres qui nous ont été donnés. En fait, maintenant on commence à avoir une petite vue d’ensemble, on a une vingtaine d’auteurs et d’autrices qui viennent d’horizons très différents, qui ont des pratiques très variées. On ne le savait pas quand on a commencé, mais de fait on en est là, ça nous sert un peu de données de réflexion sur les mutations d’ensemble de l’histoire à l’ère numérique.
Là, on est passé à une phase du projet qui s’appelle culturiste, on travaille justement sur les cultures historiennes à l’ère numérique et on s’intéresse de manière plus ciblée aux pratiques discrètes. Dans cette vingtaine de chapitres, on a pu constater toute cette gamme de petits gestes qui ne sont pas forcément pensés et qui, pour nous, changent continuellement la manière de travailler.
En fait, on est vraiment sorti de la phase Goût de l’archive au sens relecture du livre d’Arlette Farge sur une plateforme en ligne, puisque, entre-temps, on est passé par les formes beaucoup plus académiques et habituelles de diffusion – articles, livres – et là on est sur un autre projet de recherche sur lequel on donnera d’ailleurs des nouvelles d’ici quelques semaines normalement.

Josquin Debaz : Donc d’un objet livre évolué, vous avez presque fait une espèce de forme vivante, jamais finie. Cette non-clôture implique aussi des façons de travailler chez vous ?

Frédéric Clavert : Oui. En tout cas Caroline et moi ne travaillons plus de la même manière avant qu’après, c’est certain. Par contre, il ne faut peut-être pas pousser les choses à l’extrême au sens où une fois que le chapitre est très bien installé, les auteurs et autrices y reviennent quand même rarement. Il y a quand même un moment où les choses se figent.
L’idée, par exemple, du numéro de La Gazette des archives c’était aussi faire une sorte de capture d’écran du livre à un moment donné. Tous les chapitres n’y sont pas ; certains avaient une maturité que les autres n’avaient pas, tout simplement. Il y a quand même un moment où les choses se figent. Nous nous dirigeons vers le projet, c’est un peu différent, mais comme auteur et autrice, il y a un moment où on doit passer à autre chose.

Caroline Muller : Par contre, ça a été un exercice très intéressant au moment où il a fallu passer du texte en évolution au texte imprimé papier dans La Gazette des archives. On s’est demandé, par exemple, ce qu’allaient devenir les commentaires, toutes les traces d’évolution du texte parce que le papier ne permet pas de mettre les versions, il ne permet pas de mettre dans les marges tous les commentaires qui ont mené au texte définitif.

Frédéric Clavert : Je ne sais pas si les historiens médiévistes approuvent ce propos !

Caroline Muller : En tout cas c’était intéressant en soi de constater tout ce qu’on perdait par rapport à l’environnement dans lequel le texte avait été écrit au départ.

Josquin Debaz : Est-ce que le fait d’avoir, comme ça, un dispositif ouvert fait écho au mouvement de la science ouverte ? Est-ce qu’il y a une résonance avec ça ?

Frédéric Clavert : Je crois qu’on n’avait pas trop ça en tête. Pour nous c’était assez naturel de le faire de manière ouverte, comme ça, ce n’était pas en référence à ce mouvement précis.

Caroline Muller : Si nous sommes arrivés sur ces sujets-là, que nous nous y sommes intéressés, Le goût de l’archive numérique dès 2016, ça ne tombe non plus de nulle part. Frédéric a déjà une trajectoire d’historien numérique, moi j’enseigne sur ces sujets-là depuis déjà deux ans, nous sommes sensibilisés à toutes ces questions-là. Peut-être que si nous n’avions pas eu ces trajectoires initiales on ne se serait pas dit qu’il faut une plateforme ouverte avec une écriture en mouvement, etc. Je ne pense pas qu’on l’ait conscientisé, mais, de fait, on est tous les deux très intéressés et actifs dans ces univers-là. Je ne veux pas parler pour toi, Frédéric, mais il me semble que ce n’est pas faux !

Frédéric Clavert : Ce n’est pas faux, mais on n’oublie pas que c’est quand même un projet qui est né sur Twitter, ton tweet est de 2016. Disons que l’un comme l’autre on a aussi connu, et je pense Josquin tu as aussi connu un Twitter, qui est bien différent. Celui d’aujourd’hui est bien différent de celui de 2016. Il y a aussi une suite logique, ce n’est pas que notre milieu académique où serait poussée la science ouverte, c’est aussi l’habitude du lieu où le projet est né, Twitter : soit tout est privé, soit tout est public et la plupart des gens choisissent de tout faire en public. C’était une discussion publique, c’est né aussi dans une discussion publique sur une plateforme qui favorisait, à l’époque, la discussion publique et pas toujours que la controverse publique.

Josquin Debaz : Si des auditeurs veulent suivre vos activités réciproques, prendre contact avec vous pour en savoir plus, quels sont les moyens à l’heure actuelle les plus efficaces ?

Frédéric Clavert : Le pigeon voyageur !

Caroline Muller : On a une adresse de contact sur le livre en ligne, donc gout-numerique.net. J’ai encore une présence sur Twitter mais Frédéric pas, lui est sur Mastodon. D’ailleurs on n’a pas encore décidé de ce qu’on allait faire du compte Twitter du projet qui a été un bon endroit pour suivre l’actualité pendant quelques années. Il y a une adresse de contact sur le livre en ligne. Il ne faut pas hésiter à nous écrire s’il y a des questions. Par ailleurs, dans quelque temps on ne va pas tarder à donner des nouvelles sur ce qu’on va faire dans les temps à venir, il ne faut pas hésiter à revenir à l’actualité.
On a aussi un onglet « blog », sur le livre en ligne, qui permet de rendre compte, quand on mène des évènements, quand on organise des rencontres, des journées d’étude, etc., par exemple la journée d’étude des archives nationales, où on a les captations qui vont être disponibles sur la plateforme.

Josquin Debaz : Donc cette journée qui invitait notamment à une discussion entre Sean Takats et Arlette Farge, discussion qui était particulièrement intéressante. Merci beaucoup Caroline Muller et Frédéric Clavert.

Frédéric Clavert : Merci.

Caroline Muller : Merci.

Voix off : Cet épisode touche à sa fin. Nous espérons qu’il vous aura intéressés. Envoyez-nous vos questions, commentaires et propositions par e-mail à coucou@lacantine-brest.net ou via Twitter. À très bientôt.