Wikipédia, code source

De April MediaWiki
Aller à la navigationAller à la recherche


Titre : Wikipédia, code source

Intervenants : Jules WP - Thomas Rozec

Lieu : Binge Audio

Date : 15 janvier 2021

Durée : 18 min 47

Podcast

Licence de la transcription : Verbatim

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Description

Wikipédia fête ses 20 ans le 15 janvier. Et c'est peu que de dire qu'en deux décennies l’encyclopédie universelle s’est installée dans nos vies comme outil incontournable.
Et sans surprise, ces montagnes de savoirs construites collectivement attirent les convoitises. Certaines agences de communication n'hésitent pas à bricoler les pages de leurs clients pour les tourner à leur avantage. Mais la communauté veille.
Comment sont contrôlées et vérifiées les informations sur Wikipédia ? Et comment, au printemps 2020, une vaste campagne de communication cachée a été désamorcée par les usagers de l'encyclopédie ?
Thomas Rozec interroge Jules WP, modérateur sur Wikipédia.

Transcription

Voix off : Un podcast Binge Audio.

Thomas Rozec : Salut. C’est Thomas Rozec.
Le 15 janvier 2001, il y a tout juste 20 ans, Wikipédia voyait le jour. Celles et ceux qui partagent mon grand âge se souviennent sans doute de ses débuts et de la réputation ultra négative qu’elle se trimballait. En gros, si vous vouliez éviter de vous ramasser au mieux une réflexion acerbe, au pire un zéro pointé, il était conseillé d’éviter de citer la jeune encyclopédie en ligne dans vos copies ou dans vos exposés, vu qu’elle était considérée comme le temple du n’importe quoi et de l’approximation.
20 ans plus tard c’est un doux euphémisme de dire que les choses ont bien changé. S’il convient toujours de regarder avec une bonne dose d’esprit critique ce qu’on pêche sur la vaste plateforme, force est de constater qu’elle s’est imposée comme un outil de travail et de recherche pour bon nombre d’entre nous. Une particularité qui a son revers, car elle peut susciter des volontés pas très correctes, dont tripatouiller des contenus à des fins purement commerciales. Mais la communauté chargée de tenir et d’animer l’encyclopédie en ligne veille. On en avait causé dans un épisode en juin 2020 que je vous propose de réécouter tout de suite.
Bienvenue dans Programme B.

L’affaire qui avait à l’époque initié cet épisode a eu lieu fin mai 2020. Elle est un peu passée inaperçue entre le raz-de-marée du premier confinement et les prémices de la mobilisation mondiale contre les violences policières et le racisme. Repérée par des confrères du Monde, notamment, une page du très spécialisé Bulletin des administrateurs de Wikipédia révélait les résultats d’une enquête menée par deux d’entre deux, répondant respectivement aux pseudos de Jules WP et 0x010C.
Après plusieurs semaines de recherche ils sont parvenus à prouver que plusieurs agences de communication œuvraient sur la plateforme, via de faux comptes d’utilisateurs, pour améliorer ou agrémenter en cachette les pages de clients aussi divers que BNP Paribas, le groupe Carrefour, l’éditeur de presse Mondadori ou encore le studio de jeux vidéos Quantic Dream et le groupe de luxe LVMH, propriétaire du groupe média Les Échos Le Parisien qui est actionnaire minoritaire de Binge Audio, je le précise. Une activité révélatrice de l’importance, dans la réputation en ligne des acteurs économiques mais aussi politiques, qu’a prise Wikipédia.
Pour en savoir un peu plus j’ai donc discuté, en juin dernier, avec l’un des auteurs de l’enquête, le fameux Jules WP, administrateur de l’encyclopédie côté français et je lui ai demandé de me raconter comment tout ça avait commencé.

Jules WP : En fait, tout simplement, c’est un autre bénévole, un troisième bénévole, un rédacteur bénévole, qui a contacté une agence de communication marocaine pour proposer ses services pour aider à rédiger des articles Wikipédia. Il l’a fait dans le but de trouver d’autres articles rédigés par cette agence de communication marocaine. Cette piste a été infructueuse, ça n’a pas fonctionné. Il nous avait informé de son initiative, c’est ce qui nous a donné l’idée à 0x010C, mon camarade d’investigation en la matière, et à moi de contacter des agences, pour le coup françaises, pour essayer de trouver des articles qu’elles ont rédigés contre rémunération pour des clients.

Thomas Rozec : Sachant que ce n’est pas interdit de rédiger des articles contre rémunération. Par contre, ce qui est interdit, sur Wikipédia, c’est de ne pas préciser que c’est rédigé contre rémunération, si j’ai bien compris.

Jules WP : Tout à fait. Il n’est pas strictement interdit de rédiger des articles contre rémunération. Il y a une obligation qui est fixée par la communauté, c’est de déclarer le fait que les contributions sont rémunérées, d’indiquer par qui elles sont rémunérées, donc pour quel client ou pour quel employeur elles sont rémunérées. Même si ce n’est pas interdit, il faut savoir, de manière générale que Wikipédia est une encyclopédie et la philosophie, le but, c’est de faire une synthèse du savoir humain établi et le but n’est pas de faire la promotion que ce soit d’un artiste, d’une personnalité, d’une entreprise, d’une association même si son but est louable ; le but n’est pas d’en faire la promotion.

Thomas Rozec : Qu’est-ce qui vous a fait vous dire que ce type de pratique existait ? Ça avait été le cas, il y avait déjà eu des affaires qui avaient mis la puce à l’oreille de la communauté Wikipédia ? Ce n’était pas la première fois que ça croisait votre route ?

Jules WP : Non, effectivement. Déjà, il faut savoir que les bénévoles de Wikipédia, qui sont des dizaines, même des centaines d’internautes, ont l’habitude des modifications promotionnelles. Souvent ces modifications promotionnelles sont faites, entre guillemets, « de bonne foi », c’est-à-dire que certes elles contreviennent aux règles de Wikipédia, puisque le but sur Wikipédia ça va être d’écrire de manière neutre en citant des sources publiques, mais elles ne le font pas dans l’intention de nuire. Elles ne savent pas forcément toujours que Wikipédia est une encyclopédie, elles ne savent pas forcément toujours qu’il ne faut pas rédiger de manière promotionnelle. Ça c’est assez habituel, les bénévoles ont l’habitude de gérer des modifications promotionnelles comme ça. Là, ce qui est particulier, c’est que ce n’est pas juste un artiste qui veut parler de lui ou le service de communication d’une entreprise qui veut parler de l’entreprise, là ce sont des agences de communication qui, elles, connaissent très bien le fonctionnement de Wikipédia, connaissent les règles de Wikipédia, avancent masquées volontairement, pas par manque de connaissances des règles mais sciemment.

Thomas Rozec : Qu’est-ce qui vous a fait vous dire que ces entreprises en particulier étaient en train de modifier du contenu sur Wikipédia ?

Jules WP : En fait, quand on a contacté des agences de communication, on leur a demandé un devis pour créer une page comme si on était un client, on leur a posé la question de savoir si elles avaient d’autres exemples de clients. C’est comme ça qu’on a pu savoir, pour certaines d’entre elles, sur quels articles elles avaient déjà contribué ; à partir de là, on a pu remonter via les historiques des articles. Il faut savoir que sur Wikipédia chaque article dispose d’un historique qui compile l’ensemble des modifications successives apportées à l’article et cet historique est public, il n’est pas nécessaire de créer un compte sur Wikipédia, n’importe quel lecteur peut le consulter : en haut d’une page il y a toujours un petit onglet « Voir l’historique ».

Thomas Rozec : Du coup, en fouillant dans ces historiques, sur quoi êtes-vous tombés ?

Jules WP : On est tombés sur des modifications promotionnelles mais souvent relativement subtiles. Comme je le disais les bénévoles ont l’habitude des modifications promotionnelles mais, en général, comme les gens ne connaissent pas les règles de Wikipédia, c’est très franchement promotionnel, c’est du contenu très publicitaire avec un ton promotionnel en lui-même, alors que là, comme ce sont des agences qui connaissent les règles de Wikipédia, elles jouent avec les règles. Elles savent que si elles font des textes très promotionnels elles vont être repérées immédiatement, donc les ajouts sont beaucoup plus subtils. Il y a même une agence qui nous a expliqué par téléphone, et on est restés un peu bouche bée avec 0x010C, que c’était impossible de supprimer un contenu qui serait négatif sur une entreprise, que ce n’était pas possible parce que les modérateurs le verraient, que donc elle préférait procéder par ajouts d’informations positives qui allaient, finalement, faire en sorte que l’information négative se retrouve noyée dans du contenu qui est positif.

Thomas Rozec : Quels types de clients ces entreprises ont-elles ? C’est sur quels types de contenus, quels types de pages qu’elles sont intervenues ?

Jules WP : Ça a presque été une surprise, finalement on n’a rien eu dans le domaine politique, on n’a pas du tout eu de personnalités politiques alors que, personnellement, je me serais attendu à ce qu’il y en ait quelques-unes quand même. Ce ne sont quasiment que des entreprises ou des personnalités du monde des affaires, donc des chefs d’entreprises, surtout des grosses entreprises, parfois des entreprises un peu moins connues. De toute manière, ça ne va pas être des petites entreprises puisque, sur Wikipédia, il y a des critères d’admissibilité qui sont définis par la communauté, qui permettent de décider si un sujet, en l’occurrence une entreprise, mais ça peut être un artiste, peu importe, a sa place sur Wikipédia ou non. Donc forcément les petites entreprises, de base, n’ont pas leur place sur Wikipédia.

Thomas Rozec : Quel intérêt ont ces entreprises à faire appel à ces agences ? C’est de la e-réputation pure et dure ? C’est de la promotion ? On a du mal savoir.

Jules WP : Ça dépend des cas. Il y a des cas dans lesquels c’est de la e-réputation c’est-à-dire qu’il va s’agir, parfois, de supprimer quand même quelques informations un peu négatives ou, en tout cas, de les noyer, comme je disais tout à l’heure, dans les informations positives. Parfois ce n’est pas franchement de la e-réputation, c’est plus de la communication, s’assurer qu’il y a une jolie page Wikipédia, sauf que souvent ça passe par des ajouts qui sont soit promotionnels, avec un ton promotionnel, soit des ajouts qui ne sont pas forcément encyclopédiques, par exemple détailler tel nouveau produit de l’entreprise, tel nouveau partenariat, alors que Wikipédia est une encyclopédie, le but est de faire la synthèse du savoir sur l’entreprise, pas de rajouter toute son actualité au fil de l’eau.

Thomas Rozec : Ce qui est frappant quand on lit les détails de l’enquête qui ont été publiés, là aussi sur des pages Wikipédia, c’est aussi accessible à tout le monde, c’est raccord avec la philosophe de la plateforme j’ai envie de dire, c’est que pour faire ces modifications, il y a des tas de comptes d’utilisateurs qui ont été créés, des faux utilisateurs de Wikipédia qui ressemblent beaucoup à des vrais utilisateurs de Wikipédia.

Jules WP : Oui. C’est ce qui nous a interpellé aussi. Pour certaines agences, les pages qu’on appelle des pages utilisateurs, qui sont en fait des pages de profil de ces comptes qui ont été créés, sont un peu construites comme celles des bénévoles avec un internaute qui dit qu’il est prof ou étudiant dans telle université, un autre qui dit qu’il adore la pêche à la mouche, vraiment des petites anecdotes qui laissent souvent penser à un profil de bénévole alors qu’en réalité c’est un compte, parmi plusieurs, qui appartient à une agence de communication. Sachant qu’en plus il y a une autre règle sur Wikipédia qui est qu’il est interdit d’utiliser plusieurs comptes pour une même personne, interdit d’utiliser plusieurs comptes sur un même article.

Thomas Rozec : En l’occurrence c’est ce qui s’est passé là.

Jules WP : C’est ce qui s’est passé. Plusieurs agences ont utilisé plusieurs comptes pour intervenir sur un même article.

9’ 15

Thomas Rozec : Comment avez-vous réussi à déterminer quels comptes étaient des faux et quels comptes pouvaient potentiellement être de vrais utilisateurs ? Comment avez-vous fait le tri ?

Jules WP : Ce n’est pas évident, ce n’est une science exacte. Pour certaines agences c’était assez évident parce qu’elles nous ont donné, par exemple, trois noms de clients et en suivant les historiques des articles de ces trois clients il y avait un seul compte qui coïncidait aux trois ou alors, à chaque fois, un compte pour chaque page, mais c’étaient les seuls comptes, dans ces articles-là, qui étaient promotionnels, qui faisaient des ajouts importants dans la période que nous avait indiquée l’agence. Parfois c’est plus compliqué et parfois il y a des comptes sur lesquels on a eu des suspicions. Il y a certains comptes qu’on n’a d’ailleurs pas publiés dans l’enquête, des comptes pour lesquels on a eu des suspicions, mais on n’a pas eu de faisceaux d’indices suffisants.
Il faut aussi savoir qu’on analyse le temps des contributions. Parfois on regarde aussi, ça peut être intéressant, la plage horaire de contribution, si les comptes contribuent pendant les horaires de bureau ou en dehors. Mais il peut y avoir des faux positifs, il y a une agence dont les salariés contribuent en dehors.
Parfois on peut avoir des éléments techniques, c’est-à-dire qu’il y a des bénévoles sur Wikipédia, ils sont cinq sur Wikipédia en français, qui ont accès aux adresses IP qu’utilisent les comptes. J’ai pu faire des requêtes tout simplement à un vérificateur d’adresses IP, je lui ai demandé est-ce que tel compte égal tel compte ? Il me répond oui ou non, comme ça je peux savoir si ce sont des comptes qui abusent, qui sont à plusieurs sur une même page ou pas.

Thomas Rozec : Est-ce que ces agences ont réagi une fois qu’elles ont su qu’elles s’étaient fait attraper, en gros, par la communauté ?

Jules WP : Pour l’instant, sur Wikipédia, elles n’ont pas réagi. Je viens de voir qu’il y a eu un article de presse dans Numérama où la journaliste a essayé de contacter les trois agences. Il y en a une seule qui a répondu positivement, qui a accepté de répondre, c’est BCW qui dit, globalement, qu’ils sont étonnés par la liste de comptes qu’on a fournis, mais ils reconnaissent effectivement que certains des comptes qu’on a fournis sont les leurs, ils ne précisent pas combien ni lesquels. Je ne sais pas dans quelle mesure ce qu’ils disent est vrai. On a repéré un certain nombre de comptes qui, pour nous, soit grâce à des éléments techniques soit grâce à des recoupements, des faisceaux d’indices, relèvent de l’agence, on n‘est pas sûrs à 100 % pour chacun des comptes.

Thomas Rozec : Au sein de la communauté de Wikipédia, puisque c’est une communauté qui communique énormément, qui discute beaucoup que ce soit pour construire les pages – d’ailleurs on peut le voir quand on remonte les fils de discussion, c’est parfois assez marrant de voir les accrochages qu’il peut y avoir sur des points très spécifiques –, de manière générale c’est une communauté qui discute beaucoup de la vie de Wikipédia. Comment a été accueilli ce travail d’enquête ?

Jules WP : Je rebondis juste sur ce que tu viens de dire. C’est vrai que la communauté discute beaucoup parce que la communauté fonctionne de manière horizontale. Wikipédia, contrairement à beaucoup de structures dans notre société, n’a pas de rédacteur en chef, n’a pas de chef en fait. Le principe de fonctionnement, que ce soit pour rédiger les articles ou pour définir les règles de la communauté, c’est la recherche du consensus, donc ça amène beaucoup de discussions.
Pour te répondre, ça a été bien accueilli, positivement accueilli par les bénévoles, dont beaucoup sont impliqués au fil de l’année, en temps normal et j’ai envie de dire dans l’ombre de Wikipédia, dans la surveillance des articles, dans la lutte contre les modifications promotionnelles, donc forcément ça a été bien accueilli. Maintenant il reste un travail de vérification des modifications en question pour annuler celles qui posent problème, en tout cas neutraliser le ton quand il est promotionnel, etc.

Thomas Rozec : Ce qu’il ne faut pas oublier avec cette enquête c’est que ce n’est pas un coup d’une fois, cette vérification c’est un travail au long cours. J’imagine qu’au fil des années, avec en plus la multiplication des acteurs qui ont un intérêt à avoir du contenu qui leur est positif sur Wikipédia, avec l’importance qu’a prise Wikipédia dans la vie culturelle numérique, on va dire, j’imagine que ce travail de vigilance est d’autant plus renforcé.

Jules WP : Oui. Après ça fait effectivement des années qu’il y a des modifications promotionnelles et les Wikipédiens se sont organisés. Il y a eu cette règle sur la déclaration obligatoire des contributions rémunérées, en 2014, qui fait suite à un scandale un peu similaire à celui d’aujourd’hui mais qui était, cette fois-ci, sur Wikipédia en anglais. Il a été découvert que sur Wikipédia en anglais il existait des centaines de comptes – de mémoire, je n’ai plus exactement ça en tête – qui étaient utilisés par une agence de communication qui s’en servait soit pour créer des articles promotionnels soit pour écrire du contenu négatif sur des concurrents, tout ça de manière cachée, en utilisant de multiples comptes, donc avec des abus assez patents.
Sur Wikipédia en français on s’est aussi organisés. Par exemple, ça fait quelques années maintenant qu’on organise un mois anti-pub, qui a lieu deux fois dans l’année, durant lequel, en fait, on regroupe nos efforts. Au lieu de travailler tout seul comme habituellement dans son coin pour essayer de neutraliser des articles qui sont marqués comme promotionnels, cette fois-ci on va s’y attaquer ensemble à plusieurs, pendant un mois, pour avoir plus d’impact et aussi pour se motiver. En fait, il y a tout simplement des bénévoles qui, tout au long de l’année, ajoutent des bandeaux orange qui indiquent « cet article a un ton promotionnel », ça catégorise tous ces articles. Pendant le mois anti-pub on va travailler à ce qu’on appelle décuver chacun de ces articles, en tout cas le plus grand nombre possible. C’est effectivement un travail au long cours et il y a une organisation de plus en plus grande des Wikipédiens et des Wikipédiennes bénévoles là-dessus.

Thomas Rozec : Tu notais tout à l’heure, c’est un peu quelque chose auquel on pense assez rapidement quand on suit l’actualité, c’est vrai qu’on peut s’étonner du fait de ne pas voir d’acteurs politiques dans la liste des comptes que toi et ton camarade avez trouvés ou dans la liste des contenus modifiés que vous avez retrouvés dans l’enquête, tant il est vrai qu’on sait que le personnel politique s’intéresse de près à ce qui se passe sur sa page Wikipédia. Je pense à ce qu’on a appris tout récemment sur Laetitia Avia, la députée La République En Marche, qui avait carrément une partie de son staff dédiée à gérer sa réputation en ligne et notamment les contenus qu’on trouvait sur Wikipédia.

Jules WP : Tout à fait. Effectivement, on n’a pas vu d’agence de communication qui rédigeait pour des députés ou du personnel politique. En revanche, comme tu le notes, il est très courant, ça a été sur le devant de l’actualité avec Lætitia Avia, mais en fait c’est quelque chose que les bénévoles de Wikipédia voient si ce n’est quotidiennement très régulièrement, ce sont des modifications qui consistent, surtout sur des pages de députés mais aussi sur d’autres élus, qui consistent soit à ajouter plein de contenus plutôt positifs, le compte-rendu des propositions de lois qu’ils ont faites, etc., soit parfois à supprimer carrément des mises en cause judiciaires, des condamnations judiciaires, des articles de Médiapart ou d’autres titres de presse d’investigation. Ce sont des choses qui touchent tout le spectre politique, de l’extrême gauche à l’extrême droite, c’est assez généralisé. C’est quelque chose d’assez quotidien. Pour le coup, comme ce sont des modifications qui sont assez peu subtiles, elles sont très facilement remarquées par les bénévoles, donc dans l’immense majorité elles sont annulées dans les secondes, minutes, au maximum heures qui suivent.
Ce qu’il y a de particulier avec les agences de communication c’est qu’elles connaissent bien les règles, du coup elles jouent avec les règles de Wikipédia, arrivent à être plus subtiles et parfois, pas toujours, elles arrivent à échapper à la surveillance des bénévoles.

Thomas Rozec : Qu’est-ce qui est enjeu, on terminera là-dessus, dans ce travail de vigilance ? C’est quoi ? C’est la crédibilité de Wikipédia qui a réussi à s’installer dans une place très spécifique dans le monde numérique, comme une référence, on peut le dire ?

Jules WP : Oui. Il y a la crédibilité, puisque sur Wikipédia il y a une exigence de citation des sources qui n’existait pas, d’ailleurs, dans les premières années de l’encyclopédie, ce qui fait que sa réputation a beaucoup évolué depuis et maintenant Wikipédia est davantage prise au sérieux, même si, en tant que lecteur, il faut toujours continuer, quand on lit une information sur Wikipédia, à faire preuve d’esprit critique et aller voir s’il y a une référence ou pas ; c’est extrêmement important. Il y a cette notion de fiabilité, mais il y a aussi une question d’état d’esprit. Le but de Wikipédia, comme je le disais, c’est vraiment de faire une synthèse du savoir existant On n’est pas dans une démarche commerciale, Wikipédia n’est pas une entreprise, c’est quelque chose qui est rédigé par des bénévoles, des internautes du monde entier. Le site lui-même ne montre pas de publicité, il n’y a pas de publicité sur Wikipédia, c’est financé uniquement par les dons. Wikipédia est un média indépendant. En fait, l’horizontalité sur Wikipédia, le fait qu’il n’y a pas de chef, fait que c’est très dur de faire pression sur Wikipédia. On a déjà eu des gouvernements d’Europe de l’Est, pas très démocratiques, qui souhaitaient faire pression sur Wikipédia ou même des chefs d’entreprise, etc., et ils n’ont aucun moyen de faire pression, ils n’ont pas de moyen de faire pression. Il n’y a personne sur qui faire pression puisque le pouvoir, finalement, est partagé entre tous les bénévoles. Ce qui est important c’est que l’indépendance de Wikipédia est primordiale et le fait que des agences de communication viennent, finalement, biaiser le contenu d’articles, c’est extrêmement problématique.

Thomas Rozec : Notez que la politique n’est pas totalement absente de cette affaire puisque qu’on trouve tout de même, dans la liste des contenus aux modifications suspectes, la page du Togo où a été notamment supprimée la mention d’un rapport d’Amnesty International critiquant les pratiques électorales du président actuel.
Merci à Jules WP pour ses réponses.
Programme B est un podcast sur Binge Audio préparé par Lorraine Besse, réalisé par Mathieu Thévenon et Alexandre Ferreira. Abonnez-vous sur votre appli podcast préférée pour ne manquer aucun de nos épisodes, Facebook, Twitter, Instagram pour nous parler et à demain pour un double épisode hors série.