La vidéosurveillance algorithmique menace nos villes, contre-attaquons

De April MediaWiki
Aller à la navigationAller à la recherche


Titre : La vidéosurveillance algorithmique menace nos villes, contre-attaquons

Intervenants : Marne - Myriam Michel

Lieu : Lyon - 25e Journées du Logiciel libre

Date : 25 mai 2024

Durée : 49 min 45

Vidéo

Licence de la transcription : Verbatim

Illustration : À prévoir

NB : Transcription réalisée par nos soins, fidèle aux propos des intervenant·es mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Description

Qu'est-ce que la VSA ? Quels sont ses dangers ? Que faire contre ?

Transcription

Myriam Michel : Bonjour. Désolée pour les petits soucis techniques et le retard.
Très rapidement, pour nous présenter, Marne et Myriam, deux membres de La Quadrature du Net.
Aujourd’hui, nous allons vous parler de vidéosurveillance algorithmique.

La Quadrature du Net

Je pense je pense que pas mal de gens, parmi vous, connaissent La Quadrature du Net et ses activités. La question qui peut se poser c’est : qu’est-ce qui a amené La Quadrature à travailler sur ces sujets de vidéosurveillance et vidéosurveillance algorithmique dans l’espace public?
Quand La Quadrature a commencé ses activités, en tant que collectif en 2008/2009, c’était essentiellement sur des questions de partage de la culture, les lois Hadopi étaient en discussion, Acta était en discussion, on était plus sur des questions de partage de la culture. On s’intéressait beaucoup à tout ce qui se passait sur Internet, les questions de censure, les questions de protection de données, mais c’était vraiment dans l’environnement internet. Petit à petit, les changements de contexte dans lequel on évolue, ont fait que La Quadrature a un petit peu étendu son travail. Un moment de basculement s’est fait en 2015 avec l’état d’urgence. À partir de là, on a commencé à beaucoup travailler sur des questions de surveillance et des questions de renseignement et à investir un petit peu toute la réflexion et le travail sur ce qui se passe dans l’espace public et pas seulement en ligne ; c’était 2015/2016. À partir de 2017, on a beaucoup travaillé sur les questions de données personnelles, on a notamment fait une campagne contre les GAFAM en 2018, c’était notre sujet principal à l’époque, et en même temps, dès 2017, on a commencé à travailler, à se renseigner, à voir un petit peu ce qui se passait dans l’espace public sur les questions de vidéosurveillance, dès 2017 et ça nous a amenés en 2019 à lancer une initiative qui s’appelle Technopolice.

Technopolice ?

Marne : Technopolice est parti d’une réflexion qu’on a eue. Nous nous sommes notamment demandé quelle est la place de l’intelligence artificielle dans les collectivités. Notre premier angle était plutôt celui de la smart city. On voulait se renseigner un petit peu sur la réalité de la smart city sachant qu’à l’époque c’était un discours très en vogue, on avait tout un fantasme de la ville connectée qui nous était vendu dans les médias et tout ça, on a donc voulu chercher à se renseigner là-dessus. Et très vite, en nous renseignant sur ce type de projet, nous nous sommes rendu compte que l’imaginaire qui nous était vendu correspondaient pas du tout à la réalité, d’ailleurs, de plus en plus, le terme qui était utilisé ce n’était pas celui de smart city mais celui de safe city et, en réalité, wue l’usage d’algorithmes au service des villes était beaucoup plus incarné vers un aspect sécuritaire. Par exemple, à l’époque, nous nous sommes intéressés à un projet, à Marseille, qui s’appelait « Big Data de la Tranquillité Publique », qui proposait déjà toute une panoplie d’outils au service d’une vision policière de la ville tournée autour de l’usage de drones, de l’usage de tout un tas de capteurs, dont les caméras mais aussi des micros, sur couche algorithmique pour analyser tout ça, mais aussi du recoupement de données, l’utilisation les données des données de comptes disponibles sur Internet en source ouverte ou de données issues des hôpitaux, de la police, etc., avec une volonté de connecter tout ça pour avoir une meilleure connaissance de la ville, des gens, etc.
C’est comme cela que nous avons commencé à nous intéresser particulièrement à la vidéosurveillance algorithmique qui va être le sujet d’aujourd’hui.
Du coup, comme on avait tout un imaginaire très sombre autour de la Technopolice, représentant les dangers de ce que c’est et qui est un peu oppressant, nous avons décidé de faire cette conférence plutôt sur une ligne un peu plus cynique avec des couleurs plus gaies.

La VSA détruit nos vies

Myriam Michel : Pour le sujet d’aujourd’hui, il va être question de vidéosurveillance algorithmique.
La vidéosurveillance algorithmique c’est, en fait, une couche logicielle qui vient s’ajouter aux caméras de vidéosurveillance déjà existantes pour permettre d’analyser les images qui viennent des caméras et de mieux classer, répertorier, trier tout ce qui en sort.
La VSA a de deux grands types d’utilisation. La VSA en temps réel : les images qui sont captées par les caméras équipées de VSA sont transmises au centre de supervision urbain et le logiciel va, en fait, détecter ce qu’on lui a demandé de détecter et donner, dans ces cas-là, en direct, des alertes aux agents du CSU qui eux, vont pouvoir prévenir la police qui interviendra. C’est le premier volet, ça se passe vraiment en temps réel sur les images qui viennent directement des caméras. Sur ce volet-là, l’utilisation de la VSA provoque deux grands changements :

  • le premier c’est un passage à l’échelle, puisqu’au lieu d’avoir un ou deux types derrière des caméras et qui n’ont pas la capacité physique de regarder toutes les caméras, on a un logiciel qui va tout regarde à leur place et les alerter, il y a donc vraiment un passage à l’échelle en termes de surveillance ;
  • l’autre aspect, qui change beaucoup avec la VSA, c’est qu’on aura donné par avance, au logiciel, le type d’événements, de situations et de comportements qu’il doit détecter, ce qui fait que la VSA va cibler un certain nombre de comportements et discriminer un certain nombre de populations ; un point sur lequel on reviendra.

Le deuxième grand volet de la VSA, celui qui est tout en haut à droite, c’est la VSA à posteriori. Là, les images qui ont été captées par la vidéosurveillance sont conservées, en théorie un mois maximum, en théorie, et ces images, qui étaient jusque-là analysées par la police, de manière précise, puisque analyser des milliers d’heures de vidéo ça demande forcément du temps, ça demande des moyens, donc dans les enquêtes quand il y avait vraiment besoin, sur des points très précis, on allait regarder les bandes issues des caméras pour repérer ce qu’on cherchait à repérer. La VSA va permettre d’analyser une quantité d’images beaucoup plus importante en beaucoup moins de temps, ce qui, là encore, provoque à nouveau un passage à l’échelle sur la capacité de surveillance et qui, surtout, va entraîner le fait que la police, au lieu de se dire « bon, on n’a pas beaucoup de temps, on n’a pas beaucoup de moyens, il faut qu’on cible vraiment ce qu’on va chercher », va avoir la possibilité d’aller chercher beaucoup plus de choses dans ces vidéos, ce qui va aussi renforcer considérablement son pouvoir.

Marne : Là, on parle essentiellement de la vidéosurveillance algorithmique à usage de la police, pour la plupart, ce qu’on va vous dire concerne cet usage-là. Il faut savoir que la vidéosurveillance algorithmique existe aussi pour des usages privés, par exemple, il peut y avoir de la vidéo de la VSA dans les supermarchés pour traquer les vols, il peut y en avoir dans les entreprises, il peut y en avoir à plein d’autres endroits et, là, les informations sont encore plus difficiles d’accès. On va vous parler un peu de la façon dont on a récupéré toutes les informations sur la VSA, en l’occurrence il y a d’autres champs, mais nous parlons essentiellement de la VSA policière.

Myriam Michel : Déjà, pour avoir une idée de ce que sont les attendus de ces usages qui sont repérés, on va repartir à la source de ce champ de l’intelligence artificielle qui est utilisée par la VSA, la computer vision. Voilà quelques exemples des algorithmes qui sont le plus utilisés dans la VSA.
Les premiers, ce sont les algorithmes de détection qui permettent d’isoler les différents éléments de l’image.
Les deuxièmes, ce sont les algorithmes d’identification. Ce type d’algorithme est bien connu, ils sont entraînés sur des grosses bases de données d’images, on leur donne plein d’images de voitures, plein d’images de chats, etc., pour qu’ils apprennent une sorte d’empreinte, des corrélations entre les pixels et leurs couleurs pour pouvoir associer une image au mot en question.
Ensuite, on a les algorithmes de suivi qui permettent, sur l’image, de voir les éléments se déplacer.
On a les algorithmes de franchissement de ligne, qui permettent, quand on détecte le suivi d’un objet, de savoir qu’il y a une intrusion dans une zone. En plus, c’est quelque chose qui marche assez bien, c’est donc quelque chose qui est beaucoup mis en place.
Les algorithmes de reconnaissance faciale, basés sur les ??? points [9 min 16] du visage, qui permettent d’identifier de manière unique une personne.
Les algorithmes de filature automatisée qui permettent, sur la base d’attributs physiques type la couleur des vêtements, la couleur de la peau, les cheveux, tout un tas de choses, sur un parc de caméras, sur un ensemble, de reconstituer le parcours que fait une personne.
Ce sont un peu les briques algorithmiques qui sont utilisées et, ensuite, elles sont souvent assemblées les unes aux autres pour proposer tout un tas d’usages qui sont ceux qui sont vendus par les entreprises de VSA, sachant que les entreprises de VSA ne vont pas toutes mettre en avant les mêmes cas d’usage, elles vont pas toutes les formuler de la même manière en fonction de leur cible. Par exemple, on parle des algorithmes de reconnaissance faciale, toutes les entreprises de VSA ne vont pas les inclure. Certaines entreprises vont plutôt faire un produit à destination de collectivités de droite, ou qui sont très orientées sécurité, où l’idée de pouvoir identifier les gens, de les retrouver sur la base de leurs visages va être mis en avant ; d’autres entreprises vont se présenter plus sous l’angle smart city, elles vont mettre en avant la détection de dépôts sauvages d’ordures, ou les infractions routières, ce genre de choses.
On a d’autres algorithmes encore, qui permettent, par exemple, de lire les plaques d’immatriculation, il y a tout un tas, comme ça, de briques algorithmiques différentes qui sont compilées pour proposer un spectre d’usages extrêmement large.

Maintenant, on va se poser la question de ce que veut dire, ce que décrivait Myriam tout à l’heure, cette systématisation, cette augmentation des forces de la police, cette augmentation des forces policières qui ne s’impacte pas de la même manière dans toute la société. Elle est vraiment ciblée sur les espaces publics.
Déjà, on se pose cette question : qu’est-ce que veut dire renforcer la répression spécifiquement dans les espaces publics ?
Les espaces publics sont les espaces qui sont ressource pour les personnes qui ont le moins accès à un espace privé, donc, les personnes qui vont être le plus touchées par la VSA sont celles qui passent le plus de temps dans la rue parce qu’elles y vivent, qu’elles y travaillent. On voit donc qu’il y a déjà un ciblage qui n’est pas égal sur toute la population.
Ensuite, quand on regarde du côté des usages qui sont faits de la VSA par la police, ceux qui vont être le plus souvent mis en avant par les entreprises, ça va être la détection de personnes allongées, la détection de personnes statiques, la détection du maraudage et la détection de rassemblements. On peut voir, à chaque fois, que ça accompagne des logiques policières qui sont visibles par ailleurs. En fait, la VSA accompagne une politique, une vision de la ville, notamment certaines politiques de gentrification visant, par exemple, à renforcer le harcèlement des SDF pour les éloigner des centres-villes ou contre les personnes qui mendient ou contre les travailleuses du sexe. Et puis, bien sûr, les rassemblements de personnes, parfois ils disent carrément « rassemblements de personnes devant un hall d’immeuble », ce n’est pas formulé pareil en fonction des entreprises, mais on voit que les publics qui sont ciblés, là aussi, vont être des zonards, des personnes considérées comme nuisibles, qui sont souvent des jeunes qui se rassemblent, parce que, déjà ils n’ont pas forcément les moyens d’aller dans un bar ou quelque chose comme ça et aussi parce qu’ils sont associés au deal et aux points de deal.

Ce qu’on peut déjà conclure de ça, c’est que la VSA cible vraiment, en priorité, les personnes précaires et les personnes marginalisées.
Après, de manière générale, on voit dans la VSA que les détections qui sont mises en avant sont beaucoup de petites choses qui ne sont pas du tout des infractions, qui ne sont pas du tout des choses illégales, ce sont même très rarement des choses illégales parce qu’on est borné par les capacités que permet la technologie. En fait, on a une approche qui est vraiment orientée autour d’une dialectique, d’un discours de repérer des signaux faibles, c’est comme cela que la chose est justifiée : se dire qu’il faut être au courant d’un rassemblement de personnes, parce que les personnes qui se rassemblent c’est un signal faible pour commettre une exaction.
On vient raconter un discours autour et tout cela confère une vision très normalisée de la ville. C’est un discours qui existe beaucoup sur l’impact de la vidéosurveillance : ça provoque, sur les gens, un effet d’auto-censure et d’auto-conformation à une certaine vision de la norme. La VSA vient vraiment renforcer ça et, au final, la VSA va avoir un impact sur tout le monde et elle va s’en prendre à toutes nos libertés de base : la liberté de se déplacer, la liberté de manifester, la liberté d’expression, le droit à l’anonymat, le droit à la vie privée qui sont atteints par la VSA, majoritairement les personnes précaires et les personnes marginalisées, mais, en fait, aussi tout le monde et cela métamorphose la ville.

Myriam Michel : L’image que ça donne, c’est un peu anecdotique, mais c’est un petit peu comme ce qui a pu se passer pendant le confinement et la crise sanitaire : en fait ces algorithmes, en détectant toute situation qui leur paraît anormal, viennent nous dire « la norme c’est ça, la norme c’est vous partez d’un point A, votre domicile, et vous allez à un point B qui va être essentiellement votre lieu de travail ou des lieux de consommation ». C’est une manière de réduire la vie à, simplement, un modèle très, devrais-je dire, capitaliste ?, je ne sais pas, en tout cas de chercher à réduire et à normer nos vies pour les centrer autour d’un certain nombre d’activités que la société, en tout cas ceux qui décident des algorithmes, parce que les algorithmes ne décident pas tout seuls, voudraient nous voir faire, donc, ça enlève effectivement énormément de choses, de richesses à l’espace public, à tout ce qu’on pourrait y faire et qu’on devrait pouvoir y faire sans alerter pour autant des algorithmes et des agents dans un CSU.

La VSA se glisse partout 15’ 33

Marne : Là, en gros,