RM2016 - BigData GAFA : nos données nous appartiennent-elles

De April MediaWiki
Révision datée du 25 septembre 2016 à 12:53 par Morandim (discussion | contributions) (Page créée avec « Catégorie:Transcriptions '''Titre :''' Big data, GAFA : nos données numériques nous appartiennent-elles ? '''Intervenants :''' Corinne Morel-Darleux,Benjamin Bay... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigationAller à la recherche


Titre : Big data, GAFA : nos données numériques nous appartiennent-elles ?

Intervenants : Corinne Morel-Darleux,Benjamin Bayart, Lionel Maurel,Thomas Champigny

Lieu : Remue-Méninges du Parti de Gauche - Toulouse

Date : Aout 2016

Durée : 1 heure 17 min 28

Pour visionner la vidéo

Pour télécharger la vidéo

Licence : Verbatim

Statut : Transcription MO

00’ 13

Corinne Morel-Darleux : Si je parle de tout ça, c’est parce qu’on a souvent tendance à penser que parler de données numériques, d’algorithmes, de big data, comme on va le faire aujourd’hui, est un sujet technique réservé aux geeks informaticiens zélés. En réalité, non ! Ça nous concerne tous, et de plus en plus, et de manière de plus en plus prégnante dans notre quotidien. Et donc en tant que parti politique, en tant que militants, en tant que citoyens éclairés, nous ne pouvons pas passer à côté de ce sujet. Je suis donc très heureuse qu’on puisse le faire aujourd’hui. Je suis d’autant plus contente que nous avons des intervenants, pour ce débat, qui sont des personnes qui travaillent depuis longtemps et de manière sérieuse et approfondie sur ces questions. Nous allons donc pouvoir écouter, pour nous aider à décrypter tout ça, Benjamin Bayart, qui est militant pour les libertés fondamentales sur Internet, qui est président de la Fédération des fournisseurs d’accès à Internet associatifs et qui est également membre du Conseil d’orientation stratégique de La Quadrature du Net. Il nous parlera, donc de big data. Ensuite, je passerai la parole à Lionel Maurel, qui est blogueur, juriste et bibliothécaire. Qui est également membre du Conseil d’orientation stratégique de La Quadrature du Net et qui est également le fondateur du collectif SavoirsCom1. Ensuite nous aurons un éclairage d’Isabelle Attard qui est députée, citoyenne écologiste du Calvados, particulièrement engagée dans les domaines de la culture, patrimoine et numérique, des libertés publiques et du fonctionnement des institutions politiques et qui participe activement au débat sur la loi République numérique et qui, je me permets de le rappeler, fait partie des très peu de nos députés qui ont voté contre l’état d’urgence.

Applaudissements

Et enfin, je passerai la parole à notre camarade Thomas Champigny qui est le nouveau co-animateur avec Mathieu Faure que je salue également, qui est dans la salle, de la commission numérique du Parti de Gauche et qui nous présentera un peu l’état des lieux de nos réflexions et de notre travail sur ces questions, sachant que ce débat, cet atelier parce que je ne suis pas sûre qu’il y ait un débat vraiment très contradictoire, c’est plutôt un atelier, va nous permettre, à nous aussi, et il faut le dire en toute humilité, de progresser sur notre propre réflexion au sein du Parti de Gauche sur ces questions. C’est aussi l’objectif de ce Remue-Méninge estival. J’en profite, derniers remerciements, pour saluer le travail de Laurence Pache qui a passé son été à organiser ce Remue-Méninges et qui fait partie des personnes pour qui ce débat sur le numérique était une chose essentielle dans notre parcours politique.

Applaudissements

Voilà. Je n’en dis pas plus. Je passe tout de suite la parole à Benjamin Bayart pour un premier éclairage. Concrètement, de quoi on parle quand on parle de big data, de traçabilité, et puis quels sont les usages positifs et moins positifs, voire franchement négatifs, du big data ?

03’ 50

Benjamin Bayart : Là, comme ça, ça va marcher. Bonjour. Le premier élément compliqué c’est d’essayer d’enlever l’épais vernis de marketing que vous avez pu lire dans la presse, pour revenir à des choses normales. Des données, vous en manipulez et vous en émettez tous, tous les jours, si vous êtes doté d’une forme d’ordinateur. Ceci est une forme d’ordinateur (Benjamin montre son téléphone portable, NdT). Il y a des choses qui vont vous venir assez spontanément comme étant vos données et que vous considérez comme étant personnelles. Les messages que vous envoyez, que ce soit des mails, que ce soit des SMS, que ce soit de la discussion sur une appli ou sur une autre, sur Facebook, ce sont des données, vous les considérez comme personnelles. Ça c’est la partie évidente. Vos photos de vacances, ce sont des données, vous les considérez comme personnelles. Je ne parle même pas des textos qu’on peut s’échanger ou des truc. Juste toutes les photos que vous faites, vous les considérez comme personnelles.

C’est la partie la plus petite et la moins intéressante de vos données personnelles, parce que c’est une partie qui est épouvantable à analyser. Quand j’ai envoyé un SMS à Isabelle Attard en disant « c’est de la bombe », si on faisait une analyse sémantique, ça pouvait allumer plein de warnings dans les services de renseignement. Rendez-vous compte, deux gauchistes échangent un message où il y a écrit bombe dedans. Il devrait y avoir des ???. ,C’est effroyable à analyser, il faut comprendre, il faut parler la langue. On a tous lu ça dans la presse, quand les organisateurs des attentats se sont mis à parler en arabe entre eux au téléphone, les policiers n’arrivaient plus à suivre. C’est très compliqué d’exploiter des données.

En revanche il y a ce qu’on appelle les métadonnées, ce sont, en fait, les données à propos des données, et qui elles, sont beaucoup plus riches et sont très faciles à exploiter. Ce que j’ai dit dans le SMS à Isabelle ne présente aucun intérêt. En revanche mon téléphone était localisé à Toulouse. J’ai émis un SMS à 10 heures 22. Isabelle a émis un SMS, depuis Toulouse, une localisation très proche : c’est la même antenne relais, donc on est manifestement dans le même bâtiment, ou pas loin. Puis j’ai réémis un autre SMS derrière.

On peut avec les données qu’on a sur mon téléphone savoir que ce matin, tôt, j’étais devant la gare de Toulouse-Matabiau, que cependant je n’ai envoyé un SMS à Isabelle que quand on s’est retrouvés racrochés à la même antenne GSM, c’est-à-dire qu’on était proches. Donc manifestement on voulait se rencontrer, il n’y a même pas besoin de lire le contenu. En fait, cette information-là est très facile à exploiter, elle est déjà structurée. Elle est très facile à analyser pour un ordinateur : deux personnes échangent des messages, donc elles se connaissent. Point. Elles sont raccrochées à la même antenne, donc elles sont au même endroit. Point. Il n’y a besoin de lire le contenu. Essayer de trouver la même information en lisant « Je suis arrivée. Dans quel bâtiment tu es ? Est-ce que tu es dans une conférence ? », c’est super compliqué de comprendre ce qu’on se raconte. Alors que les données à propos des données, disent beaucoup plus de choses.

Ce qui est intéressant, ce n’est pas le contenu de l’article de presse que vous avez lu. C’est l’identifiant de l’article. Vous et tous vos potes d’extrême gauche avez lu le même article de presse. Ça vous classe politiquement. Il n’y a même pas besoin de connaître son titre. Son numéro de matricule dit que vous êtes manifestement de la même opinion que les autres gens qui ont lu ça. Si on sait qu’ils sont majoritairement situés, disons qu’ils sont socialistes, donc d’extrême gauche de nos jours — il faut s’adapter — alors vous êtes de la même couleur politique. Donc les métadonnées sont une information beaucoup plus riche sur vous. Les métadonnées disent beaucoup plus de choses et elles sont plus faciles à lire.

Si on veut regarder la photo pour essayer de comprendre ce que vous avez pris en photo, c’est épouvantablement compliqué. Dedans, s’il y a votre position GPS qui dit que vous étiez dans les Alpes, s’il y a l’heure qui dit si c’est le jour ou la nuit, s’il y a le type d’appareil photo utilisé, s’il y a… En fait, on sait déjà beaucoup de choses et on sait déjà bien assez de choses. On est capable de dire si vous étiez en vacances ou si vous étiez au travail. On est capable de dire si vous étiez en train de photographier les étoiles ou de photographier le paysage, sans avoir à regarder l’image !

La fréquence à laquelle vous prenez des photos et à qui vous les envoyez, ça dit plus de choses que le contenu de la photo. Hier j’ai pris une photo d’un truc ridicule, je l’ai envoyée à un copain, ce n’est pas la peine qu’on sache que c’est un truc ridicule. C’est quelqu’un à qui j’envoie des photos quand je me promène, donc c’est manifestement un proche, ce n’est pas une relation professionnelle. Ça suffit, en fait, à qualifier la relation, il n’y a pas besoin de lire.

Telle personne avec qui je ne correspondais jamais, on s’est mis à échanger vingt à trente textos par jour, de manière soutenue et continue. Il n’y pas besoin de savoir qu’on est en train de flirter. La fréquence des messages nous le dit. L’heure des messages nous le dit. Le dernier message est à minuit, on doit se souhaiter bonne nuit, ça suffit à le savoir, il n’y a pas besoin de lire le texte.

Donc ça, c’est pour que vous ayez une idée de ce qui est intéressant dans vos données.

L’autre élément, c’est la partie dont vous ne vous doutez pas, qui sont les données que vous créez sans le savoir. J’ai envoyé un message à Isabelle, l’opérateur de téléphonie a noté dans ses petits papiers que j’ai envoyé un SMS. D’ailleurs ce sera décompté de mon forfait illimité pour vérifier que je n’ai pas dépassé la limite d’illimité. Mais c’est quand même noté dans ses petits papiers : c’est une obligation légale. Il y a plein de données que vous émettez sans le savoir.

Qui parmi vous sait que son téléphone émet une position géographique en permanence ? En fait votre téléphone mobile est accroché à une antenne. Par la partie radio, il parle en radio à une antenne précise. Votre opérateur sait sur quelle antenne vous êtes accroché, même quand vous ne téléphonez pas, puisque quand on vous appelle ça sonne. Donc toutes les antennes radio du pays ne cherchent pas le téléphone de Benjamin Bayart quand quelqu’un m’appelle. Mon téléphone, quand je me déplace, parle en permanence avec l’antenne pour dire : « Je suis là ! Je suis là ! Je suis là ! » Et du coup, quand quelqu’un me téléphone, l’opérateur sait sur quelle antenne je suis. Donc en fait l’opérateur de téléphonie mobile sait en permanence sur quelle antenne radio je suis. C’est -à-dire qu’il a un tracé. En fait il sait même, s’il fait un petit peu attention, quelles sont les antennes avec lesquelles mon téléphone parle, puisqu’il parle avec plusieurs antennes en même temps. Les antennes répondent, il y en a une qu’il entend plus fort que les autres et donc il va décider que c’est avec celle-là qu’il échange s’il a un appel à passer. Mais il a discuté avec les autres antennes pour savoir où elles étaient à quelle distance et s’il entendait bien ou pas. Savoir s’il avait une barre ou quatre barres. Ça l’opérateur le sait. Donc l’opérateur sait que mon téléphone était à cinq cents mètres de telle antenne, à deux kilomètres de telle autre et à trois kilomètres cinq de telle autre. Il a tracé les trois cercles, il sait au mètre près où je me suis. Au mètre près ! Quand on décide de suivre la géolocalisation d’un téléphone, du moment qu’il est allumé, on sait où il est au mètre près. Et ça, ce sont des données dont vous n’êtes pas conscient.

Quand vous faites de la navigation en ligne, vous affichez un article, alors vous savez que le journal que vous êtes en train de lire sait qu’un internaute est venu et a lu. Bien ! Il se trouve que sur la page il y a un like de Facebook. Même si vous n’avez pas de compte Facebook, le petit bouton like de Facebook vient de chez Facebook. Donc Facebook sait que vous avez lu cet article, même si vous n’avez pas de compte Facebook et même si vous n’êtes pas connecté sur Facebook. Alors il ne sait pas que c’est moi, Benjamin Bayart. Il sait qu’un internaute, qu’il y a déjà vu il y a une demi-heure sur tel autre article, est maintenant en train de lire ça, et que dans vingt minutes je serai en train de lire autre chose où il y a un bouton Facebook.

S’il y a un petit bouton Twitter, même punition. Twitter sait que j’étais en train de lire ça, puis que je suis en train de lire ça. Il ne sait pas forcément qui je suis, parce que je ne suis peut-être pas connecté sur mon compte Twitter avec le même navigateur. Mais si dans l’onglet d’à côté il y a mon compte Twitter, il sait qui je suis, il sait que je suis Benjamin Bayart !

Si je navigue en navigation privée, donc je ne suis connecté à rien, il sait quand même que le même navigateur est passé par plusieurs endroits. Alors il ne sait pas que c’est moi formellement. Il sait que j’ai lu tel article, puis que j’ai lu tel autre, puis que j’ai lu tel autre, puis que j’ai lu tel autre. On estime qu’à partir de six ou sept métadonnées, on peut savoir qui vous êtes de manière absolument unique. Sans avoir besoin d’identifiant formel, juste la métadonnée !

C’est en fait très simple : le téléphone qui fait tel trajet le matin à la même heure, c’est-à-dire le téléphone qui part de telle adresse le matin et qui arrive à telle adresse, le matin, eh bien c’est celui du salarié de la boîte qui habite là. Il n’y a même pas besoin de savoir que c’est son numéro de téléphone. Le type qui fait le trajet de chez moi à mon boulot tous les matins, c’est moi ! C’est plus fiable que ma carte d’identité, quasiment ! Si je fais le même trajet avec un autre téléphone, on sait très vite que c’est moi. Il y a un téléphone qui est parti de chez moi qui est arrivé à mon boulot. À priori c’est moi, même si j’ai piqué le téléphone de ma mère. Et du coup, tous les messages qui pendant ce trajet sont émis, à priori ils sont émis par moi. Il n’y a pas besoin de mon identité.

Donc même quand vous êtes le plus anonyme possible sur Internet, il y a des traces. Il ne peut pas ne pas y avoir de traces. Au mieux, le site que vous visitez, ou les sites qui sont cachés derrière, si vous regardez un site de presse un peu grand public qui fait de la publicité — ce que j’appelle caché derrière, c’est comme le like Facebook, vous voyez, le truc qu’on ne sait pas en regardant la page, il y en a une cinquantaine. Entre la régie publicitaire qui veut savoir qu’on a vu sa pub, l’annonceur qui a vendu la pub et qui veut savoir qu’on l’a vue, les systèmes de statistiques et de suivi, le site web lui-même, ses partenaires, les Facebook, Twitter, machin, truc et bidule : en gros, l’ordre de grandeur, c’est une cinquantaine de personnes qui vous suivent à la trace. Donc voilà.

Ce dont on parle, quand on parle des données personnelles, c’est de au moins tout cela.

Votre montre connectée qui vous dit que vous avez de la tension, qui vous dit que vous avez de la température ou qui mesure votre rythme cardiaque quand vous êtes sportif – il y a des tas de bracelets qui font ça pour savoir si on a bien fait du sport, combien on a marché et tout — tout ça ce sont des données personnelles. Mais la donnée personnelle ce n’est pas seulement j’ai marché. C’est j’ai marché tel jour à tel endroit. C’est très fin, en fait, comme données ce qu’ils ont. Ça aussi, ça permet de vous identifier. La personne qui a fait tel parcours en courant tel jour à telle heure, il n’y en a pas cinquante. Avec deux ou trois parcours, on sait qui vous êtes.

Voilà. Quand on parle de données personnelles, on parle de tout ça. On ne parle pas seulement des photos de vacances que vous avez mises sur Facebook.

Corinne Morel-Darleux : Merci. On était en train de se dire avec Isabelle, que toute la salle avait changé de couleur de visage à l’écoute de cet exposé introductif.

Rires

Mais c’est bien parce que du coup, je pense que tout le monde est maintenant en appétit pour mieux connaître la législation et l’état des lieux en la matière, les différentes controverses, les différents rapports de force qui peuvent exister aujourd’hui. Et pour nous en parler je vais donner la parole maintenant à Lionel Maurel.

15’ 55

Lionel Maurel : C’est bon. Oui, c’est bon.