Cycle de conference "Qu est ce qu'Internet ?" partie 2
Présentation
Cycle de conférence "Qu'est ce qu'Internet ?" partie 2 Intervenant Benjamin Bayart date 2010
Transcription
Benjamin Bayart : C'est toi qui est maître de l'emploi du temps.
Organisateur : Ouais. Bien bonjour, bonjour à tous et bienvenue à Sciences Po pour cette deuxième partie de la conférence « Qu'est ce que l'Internet » du cycle « Qu'est ce que l'Internet » par Benjamin bayart. Donc on est ici en amphi Jean Moulin, pour la petite histoire c'est l'ancien amphi de l' ENA dans lequel se sont assis à peu près toute la classe politique française actuelle.
Benjamin Bayart : et ben c'est pas glorieux !
Organisateur : Donc la conférence d'aujourd'hui c'est sur les applications du réseau, les applications du réseau. La semaine dernière, je vous rappelle, on a expliqué les bases du réseau, comprendre le réseau, cette semaine c'est donc comprendre les applications. Mais donc avant de commencer, je rappelle pour ceux qui n'étaient pas là la semaine dernière, qu'est ce que Libertés Numériques ? Libertés Numériques, c'est l'association numérique des étudiants de Sciences Po, donc en fait l'idée c'est de rendre, d'animer le débat d'idée autour du numérique à Sciences Po, et donc d'apporter une culture numérique aux étudiants, pour qu'ils aient plus tard le bagage pour ne pas, pour pouvoir éviter des bourdes comme par exemple le firewall d'Open Office, le désormais célèbre firewall d'Open Office, mais également pour en tirer toute une offre de cours et la promotion du logiciel libre à Sciences Po. Et cet évènement est organisé en partenariat avec le Médialab de sciences Po qui est juste à côté, qui a pour but en fait d'utiliser l'informatique et les outils que nous fournissent les nouvelles technologies à des fins de recherches en sciences sociales. Voilà, donc c'est la deuxième partie sur trois parties. Je vous rappelle que le 4 mai il y aura la partie finale, la conclusion qui sera donnée en amphi Caquot, donc tous les plans sont sur le site de Libertés Numériques, libertesnumeriques.net, et donc qui couvrira une partie plus politique et plus, qui tirera des deux premières parties la substance pour en tirer une conclusion sur les enjeux d'internet.
Voilà, je laisse sans plus tarder la place à Benjamin Bayart, en espérant qu'on n'ait pas trop de problèmes au niveau de la rétro-projection,
Benjamin Bayart : On n'a pas testé, donc normalement ça doit pas marcher, (rires), il y a des traditions en informatique,
Organisateur : Voilà, les affiches des derniers..., et on passe, alors évidemment ils ont verrouillés..., j'espère qu'ils n'ont pas verrouillés à la super glue quand même.
Benjamin Bayart : Ah c 'est pathétique, toujours autant surpris de pas voir marcher linux, sur un portable faut de la patience pour pouvoir faire marcher Linux sur un portable,
Organisateur : Donc, là il fait comment déjà pour démarrer,
Benjamin Bayart : C'est pas compliqué,
Organisateur : La deuxième partie, et voilà, je laisse la parole à Benjamin Bayart,
Benjamin Bayart : C'est beaucoup plus simple que d'essayer de viser avec une souris dans le dos.
Donc on va attaquer la deuxième partie. Rapidement, pourquoi j'ai souhaité organiser ça en trois conférence, seulement parce que pour expliquer internet, il faut deux morceaux. Très clairement, le premier c'est ce que c'est un réseau de transport de données, et ce que ça a comme conséquence, donc ça c'est ce qu'on a vu la semaine dernière. La deuxième partie, ce sont les applications qu'on en fait, et simplement parce qu'on ne peut pas comprendre les impacts politiques et sociétaux propres à internet, si on n'a pas compris les deux premiers volets. Et comme je l'ai dit la semaine dernière, je sais que les gens de Sciences Po, voudront le lire à l'envers, le seul morceau qui les intéresse c'est le troisième volet, et en fait une fois qu'ils auront regardé le troisième volet, normalement, ils n'auront à peu près rien compris, si ils n'ont pas suivi les deux premiers, et donc tout l'intérêt c'est que ce soit enregistré. Le point le plus intéressant quand on s'intéresse aux sciences économiques et politiques, c'est le troisième volet, et il n'est pas compréhensible, on ne peut pas repérer pourquoi il a émergé avec internet et pourquoi il n'a pas émergé avec les réseaux précédents, si on n'a pas compris les spécificités d'internet. Bien, rapidement ce qu'on avait vu la dernière fois sur le réseau de transport, c'était essentiellement trois informations clés : La première, c'est qu'on parle d'internet à partir du moment où on parle des adresses, IP publiques, donc quand une machine est sur internet, elle est publiquement joignable en tant que serveur, et elle peut être cliente de n'importe quelle autre machine. Ce point là est fondamental. C'est quasiment la définition d'internet. Le deuxième élément qu'on avait vu, c'est que la partie routage, transport de données, est essentiellement très simple. C'est la grande différence, c'est la grande innovation technique entre internet et tous les autres réseaux. Les réseaux précédents cherchaient à faire des choses extrêmement compliquées en apportant des garanties de qualité de services, en pré-réservant de la bande passante, pour reprendre le début de la conférence de la dernière fois, en réservant des circuits sur le réseau. Ce qu'internet à apporté, c'est l'idée de simplement transporter des paquets de données, de pas pré-réserver de la bande passante, de transporter chaque petit bout de données comme il se présente. Si on trouve un chemin pour l'amener à destination, tant mieux, si on n'y arrive pas et qu'on le perd en route, tant pis, les applications s'en débrouilleront. Il y a une partie que je vais passer sous silence, parce qu'elle est assez simple en fait, elle est techniquement très laborieuse mais sur le principe assez simple, c'est comment les applications se débrouillent du fait qu'on perde des données. Exactement comme vous vous en débrouilleriez. Imaginez que les livres, vous les récupériez systématiquement sous forme de feuilles volantes, si il manque des pages, qu'est-ce que vous faîtes, vous les redemandez. C'est aussi simple que ça.
Donc les applications ont toutes un tas de mécanisme à leur disposition, pour traiter ça, c'est pas d'un intérêt débordant. Ce qui est intéressant à comprendre, c'est qu'avec la mécanique triviale d'internet, on arrive à recréer virtuellement quelque chose de plus puissant que ce qu'on avait avec les mécaniques complexes de la commutation de circuit. Donc on est capable à tout moment d'établir des liaisons entre n'importe quel point et n'importe quel autre point du réseau, éventuellement plusieurs liaisons en simultanée, toutes fonctionnant en même temps. Qu'on se comprenne bien, ce n'est pas la multiplication des petits pains, c'est simplement depuis un endroit, je peux en contacter 5 autres, si j'en contacte 10, j'irai juste deux fois moins vite. Mais j'aurais, si j'ai 10 interlocuteurs, 1/10ème de la vitesse disponible pour chacun des interlocuteurs. Ce qui est très différents des réseaux précédents, qui ressemblaient au téléphone, et où on ne parlait qu'à une seule personne à la fois. Bien.
7:51
Alors voilà, c'est tout de l'acronyme aujourd'hui, je suis gentil, je vous ai épargné les noms des protocoles pour ces deux là. On va commencer par le DNS parce que c'est le premier des protocoles, c'est pas le plus ancien historiquement, mais c'est un des plus intéressants. C'est celui qui est le plus central à l'heure actuelle sur internet. Et ensuite on va travailler en alternance. D'abord le web, parce que c'est celui que tout le monde connaît dans l'usage, ensuite la mail, dont vous allez vous rendre compte que vous le connaissez relativement mal. Ensuite, ces deux là, que je vais à peine survoler parce que je n'ai pas du tout envie de rentrer dans des détails techniques sur comment il marche. Ce qui est intéressant, ce sont les deux ou trois principes du modes de fonctionnement. Ensuite on ne parlera pas de peer to peer, c'est pour ça que je l'ai mis dans la liste, et puis une conclusion. Oui, normalement je dois tenir les temps à peu près.
Ah, donc on va commencer par le DNS. Bien. Basiquement, on en avait un petit peu parlé la dernière fois, le DNS c'est l'annuaire du réseau. C'est ce qui fait que vous pouvez retenir des noms, plutôt que de retenir des numéros. C'est un concept avec lequel vous êtes très familier sous la forme d'un annuaire. Un annuaire, ça stocke des informations, qui, quelle information et la donnée correspondante. Bien évidemment on peut stocker pour une personne, plusieurs informations, de nature potentiellement très différente. C'est à dire qu'on regarde, dans l'exemple que je donne, c'est tout des infos vraies ça, à priori, celui là il est périmé. On a ici 4 natures d'informations, certaines sont très structurées et numériques, donc les ordinateurs vont avoir tendance à les stocker d'une manière bien compacte, d'autres sont brutalement du texte, une adresse postale, c'est on peut pas plus bête, il n'y a rien de numérique là dedans, il n'y a rien de structuré. Et pour un type d'informations données, il peut y avoir plusieurs entrées. Alors je ne sais pas combien parmi vous ont plusieurs numéros de téléphone, mais c'est pas quelque chose de si rares. De même que l'on peut très couramment avoir le même numéro de téléphone associé à plusieurs personnes. Donc voilà, le principe d'un DNS c'est de produire ça. En plus vrai, ça va ressembler à ça. Alors comment ça se lit ? Le cas le plus courant, celui que tout le monde connaît c'est : à un nom de machine, j'associe une adresse IP. Ça c'est celui dont vous avez absolument besoin tout le temps. Vous vous en servez quand vous êtes face à un ordinateur, plusieurs milliers ou dizaines de milliers de fois par jour. Juste ça le fait tout seul. Le deuxième, on en parlera quand on traitera le mail, le troisième on en parlera un tout petit peu quand on parlera d'XMPP tout à la fin, et le quatrième, c'est juste parce que j'avais envie de trouver un quatrième cas, c'est en fait comme ça que fonctionne la résolution inverse. C'est à dire, quand vous donnez une adresse IP à une machine, elle est capable de retrouver un nom. C'est le principe de l'annuaire inversé, et en fait il faut savoir que l'annuaire inversé c'est juste un annuaire rang dans l'autre sens, mais c'est bien le même annuaire en fait, c'est juste une deuxième section du même annuaire.
11:33
Bien. Ce qui est intéressant à retenir là dedans, c'est qu'on a beaucoup plus qu'une traduction d'adresse IP, parce que ça c'est un nom de machine qui est traduit en quelque chose qui a une gueule de nom de machine, qui peut même être traduit en du texte qui peut contenir vraiment n'importe quoi, si vous avez envie de mettre les deux premières pages de votre roman préféré, vous pouvez. Donc ça contient beaucoup plus qu'une adresse IP pour un nom de machine. Ça peut contenir bien évidemment plusieurs enregistrements pour une même informations, c'est à dire qu'il y a trois enregistrements PTR, associé à cette information là ; et il y a vraiment trois enregistrements PTR. Plus intéressant, ce sont des informations récursives. C'est à dire, ici si on regarde, à l'entrée edgar.fdn.fr est associée une entrée qui s'appelle Mx20 qui elle même est un autre nom de machine auquel sera ssociée une autre information. D'accord, ça c'est très courant dans le DNS. Le fait de jouer sur la récurrence. C'est quelque chose d'inhabituel dans les annuaires pour humain, mais de complètement standard dans les annuaires pour machines. Comment ça marche ? C'est complètement hiérarchique et ça se lit de droite à gauche. Vous allez le voir, ça se lit de droite à gauche et pourtant on va le faire de gauche à droite. La première question qu'on se pose, c'est qui est jmpl.fr.eu.org? Qui est telle machine ? J'ai choisi exprès une où il y avait 4 niveaux, c'est plus rigolo qu'avec 2. Donc en fait, on cherche un champ A, donc une adresse, associée à un nom de machine. Ça, cette question là, je veux le champ A associé à telle machine, c'est ce que votre PC à la maison envoie à son serveur DNS préféré. Qui, lui, soit il connaît la réponse, parce que on lui a déjà demandé trois minutes avant, il renvoie la réponse; soit il ne la connaît pas, et il va se demander qui détient la vérité pour fr.eu.org. Qui est le name serveur, DNS c'est Domain Name Server (qui est donc serveur de nom de domaine), et donc il va se demander qui est le name server de fr.eu.org. Soit il a l'information quelque part, parce qu'il s'est posé la question il y a moins de 24H, et dans ce cas là, il sait qui est fr.eu.org et donc il pourra retrouver l'information; soit il ne sait pas auquel cas il va regarder si des fois il saurait qui est eu.org, et si il ne sait pas, il va chercher qui est .org. Au delà il sait forcément, parce que au delà on est arrivé à la racine, et l'adresse du serveur DNS racine responsable de tout internet, tout le monde la connaît. Elle est publique, tout le monde connaît l'adresse de cette machine. Je vous passe les détails techniques, cette machine, avec son adresse, elle est présente à peu près à 150 endroits sur terre. C'est la même machine qui porte le même nom, et le même numéro. Pour faire une comparaison avec le téléphone, imaginez ce qui se passe quand vous faîtes le 18, pour appeler les pompiers. Vous faîtes bien le même numéro, où que vous soyez en France. Cependant, ça ne fait pas sonner le même téléphone. Le réseau amène cet appel au point qu'il juge être le plus proche qui sache traiter ce numéro là. Exactement de la même manière, quand une machine cherche à joindre un de ces serveurs là, comme ils sont présents en n exemplaires dans le réseau, le réseau va simplement acheminer la question vers l'exemplaire le plus proche; qui se chargera de répondre le plus naturellement du monde. Donc ce serveur « racine » de tous les noms de domaine, dans la pratique, on l'interroge à peu près jamais. Parce que votre serveur DNS une fois qu'il va l'avoir interrogé pour savoir qui gère .org, il va ranger l'information dans son cache et celle là en général, c'est 5 à 10 jours. Donc en fait un serveur racine, ça traite un gros volume de trafic, mais rien de délirant. En tout cas, sans commune mesure avec les milliers de requêtes par jour que vous générez vous individuellement. C'est votre serveur à vous qui mange mille requêtes par jour. Mais comme il ne repose pas la question quand il se souvient de la réponse, celui d'en dessous en mange statistiquement quelque chose comme 10 fois moins. Et plus on descend dans les strates, moins il y en a .
16:40
Enfin, une fois qu'on a traité ça, on remonte. C'est à dire si mon serveur ne savait rien, il s'est posé toutes ces questions là, il a donc envoyé la question au serveur racine en disant qui est responsable de .org ? On lui a répondu une adresse IP, puis il a demandé à Monsieur .org qui est responsable de eu.org, et on lui a répondu une autre adresse IP, qui n'a rien à voir, et puis ben du coup, il a contacté celui là en disant c'est qui fr.eu.org ? Il a obtenu encore une autre adresse IP. Puis il a recontacté Machin et lui a dit : « dis donc, c'est quoi l'adresse de jmpl.fr.eu.org ?» et là, il a obtenu la réponse. Ça ce sont des choses qui ont lieu plusieurs milliers de fois par jour dans votre dos, et où basiquement sans ça, internet est pour vous totalement inutilisable. C'est curieux, parce que dans le monde du téléphone, vous vous en sortez très bien. Je présume que vous faîtes comme moi, vous notez là dedans les numéros de téléphone des gens que vous voulez appeler. Vous ne consulter pas un annuaire. Vous avez votre petite copie locale de l'annuaire. Et plutôt que de garder votre petite copie locale des adresses IP dont vous avez besoin, vous interrogez en permanence le grand annuaire central de tout le monde, et vous récupérez l'information. C'est un choix structurel dans la façon de fabriquer internet, qui est assez ancien; d'avoir décidé de mettre à disposition un annuaire, complet, et qui permette de répondre à des millions de questions par seconde, sans difficulté, simplement par ce fonctionnement hiérarchique. Bien.
18:30
Le point clé à retenir là dedans, c'est que ça c'est probablement l'application la plus centralisée d'internet. Il y a bien un centre absolu qui est le serveur racine, c'est lui qui sait où se trouve Monsieur .org et c'est lui qui en décide. Ça c'est quasiment le centre du monde sur internet. C'est pas facile à éteindre, puisqu'il y en a plusieurs centaines, c'est pas facile à contrôler, pour une raison très simple, il n'y a presque pas d'informations dedans. Il y a normalement dans ces serveurs, que ce qu'on appelle les top level domain . C'est à dire les domaines de premiers niveaux : .com, .net, .org, .fr, .be, il y en a à peu près 200. Il y en a à peu près 200, et tout le monde les connaît. Donc si à un moment, lui il se met à répondre autre chose que ce qu'il doit, ça va immédiatement se voir. Les 200 noms qu'il sert et pour lesquels il fait autorité, qui sont la racine d'internet sont 200 noms connus, et si lui il se met à déconner, on sait cloner cette liste quasi-instantanément. Donc on a bien un centre absolu, et qui est pourtant totalement distribué. Il y a bien un seul endroit où on fait les mises à jour, et il y a ensuite des centaines de machines où on réplique ces mises à jour; donc qui sont plus compliquées à éteindre, qui apportent à peu près la même solidité qu'un réseau comme on l'a vu la semaine dernière, ensuite tout est délégué. C'est à dire que le serveur qui gère .fr il ne sait rien de ce qui se passe dans le domaine fdn.fr, à part qu'il l'a délégué à quelqu'un d'autre. C'est assez important à comprendre dans la structure, c'est entièrement centralisé, c'est une structure complètement pyramidale avec un grand chef tout en haut, mais c'est dans le modèle hiérarchisé, beaucoup plus réparti, beaucoup plus distribué, que les modèles de réseaux anciens auxquels on a pu être habitué. Ça n'a par exemple aucun rapport avec le mode de fonctionnement d'autres systèmes centralisés comme on va le voir plus tard ; que sont au hasard Facebook et MSN. Là dedans, chacun est totalement maître de son petit bout d'univers. C'est ça ce que j'appelle la délégation complète, c'est à dire que quand Mr .fr nous a délégué fdn.fr, il a cessé d'avoir quelque contrôle que ce soit dessus.
21:40
Du coup, on a quelque chose qui est capable d'absorber une quantité de requêtes absolument délirante, avec de l'informatique très simple. C'est à dire qu'il faut comprendre le programme qui fait serveur DNS, il est un petit peu compliqué, il est à la portée d'un étudiant en 2ème année de DUT brillant en programmation. Donc on n'est pas du tout du tout sur des choses extraordinairement complexes. On est sur du programme qu'il faut écrire comme il faut parce que c'est un peu sérieux, mais c'est pas très compliqué. C'est un petit peu trop compliqué pour quelqu'un qui sait juste faire du PHP pour ses pages perso, c'est la pointure un petit peu au dessus.
Donc en fait, on a bien à faire à un système qui est parfaitement centralisé et qui pourtant peut gérer des charges énormes, ce qui est en général le plus gros défaut des systèmes centralisés. Bien.
Si un jour vous cherchez un point central dans l'internet, il n'y a que celui là. Et plus exactement il n'y a que le serveur racine. Et comme on l'a vu tout à l'heure, le serveur racine il peut se dupliquer en quelques minutes. C'est à dire recréer un serveur racine différent parce que le serveur racine a l'air de raconter n'importe quoi, ça prend quelques minutes. Donc en fait il est unique, mais il est juste unique parce que tout le monde fait raisonnablement confiance aux gens qui s'en occupent. Exemple : si vous cherchez dans l'actualité il y a 2 semaines je crois, les chinois se sont fait prendre les mains dans le pot de confiture. Chez eux, ils ont pris l'habitude d'intercepter les requêtes qui partent le serveur racine pour lui faire répondre des mensonges, ce qui a , un des 150 exemplaires du serveur racine qui est en Chine, et donc du coup, on l'a éteint. Celui là se mettait à répondre de la merde. Donc voilà, le système est suffisamment simple et suffisamment bête pour que quand on a éteint ce serveur là, ça n'ait posé de problème à personne. Bien.
23:40
Comment ça fonctionne du web ?
Quand on veut afficher http://www.fdn.fr, la première chose que fait votre machine, c'est chercher qui est http://www.fdn.fr/ . C'est pour ça que j'ai commencé par le DNS parce que tous les protocoles vont commencer par faire ne résolution DNS du nom. Donc on traduit ça en une adresse IP, et puis ensuite on a une connexion réseau, exactement du modèle que j'ai indiqué la semaine dernière, c'est à dire que on envoie une requête assez simple en texte qui dit « je voudrais telle page sur ton site » qui est en général sous forme de nom de fichier, et le serveur renvoie le contenu du fichier. Tout ce que vous connaissez sur le web fonctionne comme ça. L'alpha et l'oméga du web, c'est ça. Je cherche qui est responsable du domaine, je me connecte sur le port 80, je demande la page, j'obtiens la réponse, je l'affiche. Tout le web se résume à ça. C'est probablement l'exemple le plus simple d'un protocole réseau applicatif. Ça fait partie des 3 ou 4 protocoles qu'on peut parler à la main. Et vous pouvez à la main, vous comporter comme se comporte votre navigateur web et écrire tout seul vos requêtes sans utiliser de navigateur, et vous récupérerez en texte une belle page en HTML. Donc structurellement, ce protocole n'impose absolument pas de centre; puisque ce qui définit un site web, c'est un nom de domaine, que des noms de domaines il en existe une infinité, et qu'on a vu que par le modèle hiérarchique des DNS, on peut donner des noms de domaines à n'importe qui envoyant vers n'importe quelle machine. Je m'explique. Si moi je gère benj.com, je peux déléguer à n'importe qui machin.benj.com. Et ce n'importe qui pourra lui même déléguer à qui il veut potentiellement sur pas le même continent, toto.machin.benj.com. Donc en fait, n'importe qui peut obtenir gratuitement un nom de domaine. Puisque en achetant un nom de domaine, c'est combien sur le marché actuellement, 6 ou 7€, en achetant un nom de domaine à 7 €, je peux en fournir à x centaines de copains, donc ça va nous faite du 3 centimes par tête de pipe, qui eux même peuvent en donner à à peu près autant de gens qu'ils veulent, donc on est en millième de centimes par tête de pipe, donc globalement gratuit. Juste ça fait des noms un peu long, mais après tout c'est pas très grave, c'est toujours plus facile à retenir qu'un numéro. Donc, le web, qui se base, parce qu'il se base sur le mécanisme du DNS n'impose absolument pas de centre. Quand vous allez sur un site web, vous allez en fait potentiellement sur n'importe quelle machine connectée à internet.
27:16
Si nos opérateurs mobile faisaient leur boulot, et donc qu'on ait des adresses IP publiques la-dessus, c'est à dire si on était connecté à internet, alors il pourrait y avoir une URL de site web qui ne soit joignable que quand mon téléphone est allumé. Parce que le contenu en serait servi par mon téléphone. Donc ça c'est bien important à comprendre. Il n'y a pas un grand site web racine qui délègue le web à tout le monde. Il y a bien un serveur DNS racine qui délègue les noms mais le web est lui même structurellement par nature distribué sur le réseau. Cependant, on crée artificiellement des centres. Actuellement s'il y avait un centre du web, il s'appellerait Google. Mais c'est pas lié à la nature même du protocole. C'est lié à l'usage que nous en avons. Comme on n'est pas capable de se souvenir des noms de sites web sur lesquels on veut aller, on cherche un peu au hasard dans Google. Dans la pratique, ça donne à Google un pouvoir de censure faramineux. Ils peuvent décider de ne plus vous fournir telle réponse à la question. Mais il est très simple de reprendre ce pouvoir. Il suffit de noter les adresses des sites sur lesquels vous vous allez. Dans le premier navigateur venu, ça doit s'appeler bookmark, je ne sait pas comment c'est traduit en français, signet ? Ou favoris, marque-pages, ça dépend des marques. Ça c'est essentiellement, en fait on crée des centres par les usages. On crée des centres par la façon dont on utilise les sites web. C'est une question d'éducation. C'est une question d'habitude. Basiquement, tous les sites web dont je me sers à peu près régulièrement, c'est mon navigateur qui les retient, voire ma mémoire. C'est à dire quand je me retrouve sur un navigateur qui n'est pas le mien et où je n'ai pas mes bookmark, les 20 ou 30 sites dont j'ai l'habitude, je connais les noms par coeur, et j'y vais sans passer par Google. C'est pas le cas de tout le monde en fait. J'ai constaté avec surprise, qu'il y a beaucoup de gens qui croyaient que les URL ça se collait dans la barre de recherche de Google. Et sans se moquer, il y a une vraie question d'éducation derrière. Il y a une question d'infrastructure aussi. Allez, on va faire des choses simples. Combien d'entre vous ont un accès soit ADSL soit cable. Ça va, je vois qu'il y a à peu près 100%. Donc vous avez tous un accès, fondamentalement, structurellement asymétrique; qui est capable d'émettre très peu de données, et qui est capable d'en recevoir beaucoup. C'est ce qui fait que quand bien même vous le voudriez, vous ne pouvez qu'avec difficulté diffuser du contenu depuis chez vous. Donc vous avez structurellement avantage à ce que le contenu que vous diffusez soit stocké ailleurs. Le ailleurs en question crée artificiellement des centres.
30:46
Exactement comme à force de ne pas pouvoir faire pousser votre viande vous-même, vous créez artificiellement des centres agricoles, de l'élevage intensif, etc, etc... simplement parce que vous déportez le problème, vous créez des grumeaux dans la structure. C'est à mon sens, les deux questions clés sur pourquoi un centre se crée sur le web. Pour des questions d'éducation et pour des questions d'infrastrutures.
Après, il y a le fait qu'on a développé des applications au dessus d'HTTP. Je m'explique : Facebook, c'est un site web. C'est juste un site web. Je ne suis pas un grand utilisateur du truc parce que je n'y ai pas de compte, donc je me fie essentiellement aux racontars qu'on lit sur internet sur la façon dont ça marche; mais dans la pratique, ça permet beaucoup plus qu'un simple site web. Ça ne se résume pas à un blog. Ça crée, il y a des tas de petits morceaux d'application. Ça permet de faire de la messagerie, ce qui devrait être le rôle du mail, ça permet de faire de la messagerie instantanée, ce qui devrait être le rôle de la messagerie instantanée. Ça vous permet de publier des contenus, ce qui devrait être le rôle de votre site web. Cette approche là tend à créer un système centralisé. C'est donc pas le web lui même qui tend à centraliser, c'est l'usage qu'on en fait et le développement des applications qu'on fait au dessus. En général, ça correspond toujours à des défauts d'éducation. Parce qu'on n'a pas appris aux gens à utiliser l'outil adéquat, ils utilisent l'outil qu'ils ont sous la main, et dont ils voient comment se servir. Exactement comme un bricoleur qui n'est pas entraîné, va pas savoir quel outil utiliser pour quel usage. Faire savoir à quel moment on doit utiliser et quel modèle exact de tournevis, je vous assure qu'il y a des fois où ce n'est pas clair. Donc voilà. Ce n'est pas le web qui a créé un réseau centralisé. C'est en tout cas pas lié à sa nature technique.
33:24
Bien. Si on regarde ce que c'est que le mail. Pour le comprendre on va poser un petit peu de vocabulaire. Ça c'est comme dans la poste. L'enveloppe c'est ce que les postiers se racontent pour comprendre où est ce qu'il faut transporter le courrier. Vous avez l'habitude à la poste, à l'avant il y a l'adresse du destinataire, à l'arrière il y a l'adresse de l'expéditeur. Dans le mail, c'est pareil. Il y a forcément l'adresse du destinataire sinon le mail finit dans la poubelle à octet la plus proche. Il y a potentiellement l'adresse de l'expéditeur, pour le prévenir si on n'a pas pu délivrer le courrier. Exactement comme dans la poste. Si vous mettez votre d'adresse d'expéditeur au dos de l'enveloppe, c'est juste pour que ça vous revienne si c'est pas distribué à l'autre bout. Les en-têtes, ce qui n'est pas la même chose, c'est les bobards que les machines racontent aux humains. Je vous donne un exemple assez simple, pareil dans la poste, l'en-tête c'est ce qui dit sur le papier à lettre : « Présidence de la République ». je peux, moi, avec mon imprimante jet-d'encre, imprimer du papier à lettre qui dise « Présidence de la République » ; et signé : « Benjamin Bayart, Président de la République ». je vais me faire engueuler, à priori, mais, ça a à peu près cette valeur là des en-têtes. Je peux, sans trop de difficulté technique, vous envoyer un mail ayant comme expéditeur à peu près n'importe qui, dans les en-têtes. Dans l'enveloppe, c'est un tout petit peu plus compliqué. Donc quand vous vous fiez aux en-têtes affichés par votre lecteur de mail, vous vous fiez au papier à lettre. En moyenne c'est plutôt fiable parce que les gens sont honnêtes, mais ça peut donner des blagues assez amusantes.
35:24
Ce qu'on appelle un MTA, j'ai choisi l'acronyme anglais parce que j'en ai pas trouvé de bon en français, c'est le Mail Transport Agent. Basiquement, c'est le programme qui reçoit du mail et qui décide comment le transporter. Toujours dans le parallèle postal, c'est le centre de tri postal. Le MUA, c'est la Mail User Agent, ça c'est la partie que vous avez l'habitude d'utiliser. Pour les plus windowsiens d'entre vous, ça s'appelle Outlook, pour d'autres ça peut s'appeler Gmail, ça peut s'appeler, je ne sais même pas comment s'appelle celui qui est sur l'Iphone. Ça doit s'appeler Mail tout bêtement parce qu'il est de chez Apple. Donc ça c'est les lunettes pour permettre aux non-voyants de lire, ou aux mal-voyants de lire. Voilà. Ce sont les 4 concepts importants à comprendre quand on veut comprendre comment fonctionne le mail. Il y a l'enveloppe, qui est le seul morceau pertinent techniquement. Ça c'est juste pour faire joli, et il y a ces deux éléments là, qui sont les deux programmes clés qui vont discuter entre eux pour envoyer le mail. Bien.
36:38
Si j'essaye de comprendre ce qui se passe quand j'écris un courrier à Mr Nom@domaine.com. D'abord en règle général, mon courrier je l'écris dans le Mail User Agent. Donc dans le programme client. Qui une fois que j'ai fini, le transmet le plus souvent de manière idiote, à un MTA avec qui il est copain. Il a un petit côté, moi le courrier j'y connais rien, j'ai fini la carte postale, je te la donne, tu y mettras un timbre, tu iras la poster. Ça se résume à peu près à ça. Si je prends l'exemple relativement classique de l'abonné standard du FAI normal, le Mais User Agent en moyenne c'est Outlook Express, le MTA en moyenne c'est smtp.orange.fr, ou smtp.free.fr. Je vous laisse décliner avec les autres. Bien. Ensuite là, il se passe des trucs assez compliqués. Et que je ne peux pas vous décrire. En fait, c'est exactement comme si j'essayais de vous décrire le service du courrier interne d'une grande entreprise. Ça peut être trivialement simple. Quand c'est la « Benj Incorporated » c'est simple. C'est à dire que moi j'ai écris mon courrier, avec mon porte-plume préféré, je l'ai mis tout seul dans l'enveloppe, comme un grand garçon avec un timbre, je suis allé le mettre dans la boite jaune. Maintenant si vous essayez d'expliquer comment, par exemple j'en sais rien moi, une grande administration centrale, fait pour envoyer du courrier, vous allez voir que c'est un bordel qui n'est pas du tout le même. C'est à dire que vous mettez la lettre dans la banette à tel endroit, où il y a le pitou-pitou qui passe avec son chariot pour la récupérer et l'amène au service du courrier, où là il y a le brave gars qui pèse et qui met dans la machine à timbrer, où ensuite il y a un monsieur de la poste qui vient avec son grand sac pour récupérer le zinzin pour l'amener au central : c'est un bordel indescriptible. D'où une chaine opaque d'intermédiaires. Mais basiquement, le transfert qui a lieu est toujours du même type que celui qui est là. En règle générale, c'est un transfert très linéaire sur : moi j'avais mon petit boulot à faire, coller un timbre, rajouter le logo de la boite sur l'enveloppe, des tâches très élémentaires et où ensuite je passe à celui qui saura. Ensuite on rattaque le vrai moment où ça circule sur internet. C'est à dire que dans le cas le plus simple, qui serait celui qu'il y a chez moi, le Mail User Agent c'est celui qui est sur ma machine, le Mail Transport Agent, c'est celui que j'ai installé sur ma machine. Donc l'étape immédiatement après, c'est que le Mal Transport Agent qui est sur internet, il cherche qui est la machine responsable du courrier pour domain.com. Ça c'est une résolution DNS, par contre c'est pas le champ A. Il ne cherche pas l'adresse IP de domaine.com, ça c'est ce que fait le navigateur web, il cherche qui est responsable du courrier qui est le Mail Exchanger de domaine.com. Donc si je vous ressortais le transparent du début sur les DNS, les enregistrements MX c'est ça. Ça dit : pour tel nom de domaine qui se trouve à droite du @ le serveur qui est responsable du courrier c'est untel.
40:25
Ensuite on établit une connexion du même type que celle qu'on avait ici entre le MTA sortant et celui qui est responsable de l'entrée du courrier. C'est à dire qu'en fait, ce qui serait l'équivalent de la poste, c'est là. Une fois que ça c'est fait, basiquement le courrier est arrivé à bon port. Le reste c'est du détail. C'est à dire que, il y a le même problème, quand j'écris à un fonctionnaire précis dans un ministère, le chemin suivi parle courrier pour lui parvenir est beaucoup plus compliqué que quand on m'écris chez moi. Mais ça relève du détail. Et le destinataire, lui il ira dans son MUA, dans son mail User Agent, dans lequel il pourra répondre. Donc ça c'est la structure du mail. Qu'est ce qui fait que c'est parfaitement a-centré ? C'est ce bout là. Le seul point intéressant est là. Tout le reste c'est du détail. Le point clé là dedans, c'est qu'il n'y a pas de centralisation. Exactement comme on peut avoir un nom de domaine par machine, voire par personne, voire plusieurs. Une fois que j'ai acheté benj.com, je vais faire téléphone.benj.com, portable.benj.com, trois noms de domaine par machine, si j'ai envie, ça ne coûte rien.
Pourquoi le mail ne crée pas de centralisation, parce qu'une adresse mail c'est une partie_locale@le_nom_d'une_machine. Structurellement, une adresse mail c'est ça. Et donc par définition, il existe un infini d'ordre supérieur d'adresse mail. Puisqu'on a vu qu'on pouvait produire autant de nom de domaine qu'on voulait, et que chacun de ces noms de domaine peut gérer autant d'adresses qu'il en a envie. Moi sur ma machine, je gère plusieurs adresses mail. Il y a la mienne évidemment, mais il y en a d'autres. La seule limite qu'il y a à cette décentralisation, c'est l'usage qu'on en fait, là encore.
Dans la pratique, pour des raisons qui ne sont pas d'ordre technique, le mail tend à se centraliser. C'est au moins aussi dangereux que sur le web. C'est à dire que vous tendez à laisser traîner votre courrier n'importe où. Vous n'accepteriez jamais de traiter votre courrier postal comme ça. Je ne sais pas combien il y en a chez vous qui ont pour habitude de laisser leur courrier même après l'avoir lu chez la gardienne de l'immeuble, je pense que c'est à peu près personne. Une des particularités cependant, c'est que il n'y a pas d'applications dérivées du mail. Il y a bien des applications dérivées du web, je citais l'exemple de Facebook, des applications Facebook tout à l'heure, il n'y a pas à ma connaissance d'applications dérivées du mail. C'est à dire que le mail reste ce qu'il est depuis à peu près 30 ans, c'est à dire de l'échange de correspondance, soit privée, soit pas privée mais basiquement tout le temps le même outil.
44:00
Donc là on vient bien de voir deux applications assez distinctes, qui ne sont ni l'une ni l 'autre structurellement centralisées. Simplement l'une qui est le web tend à se centraliser très fortement, essentiellement pour des problèmes d'éducation et de méconnaissance de l'usage. C'est à dire qu'il y a très peu de gens qui savent qu'ils peuvent héberger un site web chez eux. L'autre qui est le mail, qui se centralise moins vite, en grande partie parce qu'il n'y a pas d'applications dérivées et donc il n'y a pas eu de business développé autour.
44:37
Là on va voir un premier exemple, de fonctionnement absolument, totalement, entièrement centralisé. De ce que j'ai compris, il faut savoir que les protocoles Microsoft, c'est pas documenté officiellement, j'ai juste regardé un petit peu comment ça tournait en écoutant ce qui circulait sur le réseau. Les discussions entre deux personnes transitent par un serveur central qui est chez Microsoft. C'est à dire que quand je dis bonjour à mon pote, le message au sens réseau il va de ma machine à la machine de Microsoft qui le fait suivre à mon camarade. Alors que quand j'envoie un mail au même copain, le mail sort du serveur mail le plus proche de chez moi, et rentre dans le serveur mail le plus proche de chez lui. Proche en terme de réseau. C'est à dire qu'il sort du serveur mail qui est responsable de mon domaine, pour rentrer dans le serveur mail qui est responsable de son domaine. Ça ne transite pas par un point central. Là sur MSN tout le trafic transite par un point central, aux Etats-Unis. Pour la vidéo, ils ont fait gaffe, ils n'ont pas fait comme ça, ça faisait trop de bandes passantes. Pour la vidéo, quand les deux personnes veulent échanger un flux soit d'échange de fichier, soit de webcam, il y a une mise en relation directe qui est faite. C'est à dire que toute la négociation sur : machin demande à accéder au flux vidéo émis par votre webcam, acceptez-vous, refusez-vous etc... ; tout ça ça se fait en rebondissant sur les serveurs de Microsoft. Par contre le flux vidéo lui-même, il ira directement d'une machine à l'autre, ce serait trop lourd à centraliser.
Mais c'est vraiment parce qu'ils n'ont pas pu le centraliser qu'ils ne l'ont pas fait. Donc là-dessus, il y a un annuaire central. Il faut comprendre ce que ça veut dire un annuaire central. C'est pas seulement que Microsoft connaît les adresses de tous les abonnée à MSN, ce qui pourrait à l'extrême rigueur se comprendre, c'est que tu connais pas la liste de tes amis. Combien parmi vous ont un compte MSN ? Alors vous me reprendrez si je me goure. Je prends votre PC perso, je le jette, poubelle ; j'en prends un tout neuf, vous vous connectez à MSN, avec votre identifiant habituel, la liste de vos contacts réapparait. J'ai bon ? Ça veut dire qu'elle est où ? Chez Microsoft. Si Microsoft a décidé quevous n'étiez plus copain avec machin, il n'apparaît plus dans la liste. Funky ? Ils ont l'intégrale de vos discussions, délicieux ? Je ne parle même pas du fait qu'ils peuvent intercepter et ne pas laisser passer tel ou tel morceaux. Ils peuvent enregistrer ce qu'ils veulent.
Moi j'ai connu ça quand j'étais petit. C'était 3615 Machin. Exactement ça. On se connectait tous au même serveur central pour discuter entre nous en même temps. Alors juste à l'époque le minitel c'était pas bien rapide et puis le réseau était pas complètement international, mais ça marchait très bien. Et effectivement on se retrouvait entre bande de potes sur le même serveur pour pouvoir bavarder. Ça c'est purement du minitel.
48:42
Donc cette application là, on sent très bien dans son architecture même, qu'elle est radicalement structurellement, profondément différente des deux premières qu'on a vues. Alors vous allez me dire c'est normal ; parce que pour faire de la messagerie instantanée, il faut forcément qu'on soit deux connectés au même endroit pour discuter sans quoi ça ne marche pas. Et ben non. C'est pas nécessaire.
XMPP c'est le nom technique du protocole de messagerie instantanée qui s'appelle Jabber, que le grand public connaît peut-être sous le nom de Google Talk. Puisque quand Google a fait son outil de messagerie instantanée, ils ont décidé d'adopter un protocole normalisé et ouvert qui s'appelle XMPP, et dont le nom de guerre est Jabber. Je n'ai pas envie de rentrer dans les détails de comment c'est rangé, etc...
Pour permettre de décentraliser le mail, on a vu tout à l'heure qu'il y avait un type d'enregistrement très particulier dans le DNS qui s'appelle un enregistrement MX. C'est à dire qu'il y ales types d'enregistrements A qui associent une adresse IP, il y a les types d'enregistrement MX qui disent qui est responsable du mail. Ça c'est presque une anomalie historique. Il se trouve que le mail existait déjà quand le DNS a été inventé. Normalement ça doit vous plonger dans des abîmes d'historiques, c'est du temps où les dinosaures paissaient paisiblement dans les vertes prairies parisiennes.
Le mail existait déjà, c'est à dire que les machines s'échangeaient du mail, alors qu'il n'y avait pas moyen d'associer de manière raisonnablement simple une adresse IP à une machine. Ça donnait un merdier indescriptible en configuration du réseau. Les ingénieurs réseau de l'époque connaissaient à peu près par coeur les adresses IP de toutes les machines du monde. Ça tombe bien, elles n'étaient pas nombreuses.
Donc forcément, quand on a inventé le DNS, on lui a fait sa petite maison sur mesure, mais pour tous les protocoles qui ont été inventés après, on n'a pas fait cette subtile modification.
Cependant comme je l'ai évoqué sur le transparent sur les DNS, il y a un champ texte dans lequel je vous disais que vous pouviez mettre les deux premières pages de votre roman préféré, vous pouvez y mettre n'importe quoi. Et en particulier dans le n'importe quoi, on peut dire qui est responsable du trafic Jabber, donc du trafic XMPP, pour le domaine en question.
Exactement comme il y a un enregistrement MX qui dit qui est responsable du mail, il y a potentiellement dans l'enregistrement TXT un bout d'information qui dit qui est responsable du trafic Jabber.
51:47
Un point qui a pu vous échapper : dans un enregistrement TXT on n'a pas le droit de mettre des trucs très très long. C'est pour ça je disais deux pages de roman, en espérant que ce soient des petites pages, je vous ai bien précisé tout à l'heure, on a le droit de mettre plusieurs enregistrements du même type associé à un nom de domaine. Si je mets 600 enregistrements TXT associés à un nom de domaine, j'ai mis le roman dedans. Donc, ce mécanisme qui consiste à dire que je vais ajouter des informations arbitrairement complexe pour n'importe quelle application nouvelle dans le DNS, est complètement extensible. Je peux bien rajouter un enregistrement TXT pour Jabber, et puis ajouter un autre enregistrement TXT pour n'importe quelle autre application de messagerie instantanée. Du coup effectivement moi, je suis bien connecté à mon serveur Jabber qui est potentiellement sur ma machine, qui lui détient la liste de mes amis. Ce qui fait que si je détruis mon client Jabber, je n'ai pas perdu la liste de mes contacts. La personne avec qui je veux discuter est connectée sur son serveur Jabber. Des serveurs Jabber il peut y en avoir des milliers sur la planète, ce n'est pas un problème. Quand on voudra se mettre en relation l'un avec l'autre, soit simplement pour savoir qui est en ligne, soit pour pouvoir discuter, la discussion aura lieu directement d'un serveur à l'autre. C'est à dire sans passer par un centre.
53:20
Donc la messagerie instantanée ne suppose pas de centre. Le fait d'avoir décidé d'utiliser couramment un client de messagerie instantanée qui impose un centre, il y a certainement un tas de raisons historiques à ça, mais ça n'est pas une obligation technique. Seul mon serveur connaît mes amis, c'est une vraie différence. Moi ce qui m'embête, ce n'est pas tellement que les informations soient stockées en dehors de ma machine strictement physique, c'est qu'on m'impose de les stocker chez quelqu'un que je n'ai pas choisi. C'est qu'on m'indique, lui, là, ce sera ton intermédiaire de confiance et tu lui feras confiance. Il est gentil. C'est obligé qu'il soit gentil, de toute façon il est tout seul. C'est une vraie différence. Une vraie différence forte. C'est à dire qu'en faite, c'est toute la différence qu'il y a entre le minitel et internet. C'est toute la différence qu'il y a entre un réseau centralisé qui fonctionnait avec de la commutation de circuit, où donc forcément vous n'étiez en connexion qu'avec un seul serveur , donc vous ne pouviez pas avoir des échanges multiples et variés; et un réseau comme internet qui n'a pas de centre et où structurellement vous pouvez être en connexion avec autant de services que vous le souhaitez. Exemple type : quand vous êtes sur Facebook, vous pouvez tout faire sans sortir de Facebook. C'est typique de l'application Minitel, qui fait tout et son contraire, juste en naviguant dans des menus. C'est structurellement à l'opposé de ce qu'est internet. Et donc quand on parlera dans la prochaine conférence, puisque là j'ai quasiment fini, des impacts politiques et sociétaux d'internet, faut bien comprendre. Pour moi Facebook ne fait partie d'internet. Précisément pour cette raison là. Et MSN n'en fait pas partie non plus, pour les mêmes raisons.
55:44
Bien. Donc j'ai dit que je ne parlerai pas du peer to peer. Du coup je ne vais pas en parler. Parce qu'en fait, c'est bien ce que j'avais prévu, il est 20h14 donc je vais essayer de finir dans moins de 10 minutes. Et si je veux vous expliquer comment fonctionne le peer to peer, on en a pour une demi-heure. Alors je vais me contenter de lancer des pistes et des idées, pour que vous ayez à peu près une idée de comment ça marche. Sachant que tous les protocoles de peer to peer sont différents les uns des autres, c'est à dire que Emule ne fonctionne pas du tout comme BitTorrent, qui lui même ne fonctionne pas comme fonctionnait Napster qui fonctionne pas comme... voilà. Tout ça est à chaque fois assez différent.
On a affaire à un principe qui est celui du réseau à inondation; c'est à dire que plus il y a de gens qui viennent rejoindre e réseau, plus le réseau est puissant puisque chacun après avoir téléchargé une parcelle d'information va la remettre à la disposition de tout le monde. Si vous aviez des accès internet symétrique, ce qui n'est pas le cas, quand vous téléchargez, vous vous retrouveriez à émettre plus de données que vous n'en téléchargez. Et c'est ce qui fait la puissance du phénomène, puisqu'en fait on a quelque chose de complètement explosif. Si je suis « un » à proposer un contenu au départ, par exemple la vidéo de ma conférence, je la mets en ligne chez moi, si personne ne la télécharge, il ne se passe rien, le réseau ne fait rien, comme toujours en mathématique, sitôt qu'on met un zéro, il ne se passe rien. Si une personne télécharge la conférence, à partir du moment où elle a récupéré le premier tout petit bout de la vidéo, alors nous sommes deux à proposer le contenu. Donc quand une deuxième personne se dira : « Tiens, qu'est ce qu'il a raconté comme connerie Benj ce soir ? » cette deuxième personne disposera de deux sources: moi et l'autre. Même si il n'a pas fini de télécharger, il peut déjà en proposer des bouts. Il y a donc structurellement dans ce mécanisme de réseau à inondation, forcément autant d'émetteurs que de récepteurs. Simplement on n'est pas tous émetteurs des mêmes morceaux. Donc ça ça tend à supprimer un des points de congestion très classique dans les structures de réseau. Pour ceux d'entre vous que le sujet intéresse et qui ont suivi d'une oreille distraite le colloque de l'ARCEP de la semaine dernière, toute la bataille qu'il y a en ce moment entre les marchands de réseaux et les marchands de culture en boite, Youtube, Dailymotion, etc... , c'est de savoir comment on fait pour transporter pleins de vidéos vers pleins de gens ça force à mettre des tuyaux énormes parce que il y a un gars qui émet plein de trucs et pleins de gens qui reçoivent pleins de truc. En peer to peer, on n'a pas le problème. Plus il y a de gens qui demandent le contenu, plus le contenu est disponible.
59:00
Ensuite on voit se produire des phénomènes dans ce mécano là, que les gens qui ont fait un peu de mathématiques ou qui ont bu trop de caféïne peuvent connaître sous des noms comme la percolation ou l'agglomération. Alors effectivement, si on demande tous le contenu en même temps, et que donc du coup on se met tous à le mettre à disposition en même temps, il y a bien un moment où le réseau ne pourra pas transporter tout ça. Exactement comme si on décide tous de partir en vacances, en même temps, même si on ne va pas tous au même endroit, le réseau routier ne va pas tenir. Donc on retrouve les mêmes phénomènes. C'est à dire que en dessous d'une certaine masse, si je suis vraiment le seul à proposer un contenu, personne ne le trouvera jamais. Au dessus d'une certaine masse, si on est trop nombreux à diffuser le contenu, on sature complètement le réseau. Le contenu se diffuse bien, c'est juste tout le reste d'internet qui ne se diffuse plus. Il y a un côté viral. Donc on a bien ces deux phénomènes. On crée des bouchons, soit par trop vite, soit par trop plein, qui en moyenne se lissent très très vite. C'est à dire qu'effectivement, quand le dernier épisode de la série américaine vient d'être diffusée aux Etats-Unis, dans le quart d'heure qui suit la vidéo est mise en ligne, pendant à peu près 12 heures c'est le bordel. Après … une fois qu'il est présent sur suffisamment d'endroits répartis suffisamment bien sur la planète, ça se passe gentiment.
Il y a un point intéressant dans le phénomène de peer to peer, tous les échanges se font par des connexions de proche en proche. C'est à dire que quand je cherche un contenu, je discute avec une quinzaine ou une trentaine ou une cinquantaine ou une centaine de voisins, donc il font tourner je pense le même logiciel que moi, de partage de contenus en peer to peer. Eux même vont être capable de me dire tiens moi j'ai des voisins là, là là et là, on va pouvoir éventuellement créer des petits bouts d'annuaires, disant : « Aujourd'hui, 20h19, tel fichier il a l'air d'être diffusé par tous ces gens là ». C'est pas vrai, c'est pas complet, c'est à moitié faux, c'est pas grave. On va leur demander. Il y a tous ceux qui répondront que oui, on prendra, puis tous ceux qui répondront pas, on les virera de la liste. Tout ça fonctionne sans DNS. C'est à dire que le seul tout petit point de centralisation qui restait dans les autres protocoles, sur celui là a sauté. Donc de tous les protocoles applicatifs qu'il m'a été donné de voir, depuis un petit moment déjà que je suis sur le net, c'est celui qui est le plus proche de la philosophie globale d'internet ; qui n'est pas compliqué, qui est bêtement massif, et qui marche.
1:02:23
Du coup on s'en sert quand même avec des annuaires; combien parmi vous ont pratiqué un peu BitTorrent ? Ah ! Un tout petit peu moins que ceux qui ont de l'ADSL. Pour les gens qui ne verront pas sur la vidéo, ça fait à peu près 98% quand même. Mais j'ai bien vu, il y a au moins deux ou trois mains qui ne se sont pas levés. Quand vous récupérez un Torrent, c'est à dire le petit bout de fichier qui vous donne la référence exacte du morceau que vous voulez télécharger, vous avez un bout d'annuaire qui dit : tel fichier, tel identifiant technique. Ensuite, ce qu'on va aller chercher ce sont des seed, quisont en fait, pour tel identifiant technique, voilà quelques centaines d'adresses IP qui prétendent en disposer. Ça, ça joue bien quelque part un espèce de rôle d'annuaire ou de DNS. C'est complètement acentré. Il peut y en avoir plusieurs en parallèle. Et les gens qui avaient l'habitude d'aller chercher les infos sur The Pirate Bay, il y en a d'autres qui ont l'habitude d'aller les chercher ailleurs. Des annuaires comme ça qui diffusent des torrent et qui diffusent des seed, il y en a quoi, quelques centaines, quelques milliers, exactement comme si on avait en parallèle, plusieurs centaines ou plusieurs milliers d'annuaires au sens DNS, qui ne se sont pas concertés, qui sont pas d'accord entre eux, qui contiennent tous un certain nombre d'informations fausses et qui pourtant fonctionnent. C'est tout le jeu d'ailleurs de ce à quoi vont s 'amuser les anti-Hadopi sitôt que la Hadopi sera en place : injecter de fausses informations dans les annuaires qui traînent. C'est à dire je suis absolument certain que l'adresse IP du ministère de la culture sera dans à peu près tous les carnets d'adresses de la planète. Et je suis aussi parfaitement certain que en bonne égalité républicaine, ils ne seront jamais emmerdés. Bien.
1:04:18
Un petit bout de conclusion ! On est bien d'accord, je n'ai pas parlé du peer to peer, vous ne savez toujours pas comment il marche. Ce qu'on a vu la semaine dernière, c'est un point clé, c'est que le réseau est totalement générique. Il transporte des paquets de données dont il ne sait pas ce que c'est. Il ne sait pas quel paquet de données est une question, quel paquet de donnée est un réponse. On pourrait se dire, quand il y a un petit paquet puis un gros, c'est la question puis la réponse. Ben non, il y a des fois, la question est plus grosse que la réponse. Vous vous imaginez, une question standard que l'on pose à un politique : « bla bla bla bla bla bla bla bla bla bla bla bla » à la fin il fait « sans commentaires ! » . Si tu ne parles pas la langue, va identifier la question et la réponse. Ce qui est intéressant, c'est que ce réseau générique permet des applications inattendues. Typiquement, de mémoire, le DNS ça a dû être inventé à peu près 15 ans après internet. Le web, je dirais aussi à peu près 15 ans après le DNS. On n'a pas remis en cause le DNS. Le web s'en est très bien contenté. Jabber, qui est une invention fort récente, a repris les idées pour décentraliser qu'utilise le mail, à savoir quelques enregistrements DNS spécifiques, sans modifier ni ce qu'est IP, ni ce qu'est le mécanisme d'annuaire qui est le DNS. Ces applications n'étaient pas prévues. Elles sont possibles et elles ne sont possibles que parce que le réseau est générique. C'est bien l'élément important de la semaine dernière, le réseau transporte des données auxquelles il ne comprend rien, les applications seules en font quelque chose d'intelligent. Je tiens beaucoup à l'exemple que j'ai donné de MSN versus WMPP. Même si moi personnellement je n'utilise aucun des deux. Il m'est arrivé d'utiliser MSN quand même pour pouvoir en dire du mal. Autant pour les trucs qu'on dit du bien, c'est pas obligé, pour les trucs qu'on dit du mal, il vaut mieux avoir essayé. On peut très bien pour le même application la développer de deux manières. L'une qui suppose un centre, l'autre qui n'en suppose pas.
1:07:00
En règle générale, la solution qui ne supporte pas de centre est plus simple, puisqu'elle ne demandera pas d'avoir des ordinateurs d'une puissance infinie et une bande passante monstrueuse pour alimenter les ordinateurs en question. Elle demande par contre de réfléchir un petit peu plus pour chercher comment faire sauter le centre. Comment on fait pour enlever l'annuaire central, par exemple dans la messagerie instantanée. Et il faut savoir qu'en règle générale, ces problèmes ont déjà été résolus au moins une fois. C'est à dire que si vous cherchez d'autres protocoles de réseaux qui permettent d'éviter les centres, ils existent déjà. Il y a basiquement trois modes, il y a la gestion par délégation, c'est ce que fait le DNS, et c'est ce qui fait que le DNS racine qui porte tout le centre d'internet. Il mange globalement relativement peu de questions par rapport à ce qu'il y a comme nombre d'internautes. Vous avez la gestion en passant par l'annuaire, ce que fait le mail. Et vous avez la gestion par un réseau d'inondation, c'est ce que fait le peer to peer. C'est le trois grandes réponses classiques. Enfin, les applications en elle même, hormis quelques saletés comme MSN, ne sont pas structurellement dangereuses pour le réseau. Ce qui tend à dénaturer le réseau en le transformant en réseau centralisé, ce ne sont pas les applications elles même du réseau. C'est à dire ce n'est pas HTTP donc le web ou SMTP donc le mail qui tendent à centraliser le réseau. C'est le manque d'éducation des internautes et c'est un manque de connaissance de ce qu'est le réseau. Ce qui n'est pas choquant. Un des points par lesquels je commencerai la semaine prochaine, ce sera probablement le fait qu'il y a une courbe d'apprentissage sur internet. C'est à dire qu'il y a en France 18 millions de mémoire d'abonnements haut débit. La dedans, il y a un peu moins de 10% des gens qui savent à peu près convenablement se servir d'internet. C'est pas choquant. C'est pas étonnant. C'est long à apprendre. Il y a une courbe d'apprentissage qui commence au tout début par la vidéo du chat qui fait des galipettes dans Youtube. Vous l'avez tous vu, c'est à peu près le début. On commence par là, c'est marrant, c'est con. Un petit peu plus loin, il y a le moment, au lieu juste de regarder les débileries qu'envoient les copains, on se met à discuter de choses un petit peu plus intéressante que des débileries, avec soit des copains, soit des amis, soit des collègues. Un tout petit peu après, il y a le fait qu'on commence à aller lire du contenu. C'est çà dire qu'on se dit tiens, plutôt que de me contenter de la pravda que je reçois dans la publicité le matin, je vais aller lire ce qu'écrivent d'autres gens, puis on finit par trouver des sources d'informations sur le net. Un petit peu plus loin, il y a un moment où on se met à écrire. On se dit mais non non non il a écrit son papier, moi je le connais le sujet, je bosse dessus, c'est de la merde son truc, je vais lui dire quand même qu'il s'est gouré. Puis après, à force d'écrire des commentaires de 800 lignes, on se dit bon, je vais arrêter d'en faire un commentaire. Je vais ouvrir un site web, je vais le mettre moi. Là on commence sérieusement à s'approcher d'être un internaute expérimenté. Il y a une courbe d'apprentissage, c'est normal, qu'il n'y ait qu'une part relativement faible de la population expérimentée sur le sujet. C'est facile, il suffit de regarder qui a accès à internet depuis plus de 10 ans. Les gens qui ont plus de 10 ans d'expérience, forcément connaissent mieux et maîtrisent mieux l'outil que les gens qui ont moins de 3 ans d'expérience. Donc il y a une courbe d'apprentissage. C'est essentiellement ça qui tend à centraliser le réseau. Le fait qu'il y a en ce moment de manière transitoire sur le réseau une majorité d'ignorants; qui du coup entrainent des usages qui sont dramatiques, le mot est trop fort, dangereux.
1:11:20
Parce que à l'heure actuelle, enfin non, il y a 10 ans, ce qui empêchait quelques grands groupes de vouloir s'accaparer le mail, il y en a qui ont essayé, c'et qu'ils obtenaient n'importe quoi. Un système de messagerie, ça devait être à peu près le cas chez AOL, par exemple, où on pouvait tranquillement discuter qu'entre gens abonnés à AOL, il vous manquait 80% de la planète. Forcément les gens ils ont le choix entre un truc où on peut parler à un humain sur 5 et un truc où on peut parler à 4 humains sur 5, ben ils vont tous du côté où il y a 4 humains sur 5. ce Qui rapidement fait plus que 4 humains sur 5 du cour. Et donc ça s'est arbitré assez vite ce genre de conneries. Maintenant si Mr Facebook il décide qu'il ne veut parler qu'à Mr Facebook, si il a 70% de la population il s'en fout du reste. Alors lui tout seul il ne pourra pas. Mais si les abonnés qui ont un compte hotmail veulent discuter avec les abonnés qui ont un compte gmail, qui peuvent discuter avec les abonnés qui ont un compte Yahoo, on a là couvert une grande part de la population. Sin on étend ça à pas très loin, à peu près 200 ou 300 en comptant les gros FAI, les très gros aussi, on va dire par exemple que Free c'est trop petit. Donc on va étendre ça à à peu près 200 ou 300 opérateurs et on va avoir recréé un réseau entièrement centralisé qui perd essentiellement cette caractéristique là. C'est bien parce qu'on avait rien prévu quand internet a été inventé que tout a été inventé depuis. C'est ça la différence fondamentale entre le minitel et internet. Le minitel c'est fait pour faire du minitel et rien d'autre et curieusement on en a jamais rien fait d'autre. Internet c'est pas fait pour quoi que ce soit, ça transporte des données, c'est trop bête pour faire quoi que ce soit, et du coup on a pu en faite tout ce qu'on voulait. En créant une centralisation on va créer une spécialisation et donc perdre une capacité à innover. Donc voilà. Le vrai morceau intéressant c'est que les applications spécifiquement internet-like tendent à se développer en fait avec l'expérience des utilisateurs. C'est à dire plus les utilisateurs sont expérimentés, plus ils tendent à s'orienter vers des solutions autres simplement parce que ben on commence à voir ça. Les gens qui découvrent alors qu'ils ont un compte Facebook depuis un an et demi, que ça marche pas du tout comme ils croyaient, ah tiens c'est pas que des gentils, c'est pas une oeuvre de bienfaisance, enfin des tas de trucs...les gens qui découvrent que Google ne fait pas forcément tout non plus par amour de l'humanité, donc voilà. Ça s'apprend, c'est comme tout. Il y a rien de … En fait dans les applications actuellement utilisées sur le net, il n'y a pas grand chose qui tendent structurellement à la centralisation. Il y a MSN quand même mais c'est à peu près tout. Voilà. Donc ça c'est la fin du deuxième volet, je crois bien qu'il n'y a plus rien derrière. Ce qui fait que du coup vous avez normalement maintenant une vision assez claire de ce que c'est un réseau de transport, et du fait que ça ne comprend rien à ce que ça fait quand ça marche bien. Vous devez avoir une vision assez claire de ce que sont des applications, de la différence qu'il y a entre une application centralisée et une application acentrée. Et ce sont les deux points clés dont on aura besoin la semaine prochaine pour parler des conséquences politiques d'internet. Je suis à peu près dans le délai que j'avais prévu. Si vous avez des questions.
Applaudissements
Ça marche ça aussi. Ah oui.
1:15:49
Question : Bonsoir, j'ai une question concernant la structure du cycle des conférences. En 1 on a la structure du réseau, en 2 les applications, en 3 les enjeux politiques. Est-ce que c'est 3 aspects qu'on peut attaquer de front pour avoir un internet libre, ou est-ce que c'est en cascade à savoir une fois qu'on aura une adresse IP pour tout le monde grâce à IPV6 et un débit symétrique grâce aux fibres optiques, et des machines qui consomment peu pour être auto-hébergées, que découlera les usages plus proches de ce qu'est internet, et que donc on aura des textes de lois qui seront en rapport avec l'internet ?
Benjamin Bayart : Non, il faut que les trois fonctionnent de front, quasiment indépendamment. En fait, c'est presque dans l'autre sens. C'est à dire que, comment dire, si les gens savent ce qu'est internet, on n'arrivera plus à leur vendre n'importe quoi sous ce nom là. La raison pour laquelle je n'ai pas de forfait data sur mon téléphone mobile, c'est que je sais que ce n'est pas un accès internet. Effectivement, ça permet de faire kikoolol sur Facebook, seulement moi, je n'ai pas de compte Facebook, je n'en ai pas l'usage. Ça ne permet pas les usages que moi j'ai du réseau. Donc ça ne m'intéresse pas, donc je n'ai pas d'abonnement. Si la majorité des gens savaient s'en servir, ils auraient à peu près la même réaction que moi, et donc les opérateurs cesseraient d'essayer de vendre ça. Basiquement, tu ne peux pas vendre aux gens des choses qui leur sont vraiment complètement inutiles. Faut qu'il y ait au moins un semblant de quelque chose d'intéressant. Donc pour moi, dans les trois points ce serait plutôt le troisième le plus important. Les autres suivront. D'un autre côté tu ne peux pas pattendre, tu ne peux pas espérer que les gens développent un usage très avancé du réseau, si ils n'ont pas compris ce que c'est, donc si ils ne l'ont pas vu fonctionner. Si je reprends un parallèle que j'aime bien, on ne peut pas espérer que les gens soient tous des lettrés si on n'a pas commencé à diffuser des livres. Donc pour que les gens comprennent l'importance de la liberté de la presse, il faut d'abord qu'ils aient appris à lire. Il y a un problème de poule et d'oeuf. Pour qu'ils aient appris à lire, il faut qu'on ait le droit d'imprimer, pour qu'on ait le droit d'imprimer, il faut qu'ils soient tous suffisamment éduqués pour exiger qu'on ait le droit d'imprimer. Donc il y a un problème de poule et d'oeuf. On ne peut pas faire l'impasse sur la partie éducation, très clairement, on ne peut pas non plus, vu la puissance des lobbys en face, et vu l'ampleur des enjeux, laisser les choses se passer toutes seules en disant quand la majorité des gens seront formés à ce qu'est du réseau, alors ce sera réglé. D'abord parce que ça peut être très long, et ensuite, si on casse internet alors qu'il est encore tout petit, il faudra attendre qu'il y en ait un deuxième. Basiquement, entre l'invention de Gutemberg et la liberté de la presse, il y a à peu près 4 siècles, de mémoire c'est 1445 Gutembertg, donc 1440, la loi sur la liberté de la presse en France 1881, donc il y a à peu près 440 ans. Ce serait bien qu'on mette moins de temps. Et donc pour moi, le cycle de trois conférence il est pas du tout pensé sur quels sont les trois enjeux clés pour défendre un internet libre. Ça c'est beaucoup plus ce que l'on retrouve sur la conférence sur le minitel 2.0 d'il y a bientôt 3 ans. Il est simplement pense sur quels sont les éléments nécessaires pour comprendre les débats politiques qui ont lieu aujourd'hui autour d'internet. En particulier ce que j'ai expliqué sur ce que c'est que du réseau et sur ce que c'est qu'une application, disons à peu près le double en volume ça correspondrait au bagage dont auraient eu besoin les députés européens pour discuter du paquet télécom. C'est un bout de la culture technique qui leur manque pour ne pas se laisser enfumer par les lobbyistes de tout poil. Donc mon but c'était de poser sur la table les deux éléments techniques aussi clairement que je pouvais l'expliquer en 1 heure et quelque, que sont les réseaux de transports et ce que sont les applications pour qu'on puisse ensuite réfléchir à pourquoi internet a eu cet impact là sur la société; essayer de se faire vaguement une idée de l'impact qu'il aura après, et de bien comprendre pourquoi les autres réseaux n'ont pas cet impact là. Et typiquement, c'est compliqué d'expliquer que le réseau est acentré quand on ne sait pas ce qu'est un réseau. Et c'est compliqué d'expliquer que certaines applications sont dramatiquement centralisées, et que d'autres ne le sont pas quand on n'a pas expliqué ce qu'est une application. Donc c'est pour ça que je voulais poser ces deux points de vulgarisation scientifique qui pour moi sont des évidences puisque c'est ce que j'ai appris en tant qu'ingénieur, avant de pouvoir commencer à discuter du reste. Et sinon, pour revenir sur ta question, on ne peut pas attaquer le problème de la défense d'internet libre que par la phase technique ou que par la phase éducative. Il faut les deux. L'un sans l'autre ne marchera pas.
1:21:23
Question : Vous avez dit que quand le serveur chinois avait envoyé des réponses fausses sur le serveur racine on l'avait éteint, qui est ce « on » et comment est ce que ça se passe ? Parce que il y a quand même une autorité dans ce cas là qui domine les serveurs racine donc quelque part internet ?
Benjamin Bayart : alors oui et non. Oui et non. Il faut comprendre que le serveur racine qui était en Chine, lui renvoyait les bonnes réponses. Par contre le réseau chinois bidouillait les réponses. C'est un des artifices qu'utilise le gouvernement chinois pour faire sa grande muraille sur internet. C'est à dire que vous demandez : « c'est où Facebook .com ? », et puis ça répond en terme techniquement à peine plus poli, « dans ton cul ». et c'est le réseau qui fait cette modification là. C'est à dire le DNS lui même c'est pas le gouvernement chinois qui a la main, c'est un opérateur télécom, je ne sais pas lequel, les 150 exemplaires sont opérés par 150 opérateurs différents. Dans l'association dont je m'occupe, FDN, on a failli récupérer un de ceux là, hébergé sur Paris il y a une dizaine d'années puis finalement ça ne s'est pas fait. Mais voilà, il y a vraiment beaucoup beaucoup de monde qui en héberge, ce sont juste des machines qui sont des copies de la machine de référence, point. On s'assure juste qu'elle a à manger et à boire et qu 'elle est pas en plein soleil, c'est tout. Donc qui c'est le on, ben l'opérateur qui avait posé cette machine en Chine. Pourquoi on l'a éteint ? En fait tant que le gouvernement chinois raconte des bobards aux citoyens chinois, ça concerne essentiellement les citoyens chinois. Or le problème c'est que la structure du réseau dont je parlais la semaine dernière fait que quand le réseau bouge parce qu'on rajoute des liens ou parce que on en enlève, le trafic passe par ailleurs. Et que ça change continuellement. Le trafic passe son temps à changer de route. Et il se trouve que pour une raison finalement pas importante, à un moment ce serveur qui était en Chine s'est retrouvé plus près que tous les autres pour certains internautes. Et pour certains internautes qui n'étaient pas en Chine. Et je pense que les ingénieurs système qui ont constaté ça au Chili et il me semble du côté de la Californie ont très modérément apprécié le fait de recevoir des coups de fil en masse de leurs abonnés disant : « Dîtes donc, c'est curieux, Facebook ça n'existe plus ? » donc il fallait bien régler le problème. Et le plus simple des moyens, c'était de déconnecter ce serveur là. Du coup il n'était plus le plus proche. Du coup le trafic allait chercher la réponse ailleurs donc pas en Chine, donc passant pas par le routeur menteur , donc pour tout le monde ça marche. Evidemment, pour les gens qui sont en Chine la réponse parfaitement intacte vient du grand internet et le réseau chinois ment, en bidouillant la réponse, ça ne change rien pour les internautes chinois. C'est juste que le petit bricolage du gouvernement a déteint, il s'est vu à l'extérieur. Et donc pour l'enlever, il a suffi de faire une petite modification sur le réseau en disant, ben voilà, on ne va plus passer par là, ça à l'air tout moisi, il y a des trous dans la route, on ne va pas aller là. Mais ce n'est pas une opération d'une très grande envergure. Il y a quelqu'un qui a constaté que, ils en ont parlé à trois ou quatre qui avaient vu la même panne sur des mailing listes d'admin sys; une fois qu'ils ont compris à peu près ce qui se passait, ils ont rapidement contacté les gens qui gèrent les serveurs racine en leur disant, dîtes donc c'est le bordel et je crois que en moins de deux jours c'était réglé. Donc c'est quelque part un incident relativement mineur. Mais c'est intéressant à comprendre. C'est à dire que même quand quelqu'un décide de trafiquer le serveur racine, ça se voit et il y aura forcément quelqu'un d'autres sur la planète pour s'en rendre compte. Ça fait peut-être des années que la Chine fait ça. Simplement l'évolution du réseau faisait que avant il y a que la trafic chinois qui passait par là, et après il y a eu un peu plus que le trafic chinois.
1:26:00
Question : Bonjour, on a parlé du 15ème siècle, quand on regarde la révolution qui est venu de Gutemberg imprimerie, on peut regarder que voilà, il y a beaucoup de gens qui ont fait des demandes, on a envie de lire Galilée, on a envie de lire Copernic, et ça a donné une sorte de motivation pour avoir une presse assez libre pour laquelle on a fait des choses plus tard. Alors question , comme il y a 90% des gens qui sont bien content avec MSN, avec XMPP, comment on peut les motiver pour que ils peuvent faire une demande pour un internet libre ?
Benjamin Bayart : Alors ça c'est une bonne question. Comment est ce qu'on fait comprendre aux gens qui utilisent essentiellement du minitel, que en vrai si ils le savaient ils auraient envie d'utiliser internet ? Ça revient à ça. Ben, je connais pas la réponse, sinon je m'en seras déjà servi de la recette magique. Moi j'ai trouvé des éléments de réponse qui sont d'essayer d'expliquer la différence qu'il y a entre les deux, j'ai trouvé d'autres éléments de réponse, qui sont que même les gens à qui je n'ai pas expliqué la différence entre les deux au bout d'un certain temps, ils finissent par en avoir ras le bol de tel ou tel détail, du service unique complètement centralisé, et qu'ils ont envie de modifier. Donc en général, c'est l'envie de diversité qui prime, c'est les gens qui se rendent compte qu'on ne respecte pas leur vie privée, c'est 1000 raisons, l'anti-américanisme de base, très pratique aussi. Il n'y a pas besoin d'expliquer très longtemps au gouvernement iranien, pourquoi c'est dangereux le mail centralisé aux Etats-Unis. Eux, ils voient bien, nickel, ils comprennent bien aussi l'intérêt de l'internet centralisé où on peut tout filtrer, çà aussi, donc ils ont bien compris les deux enjeux. Il y en a un ils l'appliquent à l'envers mais, ils ont bien compris les deux enjeux clés. Donc voilà, il y a, il n'y a pas de méthode toute simple. Si je reprenais un aphorisme que j'ai l'habitude d'entendre chanté par Georges Moustaki, je dirais que MSN fut une aide et maintenant MSN est l'entrave. Faire découvrir le numérique aux gens, c'est bien, une fois qu'ils l'ont découvert et qu'ils auront envie de réseau, ils viendront assez spontanément à un réseau libre. Parce que c'est plus pratique et parce que ça permet beaucoup plus de choses. Il faut juste qu'on arrive à garder internet libre suffisamment longtemps pour que la majorité des gens comprennent. Et pour le moment, le bébé se présente plutôt bien. Sur les points de centralisation des applications on n'a pas évolué d'un cheveu, ça tend même plutôt à empirer, par contre on a marqué des points politiquement en Europe, où les politiques quelque soit le mot qu'on met derrière, c'est à dire aussi bien les autorités de régulation que les hommes politiques parlementaires etc, commencent à percevoir qu'il y a un enjeu sérieux et qui n'est pas qu'un enjeu économique. Et quand bien même ce serait un enjeu économique, quand on leur dit tout centralisé, ça veut dire tout centralisé aux Etats-Unis, il y a une petite lumière qui fait tilt, qui fait ah tiens, et si on voulait tout centraliser chez nous, et bien on ne peut pas. Qu'ils en viennent à , alors faudra que ce soit ouvert alors. Et ils n'ont pas complètement pas fait exprès.
1:29:50
Question : Qu'est-ce qu'on peut penser des solutions qui passent par un réseau, pour éviter la centralisation, qui passe par un réseau qui passe par la couche applicative en fait comme Freenet ou un truc que j'ai vu récemment, Toredo, c'est à dire encapsuler un réseau au dessus du réseau internet pour avoir une véritable décentralisation ? Est ce que c'est souhaitable et est ce que c'est possible techniquement compte tenu des limites d'infrastructure l'asymétrie du réseau etc ?
Benjamin Bayart : Alors pour moi, comment dire, c'est tous les mécanismes de darknet des choses comme ça, qui sont en fait des couches applicatives qui sur le principe du peer-to-peer plus en rajoutant une bonne dose de chiffrement et de mélange des données qui fait que vous ne savez jamais ni ce que vous stocker ni ce que vous transportez. Vous transportez au moins ce que vous avez demandé mais aussi n'importe quoi que n'importe qui d'autre a demandé sans que vous sachiez ce que c'est. C'est le principe de ces réseaux là. Ce sont essentiellement des outils de résistants. C'est à dire que ça n'a pas d'intérêts en terme de fonction, ça ne rend pas de service particulier sauf celui d'être discret. Donc c'est essentiellement un outil intéressant quand on veut rentrer en résistance. C'est important qu'il existe des outils de résistance, c'est ce qui permet de résister à l'oppression; ce qui est un des droits de l'homme. Je le rappelle. Donc il est fondamental qu'il existe des outils permettant de résister à l'oppression. Je considérerais à titre personnel que si le seul moyen d'avoir accès à du réseau à peu près propre c'est de faire comme ça; on a un vrai problème beaucoup plus grave que simplement de réseau. Ça voudrait dire qu'on est sur un modèle de société où pour vivre de manière raisonnablement normale, on est obligé de rentrer en résistance, des faux papiers, des faux noms, etc... Objectivement, aujourd'hui c'est pas trop le cas. Je viens quand même dire du mal de plein de monde sous mon vrai nom, il y a peut-être des gens des RG dans la salle mais je pense ils ne sont pas venu armé, et normalement je devrais ressortir en vie. Ça se passe plutôt gentiment. Quand je serais connu sous le nom de Colonel Moutarde et plus Benjamin Bayart, c'est qu'il y aura un vrai problème inquiétant. Oui c'est pratique. C'est à dire si jamais le truc se mettait mais à déconner complètement à fond qu'on finisse sur un réseau tout moisi, qui sert uniquement à diffuser du Disney payant et puis rien d'autres, et bie, il y aura des darknet. Clair, il y aura des darknet. Mais c'est une forme d'échec assez extrême quand même, pour le moment on n'en prend pas complètement le chemin.
1:32:42
Question : Bonjour, vous nous avez parlé de la partie technique qui permet la décentralisation, mais cette partie technique elle ne serait pas possible si il n'y avait pas une partie légale derrière dans le sens où si je peux mettre, si je peux utiliser le protocole mail c'est parce que les personnes qui l'ont créé, m'autorisent à l'utiliser ?
Benjamin Bayart : Oui, oui il y a un aspect légal la dedans, basiquement, ça c'est dans la génétique d'internet. C'est une des contraintes imposées quand on veut proposer une norme sur internet. Faut savoir que les normes sur internet s'écrivent sous forme de RFC; je ne sais pas si vous soyez ce que c'est. Une RFC, Request For Comment, c'est en fait une demande de commentaires. On écrit un article qui dit voilà, je propose que on dirait que pour transporter du courrier on ferait comme ça. Et qui qu'est pas d'accord et qui qui trouve que c'est de la merde. Puis je publie ça. Puis je reçois des commentaires, on corrige on améliore, on machin puis on publie une deuxième version, jusqu'à ce qu'on soit à peu près d'accord sur e fait que ça ça a pas l'air idiot. Pour qu'une RFC soit publié, il doit y avoir accompagnant la RFC un programme dont les sources sont disponibles et sont librement utilisables, qui implémentent la RFC. Donc par définition, structurellement, les normes qui font internet, quand elles font des normes ce qui n'est pas le cas de MSN par exemple, sont libres et ouvertes. Et il existe avant même que la norme se diffuse, une implémentation librement utilisable. Donc normalement, quand une norme est proposée, le programme permettant de la réaliser est fourni spontanément à tout le monde. Après on s'en sert, on s'en sert pas, c'est une autre question, mais normalement le programme qui traite ça est fourni. Donc la question légale existe, mais il faut comprendre qu'elle est en train de rentrer dans le monde du réseau par l'autre bout. C'est à dire le réseau était entièrement ouvert et on est en train de chercher comment avec des petits bouts de lois, on pourrait le fermer pour le transformer en un truc tout opaque. C'est pas du tout comme dans le monde du logiciel où on fonctionne en sens inverse. Le logiciel était quasi exclusivement fermé, depuis qu'il se vendait, avant on ne vendait que du matériel, on ne se posait pas la question de vendre du logiciel. Depuis qu'il se vend du logiciel, il est quasi exclusivement fermé, et donc on cherche comment ressortir de ça, comment fissurer le machin. Le monde du réseau, la question se pose dans l'autre sens. C'est à dire ça fait une petit décennie que pas mal d'entreprises cherchent comment on peut fermer le réseau, plutôt que comment on peut l'ouvrir.
1:35:48
Question : Bonjour, pour rejoindre la question de Monsieur tout à l'heure, plutôt que comment, je dirais, est-ce que c'est réellement possible de faire prendre conscience aux gens de la centralisation du réseau, et j'ai pas l'impression que la courbe de progression dont on parlait tout à l'heure, soit équivalente chez tout le monde ?
Benjamin Bayart : Ben non, j'ai un secret à te confier, il y a une très faible minorité de la population qui arrivent à faire Polytechnique; donc effectivement, la courbe de progression de l'apprentissage n'est pas la même.
Question : Plus que ça, je pense qu'il y a un côté, le fait de s'y intéresser, et je n'ai pas non plus l'impression qu'il y a vraiment réellement beaucoup de gens, qui soient très envieux de leur vie privée en fait.
Benjamin Bayart : Ben, ça va venir. Ça va venir.
Question : Donc c'est possible ?
Benjamin Bayart : Ah oui, oui oui oui, ça fait pas un pli. Ça fait pas un pli. Ça va venir, et ça va venir de plus en plus. Simplement parce que les atteintes à la vie privée qui en ce moment sont relativement raisonnables, vont petit à petit atteindre des seuils qui ne sont pas acceptables; qui sont vraiment envahissants, et qui créent vraiment des difficultés. Il faut simplement attendre soit que les gens réfléchissent un petit peu à ce qu'ils font, et se disent, ben je vais arrêter de le faire comme ça; soit tout simplement que des abus aient lieu, et il y aura bien les deux. C'est à dire ce seront les abus qui feront prendre conscience, il y a vraiment les deux phénomènes. Il y a les gens qui apprennent par la phase théorique, à qui on explique, regarde c'est tout centralisé, tu ne peux pas laisser ton courrier n'importe où; et qui font ah oui tiens c'est évident, et qui décident de ranger leur courrier , et puis il y a les gens qui découvrent ça le jour où ils vont se le prendre dans la tête. Je pense en particulier à tous ces gens qui avaient le plus benoitement du monde laissé tout leur courrier chez Google, jusqu'au jour où Google a sorti Google buzz et donc ils se sont retrouvés à publier tout leur annuaire, publiquement à peu près sur internet ce qui donnait des mélanges tout à fait délicieux, tu te retrouvais à envoyer les adresses mails de tes maitresses à ton patron, enfin ce genre de truc, un délire absolument total. Il y a beaucoup de gens qui ont compris que ça posait problème de laisser son carnet d'adresse chez quelqu'un qui n'est pas soi. Et qui n'auraient pas compris sans ça. C'est très pédagogique, la claque.
1:38:20
Alors si je me souviens du timing de la semaine dernière, dans à peu près 10 minutes les appariteurs nous mettent dehors, c'est ça ?
Question : Bonsoir, vous parlez bien des questions techniques, vous parlez bien des questions individuelles, vous parlez très bien de l'interaction entre la technique et l'individu donc avec les processus d'apprentissage etc... mais je ne vois pas du tout où apparaissent les processus sociaux ? Or donc je prends un exemple, je crois qui est à peu près pratique, juste avant de venir ici, je lisais sur ??? Flash doc ??? que le noyau et développement de Linux attire de moins en moins de développeurs. Donc si je ne me trompe pas, ça signifie que il y a un risque que parce que personne ne s'intéressait au processus sociaux qui construise le réseau d'open source , il y a quand même un risque d'ici une dizaine d'année, le noyau de Linux, le kernel quoi, s'effondre sous son propre poids, et que finalement il n'y ait plus de Linux tout simplement parce que personne ne s'est intéressé aux questions sociales. Donc dans l'analogie, ça me paraît bizarre que dans toute votre démarche je ne vois pas du tout apparaître de réflexions, en tout cas dans les réponses que vous avez donné à Monsieur ou à Monsieur sur le fait que la société n'est pas une somme d'individus ?
Benjamin Bayart : Alors ça c'est une des grandes différences, le monde du logiciel libre a besoin de créer des rapports sociaux pour exister. C'est très peu le cas sur internet. Internet ce ne sont que des rapports sociaux. Je suis absolument formel, il y a deux usages d'internet, il y a la masturbation solitaire, ou les rapports sociaux. Et c'est à peu près tout. Comme il y en a un des deux qui fatigue à la longue, il y a essentiellement des rapports sociaux. Cette masturbation pouvant être intellectuelle évidemment. Venir jouer au sudoku sur le site de Netvibes par exemple, ça rentre bien dans cette catégorie là. C'est juste un usage relativement marginal. Donc le réseau crée du lien social, toujours, tout le temps forcément, par nature. Il crée de l'échange entre les personnes. Ce qu'il crée comme lien, je ne sais pas le caractériser, je suis un très mauvais sociologue, je sais moi que tous les gens que j'ai vu utiliser du réseau, tous, créent plus de lien dans le réseau que par n'importe quel autre moyen. Les plus asociaux, les plus renfermés, les plus pathologiques, incapable de dire bonjour à qui que ce soit d'autre que leur mère dans la vie de tous les jours, sont capables de devenir bavard avec un clavier et un écran. Voilà. Moi qui était le torturé de l'équipe de foot à l'école parce que j'ai horreur des sports collectifs, voilà, je n'accepte de parler aux gens que depuis que j'ai eu droit de le faire sans jouer à la baballe. Voilà, le réseau crée du lien. Et il en crée beaucoup. Donc je me pose assez peu de questions dans le fait que on a besoins de s'intéresser au modèle sociologique pour que le réseau continue. Pour moi la question est dans l'autre sens. Aussi longtemps qu'il y a du réseau, il y aura des modèles de liens sociaux nouveaux qui apparaîtront, et donc pour moi la question est : « le réseau permettant de nouveaux liens sociaux, quelle sociologie en découle. Et on est bien d'accord, quand on modifie le réseau on modifie la sociologie qui va avec. C'est à dire qu'il ne découle pas du tout la même sociologie du minitel que de l'internet. Elles sont radicalement différentes. La sociologie de 3615 ULA n'a rien avoir avec ce qu'est internet et internet n'ayant lui même pas grand chose à voir avec Facebook. Et à choisir pour le moment entre 3615 et Facebook, j'ai une petite préférence pour Facebook, de pas grand chose. Peut-être parce que il y en un des deux en couleur. Ça s'arrête à ça. Ceci dit, il y a des vrais problèmes dans le monde du libre et là comme ça en analyse de bistrot en 30 secondes sur le noyau Linux, le fait que maintenant le noyau soit énormément porté par des grands groupes et donc défende les enjeux industriels des grands groupes et non plus ce qui amuse les développeurs, fait partie à mon avis des points clé. C'est à dire que moi si c'est pas fun, je vais arrêter de le faire tout de suite, sauf si je suis payé pour, mais ce n'est pas la même chose.
Question : Donc dernière question rapide apparemment. On parlait tout à l'heure de la différence entre MSN et XMPP où MSN est centralisé et XMPP est un système réparti, pourquoi aujourd'hui on n'a pas des applications de ce type là qui sont des équivalents de Facebook qui auraient pu être créée par la communauté ou par des gens chacun de son côté, ou un système commun qui aurait permis justement de mettre en communauté leurs informations, par un système réparti, et pourquoi on s'est orienté vers ce qui est Facebook aujourd'hui.
Benjamin Bayard : Je ne sais pas. Je ne suis pas développeur. Enfin si je suis développeur dans mon métier, mais je ne suis pas là en tant que développeur. Mon patron ne me paye pas pour développer quelque chose qui viendrait exploser le modèle économique de Facebook. La réponse parfaitement modeste est de dire parce que je ne m'y suis pas encore intéressé, une autre un petit peu plus réaliste est de dire que basiquement parce que les gens de Facebook n'ont pas fait leur boulot. Normalement quand on est un ingénieur consciencieux et qu'on réfléchit à développer une application qu'on veut faire tourner sur le réseau, on se dit tiens je vais rendre tel service, alors on se monte un petit proto comme ça pour jouer entre copains et on dit tiens c'est rigolo, ça a l'air de marcher. Normalement l'étape immédiatement après c'est bon, mon petit service dans mon petit coin, il va très vite faire goulot d'étranglement; soit j'achète des milliers de machines, des millions de machines pour le faire tourner, soit j'apprends à la faire tourner en tirant parti de la puissance de feu du réseau et donc en le rendant acentré. Et j'insiste bien acentré, pas décentralisé. C'est à dire ce n'est pas un système central qu'on essaye à tout crin de distribuer, mais un système qui n'a pas de centre. Bien différent. Le DNS est un système décentralisé, le web est un système acentré. Très différent. Et donc normalement quand on fait ce boulot là, je crois que les premiers à avoir fait de la messagerie, juste ils s'expédiaient des fichiers qu'on transférait et puis ils se sont mis à mettre un tout petit peu de structure autour, etc. avant d'en venir à dire on va faire un protocole de messagerie qui permette de transporter du mail de n'importe où à n'importe où sans aucun centre névralgique. Ben de la même manière, les gens de Facebook, n'ont pas fini leur boulot. Si ils avaient fini leur boulot, on aurait la proposition d'un certain nombre de normes d'interconnexion entre des milliers de micro Facebook, chacun hébergeant son petit contenu à lui et pouvant le mettre en relation avec le petit contenu des autres. Et ils n'ont aucun intérêt à le faire. Je veux dire leur seul modèle économique c'est le fait que tu leur a confié toutes tes données, sinon si tu les reprends chez toi, ils sont mort. Donc aux ils n'ont aucun intérêt à le faire. Est-ce que la communauté finira par développer un service sensiblement équivalent, probablement. Moi pour le moment, je n'en ai pas vu émerger un qui marche. Mais ça devrait venir.
Question : Mais le système des portfolios, je crois ? Qui est en train d'apparaître ?
Benjamin Bayart : Pas la moindre idée, alors là pour le coup pas la oindre idée. Identica ça n'a rien à voir, c'est un concurrent de twitter. GNU social, rien que le nom veut dire que ça ne marchera pas (rires).
Organisateur : Bon il est 21 heures donc les appariteurs ne devraient pas tarder à nous chasser. Avant qu'on se quitte aujourd'hui je tiens à rappeler donc, que non pas la semaine prochaine mais le 4 mai à la même heure donc 19h15, mais en amphithéatre Caquot se tiendra donc la dernière partie, la conclusion de ce cycle de conférence sur l'internet, donc une partie entre guillemets plus politique. Et donc toutes les informations pour accéder à l'amphithéatre Caquot sont disponibles sur le site www.libertésnumériques.net ainsi qu'un plan. Et je vous rappelle enfin que les conférences sont enregistrées, donc on a pris un tout petit peu de retard sur lapublication de la première qui devrait être publiée dans les prochains jours, et dans la foulée donc cette conférence qui sera également publiée et enfin donc la dernière le 4 mai. Voilà. Je vous souhaite une très bonne soirée et donc au 4 mai pour la conclusion. (applaudissements).
Benjamin Bayart : un tout petit détail. Je ne sais pas du tout encore comment sera structuré ce que je vais vous dire le 4 mai. Une des pistes c'est que je ne serai peut-être pas tout seul à vous en parler . Voilà, juste faire un peu de teasing, je ne sais pas encore qui et je ne sais pas encore pour dire quoi, peut-être des politiques, peut-être d'autres dirigeants associatifs; je sais pas.