Incendie d'OVH, une illustration des risques de la concentration des infrastructures - Décryptualité du 22 mars 2021

De April MediaWiki


Titre : Décryptualité du 22 mars 2021 - Incendie d'OVH, une illustration des risques de la concentration des infrastructures

Intervenants : Mag - Manu - Luc

Lieu : April - Studio d'enregistrement

Date : 22 mars 2021

Durée : 15 min

Podcast

Décryptualité du 22 mars 2021 - Incendie d'OVH, une illustration des risques de la concentration des infrastructures

Revue de presse pour la semaine 11 de l'année 2021

Licence de la transcription : Verbatim

NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.

Description

L'incendie du datacenter d'OVH a fait parler de lui. L'occasion de rappeler que le risque zéro n'existe pas et que la concentration des structures informatiques est un risque à part entière.

Transcription

Luc : Décryptualité. Semaine 11. Salut Manu.

Manu : Salut Mag.

Mag : Salut Luc.

Luc : Pour cette semaine on est toujours à distance, on essaye des trucs un peu acrobatiques pour avoir un meilleur son. On espère que ça va marcher.

Manu : En tout cas je t’entends très bien. Tu es fort et clair dans mes oreilles. J’espère que l’enregistreur sera d’accord avec nous.

Luc : On s’enregistre chacun de son côté et ça devrait être mieux que la semaine dernière.
Mag, qu’est-ce qu’on a au sommaire ?

Mag : Cinq articles assez intéressants. On va commencer par celui de ouest-france.fr , « Gullivigne, l’informatique libre et innovante ».

Manu : Gullivigne, avec deux « l », c’est un groupe d’utilisateurs de logiciels libres dans la vigne. C’est toujours bien. Ouest-france est un gros journal, ça fait plaisir de voir ce genre d’association mise en avant dans un gros journal.

Mag : Manifestement, ils vont avoir de nouveaux locaux, donc dès qu’on sort du confinement on va tous aller les squatter.

Manu : Le raisin c’est bon, c’est pour ça.

Mag : Heidi.news , « Wikipédia veut faire passer les GAFAM à la caisse ».

Manu : Tu viens de rajouter le « M » au titre, donc GAFA, parce que c’est naturel, c’est un réflexe, je sais ! Effectivement, il est question de faire des systèmes d’entraide avec les grosses boîtes. Entraide, ça reste compliqué parce que ce n’est pas supposé être le business modèle de Wikipédia, mais effectivement il s’intéresse à faire des accords de travail, notamment avec les GAFAM qui utilisent déjà beaucoup Wikipédia et ne contribuent pas énormément ou, en tout cas, pas à la hauteur de ce qu’il faudrait.

Mag : Sûrement pas assez.

Luc : Il faut voir. C’est peut-être bien de ne pas avoir les GAFAM dans Wikipédia.

Manu : C’est un peu le problème !

Luc : Je ferais remarquer que c’est une mauvaise nouvelle.

Mag : tom's Hardware , « L'entreprise chinoise Loongson va lancer deux processeurs gravés en 12 nm cette année », par Rémi Bouvet

Manu : Une boîte qui fait des microprocesseurs, rien de bien nouveau, mais ça reste un petit peu étrange et toujours inquiétant parce que les Chinois, on n’a pas toujours confiance, simplement parce que c’est une guerre économique qui a lieu avec nous, les Occidentaux, donc ça peut poser des problématiques. Par ailleurs, ils sont plutôt libres, en fait, et dans le côté partage du savoir. On sait, on se souvient que notamment Richard Stallman utilise des ordinateurs dont les puces sont souvent fabriquées en Chine, en tout cas c’était les cas à une époque, je ne sais pas si c’est encore le cas aujourd’hui. Il avait plus confiance dans ces puces-là que dans les puces d’Intel qui avaient des petits trucs embarqués qui pouvaient permettre le piratage à distance.

Luc : Les puces d’Intel sont aussi construites en Chine, je suppose.

Manu : Pas toujours, à Taïwan, c’est souvent Taïwan qui produit pas mal.

Mag : Silicon, « Open Source : le top 10 des métiers en tension », par Ariane Beky.

Manu : Ça commence avec data scientist c’est très à la mode et effectivement il y en a toute une liste. Si vous voulez trouver du boulot en entreprise, voilà une bonne orientation pour commencer .

Mag : C’est-à-dire les métiers où il n’y a pas de chômage ?

Manu : Peu de chômage, surtout si on est un tant soit peu motivé.

Mag : Next INpact , « Le Conseil d'État refuse de suspendre le partenariat entre l'État et Doctolib », par Marc Rees.

Manu : Un sujet qu’on a abordé la semaine dernière. Les données de santé, les institutions, il y a beaucoup de choses qui sont partagées, qui nous embêtent bien. Le Conseil d’État a pris des décisions officielles là-dessus. Interhop, qui est une association montée pour un petit peu se bagarrer sur le sujet, a discuté de cette décision. Allez jeter un œil sur leur site, il y a des liens sur la revue de presse qui vous mèneront à ces textes-là.

Mag : Ce qui est dommage c’est que ce partenariat s’appuie surtout sur les services d’Amazon.

Manu : Oui, les GAFAM sont partout, on le sait !

Mag : De quoi parle-t-on ce soir, Luc ?

Luc : Des GAFAM.

Manu : Non.

Luc : On vous met le feu, c’est ça !

Manu : Oui, ce n’est pas mal.

Mag : Je me sens tout feu tout flamme.

Manu : On peut parler de cloud effectivement.

Luc : On parle de l’incendie d’OVH.

Mag : Les incendies.

Luc : les incendies, oui. On en a beaucoup parlé partout dans la presse la semaine dernière, chez les geeks notamment.
OVH est un hébergeur français qui fait du cloud, donc qui propose des serveurs pour que les entreprises, à droite à gauche, puissent héberger leurs serveurs et leurs activités. La semaine dernière il y a eu un spectaculaire incendie dans un de leurs datacenter du côté de Strasbourg, il a pris feu. Il y a eu plein de blagues comme quoi les données étaient enfin dans le cloud pour de vrai puisqu’elles sont parties en fumée.

[Magali pleure.]

Luc : Pourquoi pleures-tu, Magali ?

Manu : Nous avons une victime avec nous, interview sur le trottoir.

Mag : Effectivement. La boutique en ligne de ma librairie était manifestement chez OVH, donc pouf !, elle a été totalement inaccessible pendant une semaine.

Manu : Tu ne sais pas ce que tu veux, elle était bien dans le cloud, on l’a vue sur les images. Un magnifique feu, gigantesque, qui partait en une grande cheminée avec une fumée bien noire au-dessus. Voilà où était ta boutique.

Mag : Et les livres ça brûle bien, c’est connu !

Mag : Il semblerait que les octets aussi, ça ne brûle pas mal du tout !
Il y a eu plus de trois millions de sites, c’est un compte un petit peu à l’emporte-pièce parce que c’est compliqué de mesurer exactement, mais on considère qu’il y a eu plus de trois millions de sites qui ont été arrêtés à cause de cet incendie. Ils ont éteint complètement un des quatre datacenters qui étaient sur le lieu. Ils en ont éteint un deuxième parce qu’il a été touché, il a été impacté par le premier incendie. C’étaient les 2 et 1 au niveau des datacenters. Là, il y a un jour ou deux, le premier datacenter qui était en train de repartir, qui n’était pas touché par les flammes, a eu une grosse poussée de fumée lui aussi, de chaleur, donc ils l’ont arrêté à nouveau et ils ont considéré qu’ils ne le rallumeraient plus. Ils vont déplacer les baies de serveurs qui sont à l’intérieur, ils vont essayer de les migrer vers le quatrième je crois, de la même manière qu’ils essayent de récupérer les données qu’ils peuvent dans le deuxième. À priori, le deuxième a bien cramé, alors que le premier c’est juste qu’il y a eu un petit départ feu de rien du tout.

Luc : À priori c’est au niveau des batteries.

Manu : Oui. Pour le premier ce sont les onduleurs qui sont suspectés.

Luc : Un onduleur c’est un dispositif qui est censé garantir à la fois la stabilité du courant et un minimum de temps, en cas de panne électrique, pour que tout ne se coupe pas instantanément. C’est une sorte de batterie, de système de régulation, qui fait que l’infrastructure va tenir x minutes sans courant, ce qui laisse le temps de démarrer des groupes électrogènes si on a une grosse panne de courant.

Manu : Mag, ta boutique est revenue ?

Mag : Elle est revenue, oui.

Manu : Avec les mêmes données ou tu as perdu des choses ?

Mag : À priori avec les mêmes données, je n’ai rien perdu.

Manu : Parce que tu avais fait des backups régulièrement.

Mag : Parce que mon fournisseur fait des backups régulièrement. D’ailleurs je remercie la société ??? qui me fournit

Manu : Pas de publicité.

Mag : Oups ! Pardon, désolée !

Manu : Ce sont des ??? qui bossent pour les libraires de France.

Mag : Et qui sont très efficaces.

Manu : Pour le coup, effectivement. On ne sait pas s’ils ont fait des backups eux-mêmes ou s’ils ont été faits par le fournisseur. C’est quelque chose qui est toujours un petit peu compliqué, qui peut être proposé dans les solutions de cloud. OVH le fait. Ils font des solutions de backups, mais il semblerait qu’il y avait des clients qui étaient backupés sur le site, qui étaient même backupés dans le même datacenter et quand tout le datacenter brûle, ce qui n’arrive jamais, eh bien ils ont perdu leurs backups.

Luc : Ça n’arrive jamais ! Donc là, évidemment !
Un datacenter c’est sécurisé, ça ne flambe jamais, c’est redondé comme on dit. Il y a ce dont on parlait, les onduleurs, le groupe électrogène, il y a des extincteurs partout, normalement ce n’est pas censé prendre feu comme ça !

Manu : Non, pas dans celui-là en particulier. Je trouve qu’il avait un design un peu original, qui m’impressionne. C’était des containers assemblés entre eux autour d’un pôle central avec, je suppose, des escaliers, je n’ai pas regardé dedans, peut-être même des ascenseurs ou des monte-charges. Le but c’était d’avoir un refroidissement passif avec un effet cheminée qui allait absorber la chaleur des serveurs, qui est énorme, la monter dans cette cheminée de containers et faire en sorte que ça laspire à travers les containers qui n’étaient imperméabilisés. C’était quelque chose d’un peu innovant et pas très cher, donc intéressant, qui leur permettait de monter rapidement des datacenters, on empile, on empile, on empile.

Luc : J’imagine que l’effet cheminée, quand ça commence à cramer de partout, c’est super bon !

Mag : C’est clair qu’une cheminée c’est fait pour évacuer l’air du feu. Donc s’il n’y a plus de feu ça n’a aucun d’intérêt. S’ils font une cheminée c’est forcément parce qu’il va y avoir du feu en dessous !

Manu : Alors là, vraiment, c’est mauvais ce que tu dis, c’est mal !

Mag : Tu trouves que je me suis enflammée ?

Manu : Oui ! Honnêtement.

Luc : Au-delà de la moquerie qui nous amuse bien il y a quand même un intérêt dans cette histoire c’est de rappeler que le cloud ça reste les serveurs et l’ordinateur de quelqu’un d’autre. Magali en a fait l’expérience douloureuse. Ses données sont dans le cloud, en fait il y a effectivement une adresse physique avec des serveurs qui peuvent prendre feu ou qui peuvent avoir tout un tas d’autres problèmes. Effectivement, quand on concentre plein d’éléments au même endroit, le jour où ce truc-là tombe, ça pose problème.
Il n’y a pas si longtemps que ça, on avait eu un truc, pas avec un gros incendie : en décembre 2020, les DNS de Google se sont mis à planter, on en avait parlé dans le podcast.

Manu : Les DNS ce sont des répertoires d’adresses qui permettent de rediriger vers les bons sites web à partir de ce qu’on tape dans la barre d’adresse.

Luc : À l’époque il y a plein de sites et de services Google qui n’étaient plus accessibles, ce qui a empêché les gens de bosser, par exemple, mais également des objets connectés, notamment en domotique, qui ne pouvaient plus se connecter à l’Internet et qui en avaient besoin pour fonctionner. Des gens se sont trouvés coincés chez eux avec les volets qui ne pouvaient plus s’ouvrir, des choses comme ça.
Ça montre qu’à tout concentrer, finalement on crée des points de fragilité.

Manu : Le solutions, si on commence à en parler, c’est de redonder, c’est essentiel et puis solidifier un peu ce qu’on a comme datacenters. Mais même comme ça, on sait que ça va tomber à un moment donné.

Mag : Là, je pense qu’ils sont en train de jouer avec le feu !

Luc : Le truc c’est que même si on sécurise à mort, qu’on a des gens très compétents plus plein de matériel, plein de choses, etc., sur la totalité des équipements qu’il y a dans le monde, il y aura toujours un évènement problématique. Ça m’est arrivé au boulot. On avait tous nos serveurs dans un super service, haut de gamme, avec toutes les sécurités électriques, les ceci les cela, ça ne pouvait pas ne pas marcher. Et puis c’est arrivé ! Pendant trois jours tout s’est cassé la gueule et plus rien n’a marché. En dehors du monde de l’informatique, les centrales nucléaires, c’est rare, mais Fukushima est arrivé. Il y a toujours des situations exceptionnelles où les problèmes s’empilent les uns derrière les autres. C’est extrêmement improbable, mais, au fil des années et quand on multiplie les lieux, eh bien l’improbabilité finit pas arriver. C’est comme au loto, il y a quand même quelqu’un qui gagne chaque semaine ou presque.

Mag : Il n’y a pas de fumée sans feu, quoi !

Manu : Non, là ça ne marche plus, l’image est trop étirée. Non !
En tout cas, il faut s’assurer de pouvoir remonter derrière. Effectivement une panne, même si ça arrive très rarement, ça va arriver un jour et remonter derrière c’est avoir des backups, avoir des solutions de repli, ne pas dépendre d’un seul point de blocage qui est la chose qui va nous empêcher de travailler pendant des jours et des semaines. Non, Il faut multiplier, il faut décentraliser, donc penser aux chatons.

Luc : C’est un peu la logique d’Internet.

Manu : Oui, carrément. Internet a été fait pour survivre à une guerre nucléaire dans une certaine mesure. Ça a été imaginé à la fois par des universitaires et des militaires avec vraiment ce côté « pas de centre qui puisse être détruit et tout foutre en l’air ». Non. Il fallait quelque chose de décentré, a-centré, donc ça garantit comme ça beaucoup plus de solidité, de fiabilité au système, globalement.

Mag : Peut-être qu’il faut prévoir d’autres tests que les pannes de logiciels

Manu : Tu penses à des tests en particulier, des tests au feu, bien sûr, mais tu as d’autres tests en tête.

Mag : On avait parlé de singes ce week-end, de tests Chaos Monkey ou des choses comme ça, non ?

Luc : C’était un truc, pour le coup, purement informatique. Donc un fournisseur de services, qu’on ne nommera pas, débranche différents éléments de son infrastructure pour voir si ça marche encore et s’ils arrivent à s’en sortir. Ils ont une sorte d’échelonnage, de taille de singes, le gorille étant le plus puissant ce sont les trucs les plus problématiques. Ils ont un logiciel qui, de façon aléatoire, va débrancher des trucs, foutre le bordel dans l’infrastructure. On peut le faire informatiquement, mais c’est plus compliqué à faire avec les incendies. Mettre le feu de façon aléatoirement à ses datacenters, c’est problématique !

Manu : Sans aller jusque-là , la SNCF a aussi l’air de faire de choses. Ils ont transformé des tests en jeu.

Mag : Des journées entières de jeu où plusieurs équipes s’affrontent pour faire tomber les serveurs et créer plein de tests.

Manu : Ils ne font pas ça sur la production à la SNCF. Ils font ça sur une préproduction.

Mag : Tu es sûr ?

Manu : Oui, enfin j’espère !

Luc : Tu es un petit joueur !

Manu : Alors que le fournisseur dont je vous parlais qui fait les singes du chaos.

Mag : Il était de l’« l'armée simiesque » !

Manu : Ah oui ! L’armée des puces de singe. Il y a des bonnes idées derrière tout cas. Effectivement il n’y a pas 36 solutions. Pour s’assurer que les solutions de repli, les backups fonctionnent, il faut les tester. Donc il ne faut pas des backups qui sont dans un coin et qui vont prendre la poussière pendant des années. Non ! Il faut des backups qui tournent et qu’on utilise. Il n’y a pas moyen de faire autrement. Je me dis que c’est ce qu’il faut que je fasse avec mon informatique, mais que je ne fais pas forcément, malheureusement.

Mag : Après tous ces tests, on pourra donner le feu vert !

Luc : Ah ! Est-ce qu’on peut imaginer que ce genre d’évènement puisse être un acte malveillant ?
On n’a aucun élément ni soupçon qui irait dans ce sens-là, mais on sait, on en a parlé ces derniers mois, que des actes de malveillance, de désinformation, des attaques de déni de service, de piratage, etc., par des puissances étrangères, ça existe, c’est répandu. Est-ce qu’on peut imaginer que ce genre d’attaque plus brutal, de type « je mets le feu » soit possible ?

Manu : Bien sûr. Effectivement, ça reste compliqué, parce qu’on passe sur du physique. Les attaques qu’on voit d’habitude c’est plutôt du logiciel. Passer au physique ça a des implications, des conséquences plus difficiles à jauger. Mais oui, ça s’envisage. Stuxnet était bien une attaque logicielle qui a foutu en l’air des centrifugeuses à uranium. Il y avait un passage au physique très compliqué. C’était des procédés industriels très lourds et avec des gens hyper-compétents derrière. Oui, ça s’envisage, mais on n’a pas de preuves dans un sens ou dans l’autre.

Luc : Très bien. En tout cas ça nous démontre qu’Internet ça doit être réparti et que ce n’est pas juste pour la communication, c’est aussi une question de résilience, de logique. Que les démarches de type chaton, de « Dégoogliser Internet », lancées par Framasoft sont tout à fait pertinentes et qu’on doit garder à l’esprit que mettre tous ses œufs dans le même panier n’est pas une bonne idée.

Mag : Donc arrêter de jouer avec le feu ?

Luc : OK. Je propose qu’on brûle Mag et on se retrouve la semaine prochaine.

Manu : À la semaine prochaine.

Mag : Salut.