TECHNOlogos 5èmes Assises des 15 et 16 septembre 2017 : "La numérisation de l'éducation"

Les datacenters ou les coulisses du numérique :
renouveau pédagogique ou expropriation politique ?

Par Guillaume Carnino

Retranscription

 

Souvent, il y a des discours sur le numérique dans l’éducation qui me semble un peu ronronnant, qu’il s’agisse de l’enseignement dans le primaire, le secondaire ou le supérieur. Le numérique serait une opportunité de démocratisation - de quoi, de qui - le risque principal concernerait les données personnelles – pourquoi et comment l’encadrer. Cela pourrait constituer une enquête en tant que tel, de recenser, d’interroger ce type de discours et faire l’objet de recherches. A partir d’une enquête conjointe avec Clément Marquet qui est sociologue des techniques, c’est d’aller aussi près que possible des infrastructures, ce qui permet l’avènement du numérique, y compris les smartphones, avec l’idée d’être assez généreux avec ces objets et ses dispositifs matériels, de les laisser parler. On entend beaucoup de bruit quand on va dans un Datacenter, la climatisation, les valves, ... On veut montrer les effets de système de ces agencements technologiques. Notre enquête est une ethnographie : on se contente de visiter les lieux, de prendre des photos dans cet univers hyper sécurisé, de travailler sur la documentation, de participer aux salons du milieu des Datacenter permettant d’interviewer des professionnels et de suivre des conférences, de rencontrer des techniciens qui font la maintenance afin de connaître leur métier et comprendre ce qui s’y passe. L’ambition de l’étude c’est de comprendre ce qui se joue dans cette face complètement immergée de l’iceberg numérique que sont les Datacenter. On voit quotidiennement en bout de chaine des écrans, des smartphones ou tablettes, mais rarement l’autre extrémité. Il y a rarement un article questionnant les dépenses énergétiques ou écologiques du numérique. Je ne ferai pas de distinguo entre les Datacenter qui sont rattachés à l’éducation – par exemple universitaire - et ceux du privé dits de colocation qui vendent de l’espace à des opérateurs qui sont prêt à les louer. Les logiques sont tout le temps les mêmes et lorsqu’on les visite on a du mal à faire la différence entre un Datacenter « éducatif » et « commercial ».

Pourquoi un Datacenter

La fonction d’un Datacenter est simple. Lorsque vous visualisez un fichier pdf un peu long qui est sur une machine, vous voyez la jauge de défilement, et cela n’avance pas très vite. Quand on va faire une recherche sur la totalité du web avec un moteur comme Google, cela va beaucoup plus vite. Ce n’est pas de la magie. Car lorsque que l’on fait la recherche d’un fichier, on a un ordinateur et Google a entre un et deux millions de serveurs répartis dans des Datacenter sur toute la planète. Des serveurs « métacrawler » indexent en permanence le contenu du web ; l’information du web est quasiment dédoublée. Quand on fait une recherche, la requête est découpée. Et les résultats de ces recherches découpées, qui sont déjà en mémoire dans les serveurs, sont concaténés et affichés rapidement. Ce qui rend possible l’usage du numérique avec le moteur de recherche le plus connu au monde, c’est la possibilité de disposer de ces gigantesques infrastructures que sont les Datacenter.

Un Datacenter est un bâtiment assez grand, souvent le fruit d’une reconversion industrielle – comme celui d’Aubervilliers qui était un centre de tri et de production industrielle. Sur le plan légal, on ne sait pas bien qualifier ces bâtiments : s’agit-il de tertiaire car il y a de la bureautique ? Comme ce sont des bâtiments avec des hauteurs importantes de plafond, ayant des structures très résistantes, comment les catégoriser, quelle taxe leur appliquer ?

On va donc mutualiser ce qui est nécessaire au bon fonctionnement de  l’ensemble des serveurs. Et le tout en mutualisant les services indispensables à une machine permet de ne pas trop les multiplier. Les questions énergétiques sont cruciales pour un Datacenter, le refroidissement et la climatisation, la sécurité des données. La gestion de la clientèle qui est gérée par un seul bureau. Et on retrouve des questions typiques de l’histoire industrielle. Si vous élevez un cochon vous aurez à vous poser la question de ses rejets, mais si vous en élevez 10 000, cela va devenir un problème environnemental et écologique, que faire du lisier de porc ? C’est exactement la même chose pour un Datacenter. Quand vous posez votre ordinateur portable sur vos genoux, l’hiver cela tient un peu chaud. Si vous en mettez 10 000, la question de la climatisation devient environnementale. Si la climatisation s’arrête dans un Datacenter, la température monte à 80 degrés en 10 minutes. Les machines n’étant pas conçues pour cela, vont tomber en panne, entraînant des dégâts matériels, des risques d’incendie et d’atteinte aux personnes. Pour limiter les risques deux systèmes de capteurs sont en place pour vérifier la température des machines en permanence avec des pondérations statistiques. Un système incendie à base de gaz inerte pour faire baisser le taux d’oxygène, est en place avec des valves sur les parois pour limiter la surpression en cas de déclenchement.

La sécurité de service

La logique qui aboutit à la concentration dans les Datacenter existe depuis les années 70. Par exemple, dans le milieu de la banque on retrouve rapidement le besoin de mutualiser les solutions techniques. Et Pierre Ménicu qui a travaillé sur l’histoire de PNB-Paribas, montre que le mouvement de grèves très dures en 74-77 a abouti à la mise en place de Datacenter pour une raison simple : il faut arriver à juguler la possibilité d’une grève thrombose. Avant on avait des centres de traitement de l’information qui géraient toutes les données de chaque banque ; avec les différents personnels qui se côtoyaient un mécontentement pouvait se transformer en grève entrainant un arrêt total. Pour juguler ce risque, on crée des centres de données qui vont répartir les centres de calcul à l’échelle du territoire français. C’est une logique plutôt politique qui va aboutir à la mise en place des premiers Datacenter devant fonctionner avec le moins d’humains possible. Le plus grand en Chine fait 3 millions de mètre carré, et les plus petits appelés edge-datacenter - donnant par leur appellation l’impression d’être à la pointe. Un Datacenter valorisé plusieurs millions d’euro fonctionne avec une dizaine d’humains sur site. Cela peut monter jusqu’à 50 personnes avec généralement des contrats temporaires pour les trois quarts avec l’idée de ne pas concentrer des moyens humains  sur place. La création d’un Datacenter répond surtout à une logique industrielle de sécurisation. Le business premier de ce type de structure, c’est de vendre de la sécurité à tous les niveaux, ce qui relève d’une logique technique assez « propre ». C’est ce qui est souvent revenu lors des entretiens avec les personnes dirigeantes. Par exemple dans une université l’objectif était d’arriver à la création d’un Datacenter universitaire, car sur le campus la logique de concentration avait atteint sa limite. Plusieurs fois lors de grèves étudiantes, le risque d’endommagement a été élevé : par exemple la destruction de portes avec une masse proche de la salle informatique. A mesure que les moyens informatiques se concentrent et que le volume de données augmente, la nécessité de les sécuriser s’intensifie. Sur les campus, pour la recherche où il y a des plus en plus de calculs, la gestion administrative des étudiants et des personnels, les plateformes éducatives, MOOC, …, le Datacenter a pour but de gérer tout cela et de garantir un bon fonctionnement.

Un Datacenter se vend et est classé par niveau de service ou TEAR couche de 1 pour le plus bas niveau – un ordinateur et un ventilateur – jusqu’à 4. A chaque niveau correspond une garantie de sécurité et de fonctionnement en temps à l’année : pour un TIR 4 il est garanti 99,998 % de fonctionnement sur une année. Dans les faits ils ne tombent pas en panne, mais contractuellement ils garantissent un taux.

Présentation de l’image d’un Datacenter universitaire, appelé boite noire, ayant l’apparence d’un bloc foncé avec quelques fenêtres pour des bureaux au premier étage, le rez-de-chaussée et le sous-sol derrière des murs épais pour sécuriser au maximum ; aucune signalétique à l’extérieur et pas de numéro de rue sur le bâtiment. Tous les accès et passages fonctionnement avec des badges, avec des scanners circulaires, des sur-chaussures pour limiter les risques de saleté, des contrôles d’ouverture de chaque porte d’accès.

Le discours sur la sécurisation porte sur le fait de faire disparaître l’humain. Avec l’idée que toute faute étant humaine – véhiculée lors d’entretiens avec des commerciaux – il faut donc faire disparaître ce facteur. Et pourtant c’est un grand classique de la psychologie du travail - la différence entre travail réel et prescrit - ; on s’aperçoit lors des visites que c’est généralement l’humain qui fait que cela ne plante pas là où les infrastructures techniques finiraient par tomber en panne. Un superviseur de la sécurité nous expliquait tous les mécanismes qu’il a mis en place autour de l’armoire à clé : en plus de son badge, il faut une clé pour ouvrir cette armoire, et pour obtenir cette clé il faut un badge et un code permettant de savoir qui a ouvert cette armoire et d’être en mesure de contrôler tout ce qui se passe. Ces données de contrôle sont conservées trente jours. Après cette déclaration d’inviolabilité du système, et n’ayant pas son badge et son téléphone portable sur lui, et n’ayant pas d’autorisation il prend une clé. Et dit "cela a dû lancer une alarme ; je verrai à l’annuler plus tard". On voit très concrètement que si ces choses-là fonctionnent, c’est qu’il y a un à côté à ces grandes logiques technologiques où l’humain va jouer avec ses marges pour les faire fonctionner. Une directrice de centre me disait que "si j’appliquais toutes les consignes du ministère plus personne ne bosse". L’humain est indispensable et les Datacenter vendent des services de « presse bouton ». Si un client distant a « des serveurs de planté » une prestation sera facturée pour qu’un technicien appui sur le bouton d’alimentation pour les réinitialiser.

Sécurité énergétique

Sécuriser les serveurs, c’est aussi sur le plan énergétique et c’est crucial. En règle générale, les Datacenter réservent le double de la puissance électrique nécessaire pour fonctionner. Pour celui d’Aubervilliers, cela entraîne de saturer les postes sources – chacun coûtant plusieurs millions d’euros – et consomme plus que tous les habitants de la municipalité. Des collectifs de personnes se sont créés pour discuter et critiquer cette situation. Malgré ces précautions, il y a toujours un risque pour que l’alimentation électrique externe tombe en panne. On a donc mis en place des groupes électrogènes – des machines qui atteignent plus de 10 mètres de long avec de gros moteurs thermiques. Ces groupes sont associés avec des cuves de fuel immenses, de la taille de cet amphithéâtre de 250 personnes et visant une autonomie de 72 heures. Les contrats de fourniture du carburant sont de niveau hospitalier ou militaire, c’est-à-dire que s’il y avait des grèves qui neutralisaient les centres de distribution, les Datacenter sont des infrastructures prioritaires pour l’alimentation en fuel. Même si les groupes électrogènes sont préchauffés en permanence, ils sont longs à se mettre en route de l’ordre de quelques secondes. Ce temps est incompatible avec le bon fonctionnement d’un Datacenter. On a donc des onduleurs, des machines supplémentaires, qui garantissent ces quelques secondes avant que les groupes électrogènes prennent le relais et qui vont tout le temps lisser les variations de tension de l’alimentation électrique externe ou de secours. Un onduleur fonctionne sur des batteries pour stocker cette énergie nécessaire pendant quelques secondes. En règle générale un onduleur alimente trois à quatre serveurs avec des batteries au plomb d’une durée de vie 4 à 5 ans - la technologie au lithium étant peut-être mise en place dans quelques années. Au dire des commerciaux des Datacenter, les batteries au bout des 4 ans étaient reprises par les sous-traitants. Et se pose le problème du recyclage : parfois au Nigeria, dans des décharges où on brule à ciel ouvert les composants pour récupérer du cuivre !

La logique d'un Datacenter

On voit bien que la logique industrielle rencontre un certain nombre de préoccupations y compris environnementales. Un institut considérait que si Internet était un pays, il serait le 6ème pays pollueur au monde, dépassant déjà l’aviation en termes de consommation énergétique, de rejet de CO2 et de pollution, sachant que ce réseau continue à croître. A l’intérieur du numérique il y a des secteurs différents, comme le logiciel. Et le secteur des Datacenter est le seul depuis ces 20 dernières années qui continue sans interruption à croître. Ce qui implique un accroissement massif de ses pollutions.

Dans le domaine du numérique éducatif, on a exactement les mêmes problématiques et le même fonctionnement : comment réussir à industrialiser une activité tertiaire ? Au fur et à mesure que le numérique est mobilisé au sein des campus, le problème est de plus en plus crucial. Des administrateurs système des « edgedatacenter » - qui sont de petits Datacenter -, racontaient leur nécessité de « passage à l’échelle », s’échangeant des meilleurs pratiques comme "comment organiser au mieux une salle avec des allées froides et des allées chaudes, pour que la climatisation soit optimisée afin de réduire les coûts".

Présentation d’un Datacenter avec une allée chaude au centre et allée froide à l’extérieur. On répartit les machines de telle manière que vous allez concentrer dans une allée chaude qui est fermée, toutes les sorties des ventilateurs de tous les serveurs et vous climatisez uniquement à cet endroit-là. Et en entrée on l’air froid qui est dans le restant de la pièce.

Un terme est souvent employé IAAS ou infrastructure en tant que service, soulignant le fait que l’on est dans l’industrialisation du tertiaire. Une infrastructure doit être un service.

Cette concentration est similaire quels que soient les usages que l’on prétend obtenir d’un Datacenter. Dans un Datacenter universitaire, le responsable réseau nous avouait qu’il était dans une pure problématique d’optimisation et de commercialisation de son infrastructure. Celle-ci ayant été financée sur deniers publics, mais fonctionnant ensuite dans un contexte de budget serré, il s’interrogeait sur la manière de la rentabiliser. Il avait un espace non utilisé : un Datacenter étant construit pour faire face à l’accroissement exponentiel de son utilisation, est donc trop grand au départ. Il avait envie de se transformer en Datacenter commercial, faire en colocation, mais que sur le plan juridique ce n’était pas la mission de l’université. On voit bien que l’on est dans une logique de concentration industrielle et d’infrastructures technologiques, et que l’on est bien dans le début d’une mise sur le marché. C’est quelque chose de classique dans l’histoire des techniques : concentrer des infrastructures ce n’est pas seulement sur le plan technique mais aussi économique. L’histoire de l’industrialisation capitaliste est le fait d’une mise en place d’infrastructures concentrées et d’une concentration politique.

Pour information, le site Data4 (91) de plus de 80 hectares de terrain, où l’on construit des bâtiments au fur et à mesure pour réussir à répondre aux besoins. Chaque nouveau bâtiment recevant les dernières innovations technologiques pour être de plus « écologique ».

Propre un Datacenter ?

Dans le numérique l’utilisation du terme « cloud », du nuage, donne un sentiment d’immatériel et d’extérieur pour l’entreprise ou l’organisation qui l’utilise. Mais les Datacenter sont géographiquement localisés, car il y a des exigences de rapidité même si « cela va à la vitesse de l’électron » comme dans les applications financières, les jeux en réseau comme Candy Crush qui s’adapte en temps réel à l’activité de l’utilisateur. Ils se doivent de répondre à des millions de requêtes nécessitant des infrastructures qui soient localisées auprès des utilisateurs. C’est pour cela que l’on n’a pas que des Datacenter en Islande là où les coûts de climatisation ne sont pas très importants. Autour de Paris, avec la couronne 40 000 volts liée aux infrastructures électriques, on retrouve de très grandes quantités de Datacenter. On pourrait dire que le Datacenter est un moyen de rendre l’image d’Internet propre car on va externaliser complètement ce qui pourrait apparaitre détonnant avec l’image du numérique visant à purifier et rendre plus « écologique » un certain nombre de pratiques. Après une visite d’un Datacenter avec un groupe d’élèves, une des étudiantes en rentrant le soir avait eu extrêmement mauvaise conscience en allumant son ordinateur, car elle voyait maintenant que l’Internet ce n’était pas juste son écran face à elle. Par les Datacenter on dé-corrèle complètement la production de la possibilité d’avoir une telle quantité de données et d’extraction, de l’utilisation sur un écran de ses données. Un on a aussi un noeud typique de l’histoire industrielle, c’est la dé-corrélation progressive entre production et consommation. Dès 2003 deux sociologues Mathieu Amiech et Julien Mattern dans un ouvrage écrivent : "Dans l’histoire à mesure que le fossé entre production et consommation se creuse, les populations sont de moins en moins capables d’influer sur leur devenir politique » A mesure que les prothèses informatiques deviennent une extension constitutive de notre corps, de notre pensée de nos habitudes, les structures matérielles qui conditionnent notre rapport au monde sont de moins en moins susceptibles d’être questionnées. Ce que l’on défend avec Clément Marquet, c’est de combler ce gouffre qui existe entre production et consommation et montrer ce qu’il y a à voir dans ces lieux, que l’on a tendance à occulter. Il y a une accélération de séparation : d’une certaine manière le Datacenter accroît notre impuissance politique. A mesure que l’on concentre dans ces lieux des choses sur lesquelles on n’a plus prise, on est de moins en moins capable de pouvoir décider de quoi que ce soit sur ces questions-là. C’est ce qu’ont répondu les élus d’Aubervilliers face aux militantes qui militaient contre l’installation d’autres Datacenter, en leur disant : "Vous décidez, c’est soit le Datacenter, soit votre smartphone"