Comment la thésaurisation des données contribue-t-elle au gaspillage énergétique mondial ?

11-01-2021 | 5 lecture minimale | Archivage des données SAP, Gestion des données SAP

Les gouvernements du monde entier espèrent que les changements de comportement observés à la suite de la pandémie de Covid contribueront à lancer une reprise économique verte généralisée. Partout, les entreprises prennent leurs propres engagements optimistes. Les rapports de la Convention-cadre des Nations Unies sur les changements climatiques (CCNUCC) le confirment. Ils ont annoncé que les niveaux d’engagement pour atteindre zéro émission nette ont à peu près doublé en moins d’un an, 2040 étant un objectif commun pour zéro émission.

Environ 22 régions, 452 villes, 1 101 entreprises, 549 universités et 45 des plus grands investisseurs mondiaux font pression pour une reprise verte. Amazon en fait partie et diffuse désormais des publicités télévisées pour faire connaître ses objectifs sans carbone.

Une grande partie des discussions actuelles autour de la neutralité carbone se concentre principalement sur la réduction de la consommation de plastiques, la dépendance aux combustibles fossiles, l’adoption de techniques de production durables, l’amélioration de la biodégradabilité des matériaux d’emballage, etc. Celles-ci sont clairement très importantes, mais il en va de même pour la réduction des déchets d’émissions d’énergie associés aux centres de données – en particulier parmi les «industries de l’information» principalement basées sur les services. Selon Statista, il existe désormais plus de 8 millions de centres de données dans le monde et ils consomment de grandes quantités d’électricité, générant des émissions de carbone qui éclipsent l’industrie du transport aérien. Les industries du savoir ou de l’information n’ont peut-être pas les mêmes préoccupations évidentes en matière de durabilité que les fabricants et les détaillants, mais elles ne sont pas moins polluantes lorsqu’il s’agit de stocker leurs données.

La raison en est qu’une chose que presque toutes les organisations ont en commun est ce que Gartner décrit comme des « données obscures ». Il s’agit d’actifs d’information de mégadonnées qui sont collectés, traités et stockés dans le cadre d’activités commerciales régulières – et en particulier en relation avec des programmes de transformation numérique – mais qui sont généralement inutiles à d’autres fins. Par exemple, l’analyse et la gestion des relations commerciales. C’est un peu comme la matière noire de notre univers, que le CERN estime représenter environ 27% de toute la matière, sauf que la concentration de données noires est beaucoup plus répandue. Dans l’univers des actifs d’information d’une organisation typique, les experts suggèrent que plus de 50 % de ce qui se trouve dans le centre de données sont des données obscures . C’est l’équivalent organisationnel de la thésaurisation, peu d’entre eux ayant une stratégie ou des processus automatisés en place pour comprendre ce qui est stocké et gérer les données tout au long de leur cycle de vie .

Le coût caché des centres de données

La gestion des données obscures est un problème car les centres de données nécessitent de grandes quantités d’électricité. En 2020, la consommation d’énergie des centres de données devrait représenter 3,5 % des émissions mondiales totales de carbone et devrait atteindre près de 40 % d’ici 2040 . D’ici 2025, ils devraient consommer 20 % de l’électricité mondiale – plus que tout autre secteur. Il équivaut à ce que consomment actuellement les industries alimentaires, sidérurgiques et papetières des pays de l’Organisation de coopération et de développement économiques (OCDE). Les organisations se concentrent sur la réduction de leur utilisation de diesel rouge et de plastiques, mais qu’en est-il du coût environnemental de leurs données ?

Une mauvaise gestion des données est un problème de gaspillage sérieux (et entièrement évitable) qui croît à un rythme exponentiel.

Considère ceci. En 2010, IDC a estimé que 1,2 zettaoctets (1 200 milliards de gigaoctets) de nouvelles données avaient été créés cette année-là, soit plus de 40 % de plus qu’un an plus tôt. À l’époque, ils avaient prédit que les niveaux de création de nouvelles données atteindraient 35 zettaoctets (35 000 milliards de gigaoctets) en 2020. Cela devait sembler énorme à l’époque, mais c’était loin d’être le cas, atteignant ce niveau deux ans plus tôt. IDC a maintenant révisé à la hausse sa prévision de création de données pour 2020 à 175 zettaoctets (175 000 milliards de gigaoctets). C’est une augmentation de 99 %.

Il n’est pas vraiment surprenant d’apprendre qu’autant de données sont créées. Nous sommes au milieu de la « quatrième révolution industrielle », une ère de « mégadonnées » où les organisations du monde entier investissent dans la transformation numérique, l’Internet des objets, l’investissement dans les crypto-monnaies, l’IA, la blockchain, l’automatisation, le commerce électronique, la gestion de patrimoine en ligne. banque, télémédecine. Les données sont au centre de toutes ces stratégies et, associées à ces nouvelles applications pour les données, s’accompagnent d’une exigence de conformité accrue.

Bien que les réglementations du secteur varient, de grandes quantités de données transactionnelles doivent être conservées à des fins de conformité, souvent pendant des décennies. Dans un monde où le volume de données quadruple tous les cinq ans, cela ne fait qu’ajouter au coût environnemental et financier de la gestion de son stockage continu. En fait, la recherche a montré que seule une fraction des données que les organisations détiennent dans leurs systèmes – environ 10 à 15 % – est réellement utilisée. Le reste est constitué d’informations héritées, dont la plupart sont totalement redondantes.

Minimiser le gaspillage de données : que pouvons-nous faire ?

Donc, pour revenir à ces calculs originaux, si 40 % des émissions de carbone actuelles proviennent de centres de données qui consomment jusqu’à un cinquième de l’électricité ; et si 50 % des données qui y sont stockées sont des données sombres, dont seulement 10 % sont activement utilisées, cela représente un grand gaspillage de ressources énergétiques. Le réduire aurait un effet positif significatif sur les objectifs net zéro des organisations. Que faire pour minimiser ce gaspillage et ne stocker que les données réellement nécessaires ?

Pour une organisation moyenne de taille moyenne qui détient 1 000 To de données , le coût de stockage des informations non critiques est estimé à plus de 550 000 £ par an . Ces estimations reflètent ce que nous constatons réellement chez nos clients, dont beaucoup se concentrent activement sur la réduction de leur empreinte carbone. Par exemple, un fabricant de boissons bien connu a travaillé avec TJC pour examiner les données de son entreprise et réduire la consommation d’énergie inutile grâce à des projets d’archivage automatisé des données. Jusqu’à présent, ce travail leur a permis d’identifier 55 To de données sombres pouvant être archivées, réduisant ainsi la consommation d’énergie de 149 %. Bien que nous comprenions tous que les arguments financiers ne sont qu’un aspect du problème, en termes monétaires uniquement, cela équivaut à économiser plus de 2 millions d’euros.

Il n’est pas surprenant que l’ONU signale une augmentation aussi importante du nombre d’organisations faisant des annonces publiques sur leurs plans de décarbonation. 80 % des consommateurs disent qu’ils admirent le plus les marques qui démontrent un engagement envers le développement durable . Mais si les organisations et les gouvernements veulent vraiment donner la priorité à l’atteinte des objectifs net zéro d’ici 2040 ou avant, une attention beaucoup plus grande devrait être accordée aux données qu’ils consomment de l’énergie pour stocker, avec une gestion du cycle de vie des informations nécessaire pour réduire le gaspillage à tous les niveaux.

Quelles mesures pratiques les organisations peuvent-elles prendre dès maintenant pour réduire le gaspillage d’énergie associé au stockage des données ?

  1. Effectuer un audit complet des données pour identifier quelles données existent et quel devrait être leur cycle de vie, en consultant les parties prenantes pour établir des priorités
  2. Établir une stratégie de gestion du cycle de vie des informations (ILM), avec des politiques claires pour la gestion continue et la conservation des données en tenant compte des problèmes de conformité réglementaire comme le RGPD
  3. Identifier un moyen d’automatiser le processus d’archivage et de démantèlement des données en tant que balayage continu à l’avenir
  4. Mettre en place des rapports pour surveiller le retour sur investissement à long terme de l’ILM, la réduction progressive du coût total de possession des données et l’impact positif sur les objectifs de réduction de carbone.

Vous voulez en savoir plus sur la gestion des données et les avantages positifs en termes de durabilité ? Entrer en contact.