Infrastructures

Enjeux de la sauvegarde des données face aux applications modernes

Share this post:

Les nouvelles architectures logicielles, notamment la virtualisation, et les nouveaux usages comme l’intelligence artificielle (IA) ou le Big Data imposent des solutions spécifiques de sauvegarde.

La sauvegarde classique de bases de données ou de progiciels fonctionnant sur des serveurs dédiés peut s’opérer sur bande, sur des disques à bas coût, dans des espaces de stockage Objet du client ou des espaces Cloud public/privé chez un CSP.

Il est aujourd’hui crucial d’être en mesure de compresser, dédupliquer et éventuellement chiffrer ces informations. L’émergence de nouveaux types et modes de stockage (Flash, disques et bandes magnétiques ultra denses, Cloud) associée à l’explosion des volumes rend d’autant plus pertinent (voire indispensable) la capacité à opérer des hiérarchies de stockage astucieuses et économiques : en fonction de son âge ou de sa fréquence d’utilisation, la donnée doit pouvoir être stockée sur un support rapide dans un premier temps, puis sur un disque plus lent, puis sur une bande ou dans le Cloud, afin de répondre à la fois aux exigences de temps de sauvegarde ou de récupération de la donnée et d’optimisation des coûts du stockage.

La sauvegarde d’environnements virtuels est assez spécifique. L’objectif est ici de réaliser une sauvegarde opérationnelle « générique », simple et rapide, pour un temps limité, qui garantit une restauration tout aussi simple et rapide à un état relativement récent. Les données sont très rapidement enregistrées grâce à un « snapshot » incrémental identifiant les fragments de données modifiés. La restauration consiste alors à reconstituer ce puzzle des différents fragments présents à la date souhaitée, en une seule opération.

Le média employé ne s’appuie pas sur de la bande magnétique – trop lent dans ce cas – mais sur des disques de grande capacité, peu chers et moyennement rapides. Classique pour sauvegarder l’enveloppe d’une machine virtuelle, ce mécanisme s’étend également aux bases de données et applicatifs, majeurs ou émergeants. Les modes de restauration sont alors contextualisés et proposent une granularité bien plus fine, pouvant aller jusqu’à une transaction spécifique.

 

Le besoin de réplication

Au même titre qu’un applicatif critique de l’entreprise, le service de protection des données se doit d’être disponible et résilient. Raison pour laquelle des mécanismes de haute disponibilité et de réplication distante des sauvegardes sont de plus en plus courants. Ici encore, il faut pouvoir faire appel aux différentes technologies de stockage disponibles : la bande magnétique, rempart contre d’éventuels « ransomwares[1] », le disque capacitif permettant de répliquer des sauvegardes dédupliquées, et toujours le Cloud pour des conservations longue durée ou en tant que solution de secours globale de l’entreprise. Au-delà de ces mécanismes de réplication, une nouvelle philosophie émerge avec les systèmes de stockage géo-dispersés s’appuyant sur des mécanismes « d’erasure coding[2] » garantissant l’accessibilité des données même en cas d’incident ou d’échecs multiples : un stockage des sauvegardes unique, sans réplication, réparti géographiquement et capable de survivre à une indisponibilité totale d’un des sites.

 

Les nouveaux usages du stockage

Les projets de transformation des entreprises qui font intervenir le Big Data et l’IA, nécessitent un volume de données considérable et souvent hétérogène, qu’il devient problématique de sauvegarder. Que doit-on vraiment sauvegarder ? Quelles sont les données vitales et celles pouvant être reconstruites ? Comment garantir la cohérence de l’ensemble de ces données aux origines diverses ? Comment optimiser compression et déduplication ? Quand réaliser la sauvegarde de ces données parfois constamment sollicitées par des traitements récurrents ? Comment accélérer le scan de millions (milliards) de fichiers afin de déterminer ceux devant être sauvegardés ?

Protéger un environnement Big Data impose une nouvelle réflexion sur la manière d’utiliser les outils actuels, ainsi que de considérer les nouvelles technologies capables d’accompagner la croissance des données. Trouver des moyens de réduire les volumes devant être protégés et faire évoluer l’environnement de sauvegarde sont des éléments clés pour garantir que les données critiques seront protégées contre les défaillances simples et catastrophiques du système.

Toutes ces technologies montent en puissance pour répondre à l’augmentation de l’usage des données – McKinsey Global Institute estime ainsi que le volume global de données double tous les trois ans. Une évolution qui poussera forcément l’entreprise à se poser une question plus radicale : « toutes mes données méritent-elles d’être stockées » ?

 

[1] Ou cryptolockers : logiciels de cryptage de données exploités par des pirates qui promettent une clé de déchiffrage moyennant une rançon.

[2] Ou “code d’effacement » : permet de sauvegarder les données en fragments. Lors de la reconstruction de ces données, les fragments absents peuvent être retrouvés par interpolation.

Pour en savoir plus :

Découvrez comment Cloud Temple gère efficacement plusieurs règles de sauvegarde simultanément dans différents environnements de serveurs virtuels ?

Les solutions Cloud Object Storage

Les solutions Stockage sur bande

 

Avant-vente Stockage

More Infrastructures stories
25 janvier 2021

Les fonctionnalités clés des solutions des Ressources Humaines

Les solutions de gestion des Ressources Humaines offrent de multiples fonctionnalités qui permettent de recruter, gérer et développer votre capital humain. Ces solutions ont pour vocation de couvrir l’ensemble du cycle de vie d’un collaborateur au sein de votre organisation. Aujourd’hui, les solutions RH digitales ont considérablement évolué grâce à l’intégration des technologies avancées comme […]

Continue reading

11 janvier 2021

Enseigner la Data Science aux futurs cadres et les préparer à l’Intelligence Artificielle

Le phénomène de la digitalisation de l’économie et de nos sociétés n’a pas fini d’impacter le fonctionnement des entreprises et des organisations : quelles que soient leurs futures fonctions, techniques ou manageriales, nos étudiants doivent être préparés face au phénomène de prolifération des données, à exploiter ces données et leur donner du sens. Car bien […]

Continue reading

3 décembre 2020

Le numérique au service d’une mobilité plus verte

2020 : dans le cadre la pandémie qui nous touche, les français se sont retrouvés freinés dans leur mobilité. Il a fallu apprendre à vivre sans cette hypermobilité avec laquelle nous avions jusque-là construit nos vies. Augmentation inédite du télétravail, explosion du commerce en ligne, consultations médicales à distance, ou école à la maison… Les outils […]

Continue reading