Apprenez les bases de la sauvegarde et de la reprise après incident afin de pouvoir formuler des plans efficaces réduisant la durée d'indisponibilité.
Comprendre les bases de la sauvegarde et de la reprise après incident est essentiel pour réduire l'impact d'une durée d'indisponibilité non planifiée sur votre entreprise. Dans tous les domaines d'activité, les organisations reconnaissent que la durée d'indisponibilité peut rapidement aboutir à une perte de revenu. Malheureusement, les catastrophes naturelles, les erreurs humaines, les failles de sécurité et les attaques par rançongiciel peuvent tous compromettre la disponibilité des ressources IT. Toute durée d'indisponibilité peut faire dérailler les interactions avec le client, nuire à la productivité des employés, détruire des données et mettre un frein au processus commercial.
La différenciation de la sauvegarde et de la reprise après incident, définissant les termes clés, et évaluant les différentes options et technologies de déploiement peuvent vous aider à développer des stratégies efficaces pour éviter les conséquences d'une durée d'indisponibilité.
Il y a une différence importante entre sauvegarde et reprise après incident. La sauvegarde est le processus permettant de faire une copie supplémentaire (ou plusieurs copies) des données. Vous sauvegardez les données pour les protéger. Vous pourriez avoir besoin de restaurer les données de sauvegarde si vous rencontrez une suppression accidentelle, une corruption de la base de documents ou un problème avec la mise à niveau du logiciel.
La reprise après incident, d'autre part, se rapporte au plan et processus pour rétablir rapidement l'accès aux applications, données et ressources IT après une indisponibilité. Ce plan peut impliquer une commutation vers un ensemble redondant de serveurs et de systèmes de stockage jusqu'à ce que votre centre de données primaire soit à nouveau fonctionnel.
Certaines organisations confondent sauvegarde et reprise après incident. Mais comme elles peuvent le découvrir après une grave indisponibilité, disposer simplement de copies des données ne signifie pas que vous pouvez maintenir votre entreprise en fonctionnement. Pour assurer la continuité des opérations, vous avez besoin d'une sécurité maximale, d'un plan de reprise après incident testé.
Votre organisation ne peut pas se permettre de négliger la sauvegarde ou la reprise après incident. S'il faut des heures pour récupérer les données perdues après une suppression accidentelle, vos employés ou partenaires restent inoccupés, incapables de réaliser des processus critiques de l'entreprise qui dépendent de votre technologie. Et s'il faut des jours pour remettre votre entreprise en ligne après un sinistre, vous risquez de perdre définitivement des clients. Compte tenu du temps et de l'argent que vous pourriez perdre dans les deux cas, les investissements dans la sauvegarde et la reprise après incident sont tout à fait justifiés.
Comprendre quelques termes essentiels peut aider à façonner vos décisions stratégiques et vous permettre de mieux évaluer les solutions de sauvegarde et de reprise après incident.
Un dernier terme peut être utile lorsque vous envisagez des alternatives pour gérer vos processus et environnement de reprise après incident :
Une fois que vous avez compris les concepts clés, il est temps de les appliquer à vos charges de travail. De nombreuses organisations ont plusieurs RTO et RPO qui reflètent l'importance de la chaque charge de travail pour leur activité.
Pour une grande banque, le système de banque en ligne peut être une charge de travail critique : la banque doit réduire la durée et la perte de données. Cependant, l'application de suivi du temps des employés de la banque est moins importante. En cas d'événement de sinistre, la banque pourrait autoriser cette application à être indisponible pendant plusieurs heures ou même un jour sans avoir d'impact négatif important sur l'activité. La définition des charges de travail en tant que niveau 1, niveau 2 ou niveau 3 peut aider à fournir un canevas pour votre plan de reprise après incident.
Evaluer les options de déploiement
L'étape suivante dans la conception d'un plan de reprise après incident consiste à évaluer les options de déploiement. Avez-vous besoin de conserver des fonctions de reprise après incident ou des données de sauvegarde en local ? Bénéficieriez-vous d'une approche de cloud public ou de cloud hybride ?
Les solutions de sauvegarde et de reprise après incident basées sur le cloud deviennent de plus en plus populaires parmi les organisation de toutes tailles. De nombreuses solutions cloud fournissent l'infrastructure de stockage des données et, dans certains cas, les outils de gestion des processus de sauvegarde et de reprise après incident.
En sélectionnant une offre de sauvegarde ou de reprise après incident basée sur le cloud, vous pouvez éviter le l'investissement en capital important pour l'infrastructure ainsi que les coûts de gestion de l'environnement. De plus, vous gagnez une extensibilité rapide ainsi que la distance géographique nécessaire pour garder les données en sécurité en cas de sinistre régional.
Les solutions de sauvegarde et de reprise après incident peuvent prendre en charge les environnements de production locaux et cloud. Vous pouvez décider, par exemple, de stocker uniquement des données sauvegardées ou répliquées dans le cloud tout en conservant votre environnement de production dans votre propre centre de données. Avec cette approche hybride, vous bénéficiez toujours des avantages de l'extensibilité et de la distance géographique sans avoir à déplacer votre environnement de production. Dans un modèle cloud à cloud, la production et la reprise après incident sont situées dans le cloud, bien que sur des sites différents pour assurer suffisamment de séparation physique.
Dans certains cas, garder certains processus de sauvegarde ou de reprise après incident en local peut vous aider à récupérer les données et restaurer les services IT rapidement. Conserver certaines données sensibles en local peut également sembler intéressant si vous avez besoin de respecter strictement les règles de protection des renseignements personnels ou de souveraineté des données.
Pour la reprise après incident, un plan qui repose entièrement sur un environnement local serait un obstacle. Si une catastrophe naturelle ou une indisponibilité d'énergie survenait, l'ensemble de votre centre de données, avec les systèmes primaire et secondaire, serait concerné. Voilà pourquoi la plupart des stratégies de reprise après incident utilisent un site secondaire qui est à une certaine distance du centre de données primaire. Vous pouvez localiser cet autre site dans toute la ville, dans le pays ou dans le monde entier en fonction de la façon dont vous décidez d'équilibrer des facteurs tels que la performance, la conformité aux règlementations et l'accessibilité physique au site secondaire.
Technologies
Selon les options de déploiement sélectionnées, vous pouvez avoir plusieurs alternatives pour les types de technologies et de processus que vous utilisez pour la sauvegarde et la reprise après incident.
Bien qu'ayant été présent depuis des décennies, le stockage sur bande magnétique traditionnelle peut encore jouer un rôle dans votre plan de sauvegarde. Avec une solution de bande magnétique, vous pouvez stocker un grand nombre de données de manière fiable et rentable.
Alors que la bande magnétique peut être efficace pour la sauvegarde, elle n'est généralement pas utilisée pour la reprise après incident, qui nécessite des temps d'accès plus rapides au stockage sur disque. De plus, si vous avez besoin de récupérer physiquement une bande magnétique à partir d'un coffre hors site, vous pourriez perdre plusieurs heures voire plusieurs jours de disponibilité.
Une sauvegarde à base d'échantillonnage enregistre l'état actuel d'une application ou d'un disque à un moment précis. En écrivant uniquement les données modifiées depuis le dernier échantillonnage, cette méthode peut aider à protéger les données tout en préservant l'espace de stockage.
La réplication basée sur l'échantillonnage peut être utilisée pour la sauvegarde ou la reprise après incident. Evidemment, vos données sont aussi complètes que votre dernier échantillonnage. Si vous prenez des échantillons toutes les heures, vous devez être prêt à perdre une heure de données.
De nombreuses organisations s'orientent sur la réplication continue pour la reprise après incident ainsi que la sauvegarde. Avec cette méthode, la copie le plus récente d'un disque ou d'une application est répliquée en continu vers un autre emplacement ou le cloud, minimisant la durée d'indisponibilité et offrant plus points de récupération graduelle.
Pour la plupart des organisations, les stratégies de sauvegarde et de reprise après incident sont absolument essentielles pour maintenir l'intégrité de l'activité. IBM Cloud Disaster Recovery Solutions peut vous aider à évaluer et mettre à jour vos stratégies, ce qui peut vous aider à contrôler la complexité et les coûts. En outre, IBM Cloud Object Storage offre une destination évolutive et sécurisée pour la sauvegarde de vos données critiques.
IBM propose des solutions automatisées pour la sauvegarde cloud et la reprise après incident sous forme de service.
Développez vos compétences grâce à des cours sur les services de données, tels que « Gestion des sauvegardes et des restaurations sur IBM Cloud », et une variété d'autre cours contenus dans la formation et la certification basée sur les rôles IBM Cloud Professional Site Reliability Engineer (SRE).
Quoi que vous fassiez, n'attendez pas pour évaluer vos stratégies. Les plans de sauvegarde et de reprise après incident peuvent aider uniquement s'ils sont conçus, déployés et testés bien avant qu'ils ne soient nécessaires.
Inscrivez-vous et commencez à construire sur IBM Cloud aujourd'hui.
Protégez vos données avec un plan de reprise après incident dans le cloud
Découvrez comment IBM Cloud Object Storage fournit une destination hautement durable, évolutive et très sécurisée pour la sauvegarde de vos données.
Découvrez les centres de données, à savoir ce qu'ils contiennent, ce qu'implique leur création, ainsi que les avantages et les risques liés aux ressources de centres de données partagées.