La reprise après incident (DR) est un framework qui regroupe les technologies informatiques et les bonnes pratiques conçues pour prévenir ou minimiser la perte de données et l’interruption de l’activité résultant d’événements catastrophiques.
Elle englobe tout, des pannes d’équipement et coupures de courant locales aux attaques criminelles ou militaires, cyberattaques et catastrophes naturelles.
De nombreuses entreprises, en particulier les petites et moyennes entreprises, négligent d'élaborer un plan de reprise après sinistre (DRP) fiable et pratique. En l'absence d'un tel plan, elles sont peu protégées contre l'impact d'événements perturbateurs majeurs.
Le coût des temps d’arrêt imprévus rend la protection contre les pertes de données essentielle. Selon l’étude de Splunk et Oxford Economics, le coût moyen d’un temps d’arrêt peut coûter jusqu’à 9 000 USD par minute (ou 540 000 USD par heure) aux entreprises. Pour les institutions financières et les établissements de santé à fort enjeu qui traitent des données sensibles, les temps d’arrêt peuvent entraîner des coûts supérieurs à 5 millions de dollars par heure.1 La planification de la reprise après sinistre peut considérablement atténuer ces risques.
La reprise après sinistre implique l’élaboration de stratégies, la planification, le déploiement de technologie appropriée et la mise en œuvre de tests continus. Bien que les sauvegardes de données soient un composant critique, un processus de sauvegarde et de récupération à lui seul ne constitue pas un plan complet de reprise après sinistre.
La reprise après sinistre implique également de s'assurer que le stockage et l'informatique sont suffisants pour maintenir des procédures efficaces de basculement et de reprise après sinistre. Failover (ou basculement) est le processus de déchargement des workload vers des systèmes de sauvegarde afin que les processus de production et l'expérience des utilisateurs finaux soient perturbés le moins possible. Le failback consiste à revenir aux systèmes primaires d’origine.
Newsletter sectorielle
Restez au fait des tendances les plus étonnantes du secteur dans le domaine de l’IA, de l’automatisation, des données et bien d’autres avec la newsletter Think. Consultez la Déclaration de confidentialité d’IBM.
Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.
La continuité des activités et la reprise après sinistre (BCDR) est un processus qui aide votre entreprise à reprendre ses opérations commerciales normales en cas de catastrophe. La continuité d’activité et la reprise après sinistre présentent de nombreuses similitudes, mais il s'agit de deux approches distinctes.
Bien que la BCDR soit parfois appelée gestion des urgences en entreprise, elle diffère considérablement des programmes du gouvernement comme la Federal Emergency Management Agency (FEMA). Ces programmes se concentrent sur les urgences civiles et assurent la sécurité publique et l'assistance à la communauté en cas de catastrophe, plutôt que sur les technologies de l'information et les opérations de l'entreprise.
Le plan de continuité d’activité (PCA) consiste en des systèmes et des processus qui garantissent que tous les secteurs d'une entreprise peuvent maintenir les opérations ou les reprendre rapidement en cas de crise ou d'urgence.
La planification de la reprise après sinistre est un sous-ensemble de la planification de la continuité d’activité qui se concentre sur la récupération de l’infrastructure et des systèmes informatiques. Cela implique un plan de reprise après sinistre (DRP) qui définit les étapes de reprise après un événement inattendu. Les entreprises s’appuient sur les DRP pour gérer diverses situations de catastrophe (par exemple, catastrophes naturelles, ransomwares, attaques de logiciels malveillants).
Les sept étapes suivantes sont essentielles à une planification efficace de la reprise après sinistre :
La création d'un plan complet de reprise après sinistre commence par une analyse d'impact commercial (BIA). En réalisant cette analyse, vous allez créer une série de scénarios de catastrophe détaillés. Ces scénarios peuvent ensuite être utilisés pour prévoir la taille et l’étendue des pertes que vous subiriez en cas de perturbation de certains processus métier. Par exemple, et si un incendie détruisait le centre d'appels de votre service client ? Ou bien si un tremblement de terre frappait votre siège social ?
Cette analyse vous permet d’identifier les fonctions les plus critiques de l’entreprise et de déterminer le temps d’arrêt que chacune d’entre elles peut tolérer. Avec ces informations en main, vous pouvez commencer à élaborer un plan pour maintenir les opérations les plus critiques dans divers scénarios.
La planification de la reprise après sinistre informatique doit s’appuyer sur la planification de la continuité d’activité et la soutenir. Que se passe-t-il si, par exemple, votre plan de continuité d’activité prévoit que les agents du service client travaillent à domicile à la suite d’un incendie dans un centre d’appels ? Quels types de matériel, de logiciels et de ressources informatiques doivent être disponibles pour soutenir ce plan ?
Évaluer la probabilité et les conséquences potentielles des risques auxquels votre entreprise est confrontée est un composant crucial d’une stratégie de reprise après sinistre. Face à la hausse du nombre de cyberattaques et de ransomwares, il est critique de comprendre les risques liés à la cybersécurité auxquels toutes les entreprises sont confrontées aujourd’hui. En outre, il est important de comprendre les risques propres à votre secteur d’activité et à votre situation géographique.
Pour divers scénarios, notamment les catastrophes naturelles, les pannes d'équipement, les menaces internes, le sabotage et les erreurs des employés, il est important d'évaluer vos risques et de prendre en compte l'impact global sur votre entreprise.
Posez-vous les questions suivantes :
Toutes les charges de travail n’ont pas la même importance critique pour la capacité de votre entreprise à maintenir ses opérations, et les temps d’arrêt sont beaucoup plus tolérables pour certaines application que pour d’autres.
Séparez vos systèmes et applications informatiques en trois niveaux, en fonction de la durée d'indisponibilité que vous pouvez vous permettre et de la gravité des conséquences d'une perte de données :
L'étape suivante dans la planification de la reprise après sinistre est de créer un stock complet de vos actifs matériels et logiciels. À ce stade, il est essentiel de comprendre les interdépendances critiques entre les applications. Si une application logicielle tombe en panne, quelles autres seront affectées ?
La meilleure façon de gérer les interdépendances entre les applications est de concevoir des modèles de résilience des données et de reprise après sinistre dans les systèmes dès leur création initiale. Dans les architectures basées sur les microservices actuelles, on découvre trop souvent des processus qui ne peuvent pas être initiés lorsque d’autres systèmes ou processus sont en panne, et vice versa.
Il est difficile de se remettre de cette situation. Il est également essentiel de détecter ces problèmes lorsque vous avez le temps d'élaborer des plans alternatifs pour vos systèmes et processus, avant qu'une catastrophe ne survienne.
En tenant compte de vos analyses de risque et d’impact commercial, vous devriez être capable d’établir plusieurs objectifs. Ces objectifs comprennent le temps nécessaire pour rétablir les systèmes en ligne, la quantité de données que vous pouvez vous permettre de perdre et le degré de corruption ou de perte de données que vous pouvez tolérer.
Tous les logiciels et solutions de reprise après sinistre mis en place par votre entreprise doivent respecter toutes les exigences en matière de protection et de sécurité des données auxquelles vous êtes tenu de vous conformer. Cela signifie que tous les systèmes de sauvegarde et de basculement des données doivent être conçus pour répondre aux mêmes normes que vos systèmes principaux en matière de confidentialité et d'intégrité des données.
Par ailleurs, plusieurs normes réglementaires stipulent que toutes les entreprises doivent disposer de plans de reprise après sinistre et de continuité des activités. La loi Sarbanes-Oxley (SOX), par exemple, exige que toutes les entreprises cotées en bourse aux États-Unis conservent des copies de tous les dossiers commerciaux pendant un minimum de cinq ans.
Le non-respect de cette réglementation (y compris le fait de ne pas mettre en place et de tester des systèmes de sauvegarde des données appropriés) peut entraîner des sanctions financières importantes pour les entreprises, voire des peines de prison pour leurs dirigeants.
En clair, si votre plan de reprise après sinistre n’a pas été testé, vous ne pouvez pas vous y fier. Tous les employés ayant des responsabilités pertinentes doivent participer à l’exercice de test de reprise après sinistre, qui peut impliquer le maintien des opérations à partir du site de basculement pendant une période donnée.
Si la réalisation de tests complets de reprise après sinistre dépasse votre budget ou vos capacités, vous pouvez également planifier un « exercice sur table » pour passer en revue les procédures de test. Cependant, ce type de test est moins susceptible de révéler des anomalies ou des faiblesses dans vos procédures de reprise après sinistre, en particulier la présence d'interdépendances entre les applications qui n'avaient pas été détectées auparavant, qu'un test complet.
À mesure que vos actifs matériels et logiciels évoluent au fil du temps, vous devez vous assurer que votre plan de reprise après sinistre est mis à jour en conséquence. Il est donc important de revoir et de réviser régulièrement le plan.
Cliquez ici pour voir un exemple de plan de reprise après sinistre.
La reprise après sinistre offre des avantages essentiels, notamment :
La reprise après sinistre comprend les types de technologies et de solutions suivants :
Construire votre propre centre de données de reprise après sinistre implique de trouver un équilibre entre plusieurs objectifs concurrents.
Néanmoins, une copie de vos données doit être conservée dans un endroit suffisamment éloigné d’un point de vue géographique de votre siège social ou de vos bureaux. Ainsi, les mêmes événements sismiques, menaces environnementales ou autres dangers affectant votre site principal ne peuvent pas détruire définitivement vos données.
En même temps, les sauvegardes stockées hors site prennent plus de temps à être restaurées par rapport à celles stockées sur le site principal. De plus, la latence du réseau peut être encore plus élevée sur de plus longues distances.
La sauvegarde et la restauration constituent la base sur laquelle repose tout plan de reprise après sinistre solide.
Une sauvegarde instantanée d'une base de données capture l'état actuel d'une application ou d'un disque à un moment donné. En écrivant uniquement les données modifiées depuis le dernier instantané, cette méthode peut permettre de protéger les données tout en conservant l’espace de stockage.
Les instantanés peuvent être répliqués à d’autres emplacements ou stockés dans le cloud à des fins de reprise après sinistre.
Le Cloud DR utilise une infrastructure et des services basés sur le cloud pour sauvegarder et récupérer les données et les applications, éliminant ainsi la nécessité de maintenir des centres de données secondaires physiques.
Il vous permet de protéger les données des applications et l’ensemble de l’infrastructure serveur, y compris les machines physiques ou machines virtuelles (VM) qui utilisent soit le cloud public, soit les paramètres du fournisseur de services dédié. Vous pouvez configurer des calendriers de sauvegarde en fonction de vos besoins spécifiques.
Les solutions de sauvegarde dans le cloud peuvent également s'intégrer à des plateformes de virtualisation telles que VMware ou à des solutions de sauvegarde cloud native. Ces approches offrent une évolutivité flexible et une optimisation des coûts à mesure que vos besoins en matière de stockage évoluent et accompagnent les organisations dans leur migration vers le cloud.
La reprise après sinistre en tant que service (DRaaS) est une solution tierce, basée sur le cloud, qui fournit des capacités de protection des données et de reprise après sinistre à la demande et sur la base d’un paiement à l’utilisation.
Le DRaaS est l'un des services informatiques gérés les plus populaires et à la croissance la plus rapide actuellement disponibles. Une étude sectorielle réalisée en 2023 prévoit que le marché du DRaaS passera de 10,7 milliards de dollars à 26,5 milliards de dollars d'ici 2028, avec un taux de croissance annuel composé.2
Avec le DRaaS, votre fournisseur de services documente les RTO et les RPO dans un accord de niveau de service (SLA) qui décrit vos limites de temps d’arrêt et vos attentes en matière de récupération d’application.
Les offres DRaaS comprennent généralement des opérations de récupération d'applications basées sur le cloud. Cette approche permet de réaliser des économies importantes par rapport à la gestion de ressources matérielles dédiées redondantes dans votre propre centre de données. Il existe des contrats dans lesquels vous payez des frais pour le maintien des capacités de basculement, ainsi que les coûts d'utilisation des ressources consommées dans une situation de reprise après sinistre. Dans ce cas, votre fournisseur assume généralement l’entière responsabilité de la configuration et de la maintenance de l’environnement de basculement.
Si vous avez déjà développé une solution de reprise après sinistre (DR) sur site, il peut être difficile d’évaluer les coûts et les avantages de sa maintenance par rapport à la transition vers un abonnement DRaaS mensuel.
La plupart des solutions de reprise après incident sur site entraînent des coûts en termes de matériel, d’alimentation, la de personnel de maintenance et d’administration, de logiciels et de connectivité au réseau. Outre les dépenses d’investissement initiales liées à la configuration initiale de votre environnement DR, vous devez prévoir un budget pour les mises à niveau logicielles.
Comme votre solution de reprise après sinistre doit rester compatible avec votre environnement de production principal, vous devez vous assurer que votre solution de reprise après sinistre possède les mêmes versions logicielles. Selon votre contrat de licence, vos coûts logiciels pourront être multipliés par deux.
Si vous envisagez de recourir à des solutions DRaaS tierces, veuillez vous assurer que le fournisseur dispose de la capacité nécessaire pour effectuer des sauvegardes multirégionales et multisites. Si un événement météorologique important (par exemple, un ouragan) devait avoir un impact sur votre site principal, le site de basculement serait-il suffisamment éloigné pour ne pas être affecté par la tempête ?
Si, dans votre région, de nombreux clients de votre fournisseur étaient simultanément impactés, aurait-il une capacité suffisante pour répondre à leurs besoins en même temps ? Vous faites confiance à votre fournisseur de DRaaS pour répondre aux RTO et aux RPO en temps de crise, alors recherchez un fournisseur de services jouissant d’une solide réputation en termes de fiabilité.
Pour une vision plus comparative des deux solutions, consultez le document suivant : « Reprise après sinistre en tant que service (DRaaS) ou reprise après sinistre (DR) : de quoi avez-vous besoin ? »
L’intégration de l’intelligence artificielle (IA) transforme la reprise après sinistre sous la forme de fonctionnalités qui améliorent la détection des menaces, automatisent la réponse aux incidents et rationalisent la gestion dans des environnements hybrides et multicloud .
Dans le rapport IBM 2025 sur le coût d’une violation de données, les coûts mondiaux moyens ont diminué, passant de 4,88 millions à 4,44 millions de dollars, soit une baisse de 9 %. Selon le rapport, les entreprises ont été en mesure d’identifier et de contenir une violation dans un délai médian de 241 jours, soit le délai le plus court depuis 9 ans.
L’IA en matière de reprise après sinistre offre les principaux avantages suivants :
Protégez vos données contre les menaces en constante évolution, quel que soit leur emplacement de stockage, grâce à la sauvegarde, à la détection des menaces optimisée par l’IA et au rétablissement rapide des opérations.
Accélérez les processus de sauvegarde et de restauration d’entreprise afin de récupérer les données et de restaurer rapidement les services informatiques pour les workloads sur site et dans le cloud.
Protégez vos données avec un plan de reprise après sinistre dans le cloud et réduisez le risque de temps d’arrêt.
1. The Hidden costs of downtime—According to Global 2000 Executives, Splunk, juin 2024
2. Disaster Recovery as a Service (DRaaS) Market Size, MarketsandMarkets, 2023