バックアップと災害復旧とは
バックアップと災害復旧の基本について知ることで、ダウンタイムを最小化する効果的な計画を策定できるようになります。
黒と青の背景画像
バックアップと災害復旧とは

バックアップと災害復旧の基本について知ることで、ダウンタイムを最小化する効果的な計画を策定できるようになります。

  • バックアップと災害復旧の違いを認識し、実効性のある戦略を策定するために不可欠である主要な概念を理解します

  • 複数のクラウドとオンプレミスでの導入オプションを評価し、お客様の組織にとって最適な製品を見つけます

  • お客様のバックアップと災害復旧の目標を達成するために最適なテクノロジーを特定します

お客様のビジネスにおける計画外のダウンタイムの影響を最小限にするためには、バックアップと災害復旧の本質を理解することが不可欠です。 業界全体で、ダウンタイムがすぐに収入減につながる可能性があることが認識されています。 残念ながら、自然災害、人的エラー、セキュリティー侵害、ランサムウェア攻撃はすべて、ITリソースの可用性を危険にさらす可能性があります。 ダウンタイムが発生すれば、顧客との対話が妨げられ、従業員の生産性が低くなり、データが破壊され、ビジネス・プロセスが停止するおそれがあります。

バックアップと災害復旧を区別し、主要な用語を定義し、さまざまな導入オプションやテクノロジーを評価することにより、ダウンタイムの影響を回避するための実効性のある戦略を策定できます。

バックアップと災害復旧とは

バックアップと災害復旧には、重要な違いがあります。 バックアップとは、データのコピーを作成するプロセスです。 バックアップは、データを保護するために行います。 誤ってデータを削除した場合、データベースが破損した場合、ソフトウェアのアップグレードの際に問題が発生した場合には、バックアップ・データを復元する必要があります。

一方、災害復旧とは、障害の発生後にアプリケーション、データ、ITリソースへのアクセスを迅速に復旧するための計画やプロセスを指します。 この計画には、1次データセンターが再度機能するまでの、予備のサーバーやストレージ・システムへの切り替えが含まれる場合があります。

一部の組織は、バックアップと災害復旧を混同しています。 重大な障害の発生後に気付く場合がありますが、単にデータのコピーを保持しているだけでは、事業運営を維持できるとは限りません。 事業継続性を確保するためには、堅牢な、テスト済みの災害復旧計画が必要です。

計画の重要性

バックアップや災害復旧を軽視してはなりません。 誤って削除したデータの復元に時間がかかる場合、従業員やパートナーは、ただ待つことしかできず、お客様のテクノロジーに依存した重要なビジネス・プロセスを完了させることができなくなります。 また、障害発生後にビジネスをオンラインに戻すのに数日かかる場合には、永久に顧客を失うことになります。 このような場合に失う可能性のある時間と費用を考慮すると、バックアップと災害復旧への投資は、完全に理にかなっていると言えます。

主要な用語

いくつかの重要な用語を理解することは、戦略的決定に役立ちます。また、バックアップと災害復旧ソリューションをより適切に評価できるようになります。

  • 目標復旧時間(RTO)とは、障害発生後、通常業務の復旧までにかかる時間です。 RTOを設定する場合、失われることを覚悟する時間と、それにより影響を受ける収益を考慮する必要があります。 RTOは、ビジネスの種類により、大きく異なる場合があります。 例えば、公用ライブラリーがカタログ・システムを喪失した場合には、システムが復元されるまでの数日間、手動で機能を継続させることができる可能性があります。 しかし、大手のオンライン小売業者が在庫システムを喪失した場合には、10分のダウンタイム(およびこれに付随する収益減)さえ許容できないでしょう。
  • 目標復旧時点(RPO)とは、障害発生時に消失が許容されるデータ量を指します。  障害発生時にデータが損失しないよう、リモート・データセンターに継続的にデータをコピーする必要があるかもしれません。 または、5分間もしくは1時間分のデータの損失を許容する判断を行う場合もあります。

  • フェイルオーバーとは、ユーザーにとってシームレスな方法でタスクを自動的にバックアップ・システムにオフロードする、災害復旧プロセスです。 1次データセンターから、即時に引き継ぎ可能な予備システムを備えた2次サイトへフェイルオーバーすることができます。

  • フェイルバックとは、元のシステムに切り替える災害復旧プロセスです。 障害が復旧し、1次データセンターが再稼働した時点で、同じようにシームレスにフェイルバックできるようにしておく必要があります。

  • 復元とは、バックアップ・データを1次システムやデータセンターに転送するプロセスです。 復元プロセスは、一般的に災害復旧というよりもバックアップの一部とみなされます。

最後の用語は、災害復旧プロセスや災害復旧環境を管理するための選択肢を検討する上で役立つかもしれません。

  • Disaster Recovery as a Service(DRaaS)とは、災害復旧に対する管理型アプローチです。 サード・パーティーが、災害復旧に使用されるインフラストラクチャーをホストおよび管理します。 一部のDRaaSオファリングは、災害復旧プロセスを管理するツール、または組織がこれらのプロセスを管理させることを可能とするツールを提供する場合があります。
ワークロードの優先順位付け

主要な概念を理解したら、今度はそれをワークロードに適用します。 多くの組織は、各ワークロードのビジネスへの重要性を反映する、複数のRTOとRPOを設定しています。

大手銀行の場合、オンライン・バンキング・システムが重要なワークロードとなり、時間とデータの損失の最小限に抑える必要があるかもしれません。 しかし、銀行の従業員の時間管理アプリケーションは、それほど重要ではありません。 障害発生時には、当該アプリケーションを数時間または1日ダウンさせても、ビジネスに大きな悪影響は及ばないでしょう。 ワークロードをティア1、ティア2、ティア3と定義することは、災害復旧計画のフレームワークを提供する上で役立ちます。

導入オプションの評価

災害復旧計画の策定における次のステップは、導入オプションの評価です。 一部の災害復旧機能やバックアップ・データをオンプレミスで維持する必要はありますか。 パブリッククラウド・アプローチ、またはハイブリッドクラウド・アプローチからメリットを得ることはできますか。

クラウド

クラウド基盤のバックアップおよび災害復旧ソリューションは、あらゆる規模の組織の間でますます人気が高まっています。 多くのクラウド・ソリューションは、データ保管に関するインフラストラクチャーや、場合によっては、バックアップおよび災害復旧プロセスの管理に関するツールを提供しています。

クラウド基盤のバックアップや災害復旧のオファリングを選択することにより、インフラストラクチャーに対する多額の設備投資や環境管理コストを回避することができます。 さらに、地域的な災害発生時における、データを安全に維持するために必要な迅速な拡張性や地理的距離を得られます。

クラウド基盤のバックアップや災害復旧のソリューションは、オンプレミスおよびクラウド基盤の両方の実稼働環境をサポートできます。 例えば、お客様自身のデータセンターの実稼働環境を維持する一方で、クラウドにはバックアップまたは複製されたデータのみを保存するという判断もできます。 このようなハイブリッド・アプローチにより、実稼働環境を移行させることなく、拡張性や地理的距離のメリットが得られます。 「クラウドからクラウド」モデルでは、実稼働と災害復旧の両方がクラウドに配置されますが、十分な物理的分離を確保するため、異なるサイトに配置されます。

オンプレミス

場合によっては、特定のバックアップまたは災害復旧プロセスをオンプレミスで維持することが、迅速なデータの取得やITサービスの復旧に役立ちます。 厳格なデータ・プライバシーまたはデータ主権規制に準拠する必要がある場合には、一部の機密データをオンプレミスで維持することが、好ましいと思われる場合もあります。

災害復旧に関しては、完全にオンプレミス環境に依存している計画が課題となるでしょう。 自然災害や停電が発生した場合、データセンター全体(1次システムと2次システムの両方)が影響を受けます。 そのため、ほとんどの災害復旧戦略では、1次データセンターから距離的に離れた2次サイトを採用しています。 パフォーマンス、規制準拠、2次サイトへの物理的なアクセス可能性などの要素のバランスを判断した上で、町や国を超え、世界規模で別のサイトを配置してもよいでしょう。  

テクノロジー

選択する導入オプションに応じて、バックアップや災害復旧に関して採用するテクノロジーやプロセスに、いくつかの選択肢が得られます。

従来型の磁気テープ

何十年も存在しているにも関わらず、従来型の磁気テープ・ストレージは、いまだにバックアップ計画において役割を果たすことができます。 テープ・ソリューションを用いれば、確実に、かつコスト効率よく、大量のデータを保存できます。

磁気テープは、バックアップに対しては効果的ですが、ディスク・ベース・ストレージのアクセス時間の高速化を必要とする災害復旧に対しては、通常は採用されません。 また、オフサイト・ボールトから磁気テープを物理的に取り出す必要がある場合には、利用するまでに数時間または数日かかる可能性があります。

スナップショット・ベースの複製

スナップショット・ベースのバックアップは、その時点でのアプリケーションやディスクの現状を記録します。 この方法では、前回のスナップショット以降に変更されたデータのみを書き込むため、ストレージ・スペースを節約しつつデータを保護するのに役立ちます。

スナップショット・ベースの複製は、バックアップまたは災害復旧に対して使用できます。 当然ながら、データの完全性は、最新のスナップショットの完全性と同じになります。 1時間ごとにスナップショットを取るのであれば、1時間分のデータ損失を覚悟する必要があります。

継続的な複製

多くの組織は、バックアップのためだけでなく、災害復旧のための継続的な複製に移行しています。 この方法を用いれば、ディスクやアプリケーションの最新のコピーが別の場所やクラウドに継続的に複製されます。これにより、ダウンタイムを最小限に抑え、より細分化された復旧ポイントが提供されます。

関連ソリューション
クラウド災害復旧ソリューション

クラウド災害復旧計画を利用してデータを保護します。

クラウド災害復旧ソリューションの詳細はこちら
IBM Cloud® Object Storage-バックアップとリカバリー

IBM Cloud® Object Storageが、お客様のデータのために、耐久性と拡張性が高くセキュリティー機能が充実したバックアップ先を、どのように提供するのかについてご説明します。

Cloud Object Storageの詳細はこちら
参考情報 IBM Cloud Professional Site Reliability Engineer(SRE)向けの研修と認定資格

IBMが提供するプロフェッショナル・レベルの研修と認定資格により、SREとしてのスキルを向上させることができます。 IBM Cloudの環境とツールに関する知識を習得し、仮想ラボで演習を行うことができます。

データセンターとは

エンタープライズ・コンピューティングとクラウド・コンピューティングを可能にする、物理的な施設であるデータセンターについてご説明します。

次のステップ

ほとんどの組織にとって、バックアップと災害復旧の戦略は、ビジネスの健全性を維持するために必要不可欠です。IBMのクラウド災害復旧ソリューションは、戦略を評価して更新することで、複雑さとコストを制御するのに役立ちます。

IBMのクラウド災害復旧ソリューションの詳細はこちら