高可用性、事業継続性、バックアップ、ディザスタリカバリ IBM Cloud

高可用性(HA)は、ハードウェアの障害、ソフトウェアの問題、またはサイトレベルの中断が発生した場合でも、アプリケーションとサービスがアクセス可能で運用可能であることを保証する、ITインフラストラクチャの中核的な規律です。 高可用性の主な目的は、単一障害点を排除し、ダウンタイムを最小限に抑えてサービスの継続性を維持することである。

AIエージェントやオートメーションと大規模に連携する場合、稼働時間の維持、データの保護、予期せぬ障害への備えが不可欠となる。

このセクションでは次の内容を取り上げます。

  • バックアップの責任 : IBM、どのようなデータがバックアップされ、顧客はどのような保護責任を負うのか

  • ストレージの詳細 :バックアップの保存場所と可用性のサポート方法

  • 災害復旧戦略 :サービスが大規模な障害から復旧する方法

  • 復旧目標 :RTOとRPOの目標

  • 高可用性 : IBM Cloud はどのようにアップタイムをサポートするか

  • 可用性の目標watsonx Orchestrate はどの程度の可用性を想定して設計されていますか

  • 責任の概要 :バックアップ、復元、高可用性、および災害復旧に関する IBM およびお客様の責任の概要

これらの分野を理解することで、障害や災害が発生した場合でも、組織は迅速に復旧し、混乱を最小限に抑えることができる。

バックアップ責任

IBM Cloud のようなクラウドベースの環境では、顧客は自身のデータのバックアップとリストアを管理する全責任を負う。 この責任は、データの完全性、事業継続性、および内部要件または規制要件の遵守を確保するために不可欠である。

考慮事項

1. IBM Cloud 顧客固有のデータは自動的にバックアップされない

  • つまり、不慮の削除、破損、システム障害によってデータが失われた場合、 IBM、独自のバックアップ戦略を実施していない限り、データを復元することはできません。

2.お客様は、以下のような独自のデータ保護戦略を実施する必要があります。

  • 定期的な自動バックアップ

  • 安全なストレージ(暗号化されたクラウドストレージなど)

  • バージョニングと保持ポリシー

  • リストア手順の定期テスト

顧客データとの比較における必須データ

必須データ :これは、 watsonx Orchestrate サービスを復元および運用するために必要な、システム内部レベルの情報を指します。 これには、プラットフォームが機能するために重要な内部設定、サービス・ロジック、運用メタデータが含まれる。 IBM Cloud の災害復旧(DR)プロセスは、このデータを保護し、復元するように設計されています。

顧客データ :これには、 watsonx Orchestrate の利用中に顧客が作成またはアップロードしたコンテンツ、ファイル、設定などが含まれます。 顧客データは、 watsonx Orchestrate の運営に不可欠なものではなく、 IBM の災害復旧(DR)に関する取り組みの対象外となります。 データのバックアップはお客様の責任において行ってください。

ストレージの詳細

IBM Cloud は、マルチゾーン・リージョン(MZR)による高可用性をサポートしている。 これらのリージョンは、同一地域内の物理的に分離された複数のアベイラビリティ・ゾーンで構成されている。 詳細については、 「地域別のサービスおよびインフラの利用状況」 をご覧ください。

このセットアップにより、自動フェイルオーバーがサポートされ、ダウンタイムが短縮され、ゾーンをまたいだスケーラブルな展開が可能になる。

災害復旧戦略

災害とは、アプリケーションを著しく中断させ、意図したとおりに機能させることを妨げるあらゆる事象を指す。 それは短期的なものから長期的なものまであり、多くの場合、経済的または風評的な損害をもたらす。

一般的な災害シナリオは以下の通り:

  • 自然現象(洪水、火災、地震など)

  • インフラ障害(停電やネットワーク停止など)

  • 事故または悪意によるデータ損失

  • ソフトウェア・アップデートの不具合

どのような場合でも、災害復旧計画は、復旧コストとビジネスへの影響のバランスをとりながら、決められた時間(RTO)とデータポイント(RPO)内にサービスを復旧させるために不可欠である。

IBM Cloud 災害が発生した場合でも、数時間以内にサービスを復旧できるよう、事業継続計画を策定しています。 データのバックアップおよび関連するコンテンツのリカバリーは、お客様の責任で行っていただきます。

災害復旧には、壊滅的な中断後にシステム、アプリケーション、またはデータ・センター全体を完全な運用状態に戻すための一連のポリシー、ツール、および手順が含まれます。 これには、インストール済みシステムの重要なデータを安全な場所にコピーして保管するための手順、および操作の正常性を復元するためにそのデータをリカバリーするための手順が含まれます。 詳細については、災害復旧に関するFAQ をご参照ください。

責任

IBM とお客様の間における IBM Cloud® 製品の利用に関する責任の所在について詳しくは、 IBM Cloud 製品の責任分担」 をご覧ください。

リカバリー目標

watsonx Orchestrate データを保護し、サービス機能を復旧するための仕組みを提供します。 事業継続計画は、サービスの目標とするRPOとRTOを達成するためのものである。 IBM Cloud 災害宣言が発令されてから2時間以内にサービスを復旧させることを目指しています。 以下の表は、 watsonx Orchestrate の目標をまとめたものです。

表 1. 表1. watsonx Orchestrate の復旧目標

メトリック

定義

ターゲット値

RPO(復旧時点目標)

時間単位で測定される最大許容データ損失

2 時間

RTO(目標復旧時間)

災害後のサービス復旧に要する最大時間

2 時間

高可用性

責任の分担

高可用性は、 IBM と顧客の間で共有される責任である:

どの程度の可用性が必要ですか?

高可用性は、IT インフラストラクチャーのさまざまなレベルで、また、クラスターのさまざまなコンポーネント内で実現できます。 あなたに適した利用可能性のレベルは、以下のようないくつかの要因によって異なります:

  • アプリケーションまたはサービスのビジネス上の重要性

  • 顧客の期待と契約上のSLA

  • ダウンタイムへの耐性

  • 予算とリソースの有無

例:

  • 顧客向けのチャットボットには、 99.9 %のアップタイムが必要かもしれない。

  • 内部テストツールは、時折のダウンタイムを許容するかもしれない。

適切なHA戦略を決定するためには、復旧時間目標(RTO)と復旧時点目標(RPO)を評価する必要がある。

稼働率目標

クラスタに対して設定した可用性レベルは、 IBM Cloud の高可用性サービスレベル契約(SLA)に基づく保証範囲に影響します。

サービスレベル目標(SLO)は、 IBM Cloud サービスが満たすよう設計された目標値を規定するものです。 watsonx Orchestrate は、以下の可用性目標を達成するように設計されています。

表 2. 表2. watsonx Orchestrate のSLA

可用性目標

ターゲット値

可用性 %

99.9%

SLOは保証ではありません。また、 IBM は、目標が達成されなかった場合、クレジットを発行することはありません。 確約の内容、および確約された SLA を満たせなかった場合に発行されるクレジットについては、SLA を参照してください。 すべてのSLOの概要については、 IBM Cloud service-level-objectives をご覧ください。

責任の概要

このセクションでは、高可用性、バックアップ、および復旧に関する、お客様の責任と IBM の責任について解説します。

表 3. 表3. 職務概要

領域

IBMの責任

お客様の責任

インフラのレジリエンス(単一リージョン)

サポート

サポートされていません

同一地域内(ゾーン内)のフェイルオーバー

サポート

サポートされていません

地域内データレプリケーション

サポート

サポートされていません

データベースの自動バックアップ

サポート

サポートされていません

データベースレベルの復元( IBM サポート経由)

サポート

サポートされていません

地域間(クロスリージョン)の災害復旧

サポートされていません サポートされていません

サポートされていません サポートされていません

サポートは、その機能が文書化された範囲内で、指定された当事者によってサポートおよび管理されていることを示します。

サポートされていませんこの表示は、その機能がサポートされていないか、管理されていないことを示します。 IBM と顧客の両方にこの表示がある場合、その機能は現在利用できません。