データ・ストレージとは、進行中または将来のオペレーションのためにデジタル情報を記録および保存する磁気、光学、または機械メディアのことを指します。
デジタル情報には、入力データと出力データの2種類があります。ユーザーが入力データを提供し、コンピューターが出力データを提供します。ただし、コンピューターのCPUは、ユーザーからの入力がなければ何も計算できず、出力データを生成することもできません。
ユーザーはデータをコンピューターに直接入力できます。しかし、コンピューター時代の早い段階で、データを手動で入力し続けると、時間とエネルギーの負担が莫大になることに気付きました。短期的な解決策の1つは、ランダム・アクセス・メモリー (RAM) とも呼ばれるコンピューター・メモリーを使用することです。ただし、ストレージ容量とメモリーの保持には限界があります。読み取り専用メモリー (ROM) は、その名のとおり、データを読み取ることはできますが、必ずしも編集できるわけではありません。これは、コンピューターの基本的な機能を制御します
データ・ストレージ・スペースがあれば、ユーザーはデータをデバイスに保存できます。コンピューターの電源が切れても、データは保持されます。ユーザーは、データをコンピューターに手動で入力する代わりに、ストレージデバイスからデータを取得するようにコンピューターに指示できます。コンピューターは必要に応じてさまざまなソースから入力データを読み取り、出力を作成して同じソースまたは他のストレージ場所に保存できます。また、データ・ストレージを他のユーザーと共有することもできます。
今日、組織とユーザーは、 ビッグデータ分析 、 人工知能(AI)、機械学習(ML)、、モノのインターネット(IoT)など、高度なコンピューティングのニーズを満たすデータ・ストレージを必要としています。膨大なデータ・ストレージが必要になるもう1つの理由は、災害、障害、不正行為によるデータ損失を防ぐことです。データ損失を避けるため、組織はデータ・ストレージをバックアップおよび復元ソリューションとして利用することもできます。
簡単に言うと、最新のコンピューターや端末は、直接またはネットワークを介してストレージ・デバイスに接続します。ユーザーはコンピュータに対し、これらのストレージ・デバイスからデータにアクセスし、また保存するよう指示します。根本的なところにおいて、データ・ストレージの基盤は2つであり、1つはデータを取得する形式で、もう1つはデータを記録して保管するデバイスです。
どのようなデータ形式であれ、データを保管するには、データ・ストレージが必要です。データ・ストレージには、主にダイレクト・エリア・ストレージとネットワークベース・ストレージという2つのカテゴリーがあります。
ダイレクト・エリア・ストレージは、直接接続ストレージ(DAS)とも呼ばれ、その名の通り直接接続されます。多くの場合、このストレージは、そこにアクセスするコンピューティング・マシンのすぐ近くにあり、直接接続されています。ストレージに接続されているのはこのマシンのみということもよくあります。DASはある程度のローカル・バックアップ・サービスも提供できますが、共有には限界があります。DASデバイスには、フロッピーディスク、光ディスク(コンパクト・ディスク(CD)およびデジタル・ビデオ・ディスク(DVD))、ハード・ディスク・ドライブ(HDD)、フラッシュドライブ、ソリッドステート・ドライブ(SSD)などがあります。
ネットワーク・ベースのストレージは、複数のコンピューターがネットワークを通じてアクセスできるため、データの共有とコラボレーションが容易になります。また、そのオフサイト・ストレージ機能により、バックアップやデータ保護にも適しています。典型的なネットワーク・ベースのストレージ設定は、ネットワーク接続ストレージ(NAS)とストレージ・エリア・ネットワーク(SAN)の2つです。
NASは、冗長ストレージ・コンテナまたは独立ディスクの冗長アレイ(RAID)で構成され、多くの場合は単一のデバイスです。 SANストレージは、SSDやフラッシュ・ストレージ、ハイブリッド・ストレージ、ハイブリッドクラウド・ストレージ、クラウド・ストレージ、バックアップ・ソフトウェアやアプライアンスなど、さまざまなタイプのデバイスを複数組み合わせたネットワークです。
NASとSANの違いは次のとおりです。
NAS
SAN
フラッシュ・ストレージは、データの書き込みや保管にフラッシュ・メモリー・チップを使用するソリッドステート・テクノロジーです。ソリッドステート・ディスク(SSD)フラッシュ・ドライブは、フラッシュ・メモリーを使用してデータを保管します。ハードディスク・ドライブ(HDD)と比較して、ソリッドステート・システムには可動部品がないため、レイテンシーが少なく、必要なSSDの数が少なくて済みます。最新のSSDの大半はフラッシュ・ベースのため、フラッシュ・ストレージはソリッドステート・システムの同義語となっています。
SSDとフラッシュはHDDよりも高いスループットを提供しますが、オールフラッシュ・ストレージはより高価になる可能性があります。多くの組織では、フラッシュのスピードとハード・ディスクの容量、この両方のメリットを組み合わせたハイブリッド・アプローチを採用しています。バランスのとれたストレージ・インフラストラクチャーを備えることで、企業は、さまざまなストレージ・ニーズに適切なテクノロジーを適用できます。ハイブリッド・ストレージは、完全にフラッシュに切り替えずに既存のHDDから移行する、経済的な方法を提供します。
クラウド・ストレージは、オンプレミスのハード・ディスクやストレージ・ネットワークにファイルを保存するのに代わる、コスト効率が高く、スケーラブルな代替手段を提供します。 Google Cloud、Microsoft Azure、IBM Cloud、Amazon Web Services(AWS)などのクラウド・サービス・プロバイダー(CSP)を利用すると、データやファイルをオフサイトの場所に保存でき、パブリック・インターネットまたは専用のプライベート・インターネット接続を介してアクセスできます。プロバイダーはサーバーと関連インフラストラクチャーをホスト、保護、管理、保守し、必要なときにいつでもデータにアクセスできるようにします。
ハイブリッドクラウド・ストレージとは、プライベートクラウドとパブリッククラウドの要素を組み合わせたものです。ハイブリッドクラウド・ストレージでは、データを保管するクラウドを組織が選択できます。例えば、アーカイブや複製の要件が厳格な、規制の厳しいデータはプライベートクラウド環境がより適している一方、機密性の低いデータはパブリッククラウドに保管できます。ハイブリッドクラウドを利用して、社内のストレージ・ネットワークをパブリッククラウドのストレージで補完する組織もあります。
バックアップ用のストレージとアプライアンスは、災害、障害、または不正によるデータ損失を防止します。これらはデータとアプリケーションのコピーを別のセカンダリー・デバイスに定期的に作成し、そのコピーを災害復旧に使用します。バックアップ・アプライアンスは、HDDやSSDからテープ・ドライブやサーバーまで多岐にわたります。
クラウド・サービス・プロバイダー(CSP)は、BaaS(バックアップ・アズ・ア・サービス)と呼ばれる、バックアップ・ストレージのサービスも提供しています。ほとんどのアズ・ア・サービス・ソリューションと同様に、BaaSは遠隔地へのデータ保存と拡張性を備えた、低コストのデータ保護オプションを提供します。
データは主にファイル・ストレージ、ブロック・ストレージ、オブジェクト・ストレージという3つの形態で記録・保存できます。
データ・ストレージの種類に関する詳細な比較については、「オブジェクト、ファイル、ブロック・ストレージの違いとは」を参照するとともに、次の動画をご覧ください。
ファイル・ストレージ(ファイル・ベースのストレージ)は、データの編成と保存に使用される階層型ストレージの手法です。言い換えれば、データはファイルに保存され、フォルダーで整理され、それらがディレクトリーとサブディレクトリーの階層の下に整理されます。
ブロック・ストレージは、ブロック・レベル・ストレージとも呼ばれ、データをブロックに保存する技術です。各ブロックは別々に保存され、それぞれのブロックが一意の識別子を持ちます。開発者は、計算処理において、高速かつ効率的で信頼性の高いデータ転送が必要な場合に、ブロック・ストレージを好んで使用します。
オブジェクト・ストレージは、オブジェクト・ベース・ストレージとも呼ばれ、大量の非構造化データを処理するデータ・ストレージ・アーキテクチャーです。非構造化データは、行と列を待つ従来型のリレーショナル・データベースに準拠していないか、あるいは、同データベースに簡単に組み込むことができません。こうしたデータの例としては、Eメール、ビデオ、写真、Webページ、オーディオ・ファイル、センサー・データ、およびその他のメディアとWebコンテンツ(テキストまたは非テキスト)が挙げられます。他のユースケースとしては、クラウドネイティブ・アプリケーションを構築したり、クラウドを活用したオブジェクト・ストレージを永続データ・ストアとして使用して、レガシー・アプリケーションを次世代のクラウド・アプリケーションに変換したりといったものがあります。
コンピュータ・メモリーとローカル・ストレージは、エンタープライズ・アプリケーション向けに十分なストレージ、ストレージ保護、複数のユーザーのアクセス、速度、およびパフォーマンスを提供できない場合があります。そのため、ほとんどの組織では、ネットワーク接続ストレージ(NAS)システムに加えて、何らかの形のストレージ・エリア・ネットワーク(SAN)を採用しています。
ストレージ・エリア・ネットワーク(SAN)は、サーバーの背後にあるネットワークと呼ばれることもあり、サーバーとストレージ・デバイスを接続する特殊な高速ネットワークです。物理接続を提供する通信インフラストラクチャーで構成されており、スイッチやディレクターなどの相互接続されたエレメントを使用して、any-to-any型デバイスがネットワークをブリッジできます。
SANは、ストレージ・バスの概念の拡張とも見なせます。この概念により、ストレージ・デバイスとサーバーは、ローカル・エリア・ネットワーク(LAN)や広域ネットワーク(WAN)などと同様のエレメントを使用して相互接続できます。また、SANには、ストレージ要素、コンピューター・システムを整理する管理層も含まれています。この管理層により、安全で堅牢なデータ転送が保証されます。
従来、サーバーに接続できるストレージ・デバイスの台数は限られていました。しかしSANがネットワークに柔軟性をもたらし、1台のサーバーでも、異種サーバーが複数のデータセンターにまたがっていても、ストレージ・ユーティリティーを共用できるようになりました。SANにより、サーバーとストレージ間の従来型の専用接続が不要になります。また、サーバーがストレージ・デバイスを効果的に所有および管理するという概念も排除できます。そのため、ネットワークにはディスク、磁気テープ、光ストレージなどの多数のストレージ・デバイスが含まれていることがあり、ストレージ・ユーティリティーは、使用するサーバーから遠く離れた場所に位置する場合があります。
ストレージ・インフラストラクチャーは、情報が依存する基盤です。したがって、企業のビジネス目標とビジネス・モデルをサポートするものでなければなりません。SANインフラストラクチャーにより、ネットワークの可用性、データへのアクセス性、システム管理性が向上します。こうした環境においては、単にストレージデバイスを増設したり高速化したりするだけでは不十分です。優れたSANは、優れた設計から始まります。
SANの導入において最初に考慮すべき要素は、ストレージとサーバ・コンポーネントの接続です。通常は、高速データ転送テクノロジーであるファイバー・チャネルを使用します。SANはLANと同様に、ストレージ・インターフェースをさまざまなネットワーク構成に、また長距離にわたって相互接続します
。サーバー・インフラストラクチャーは、すべてのSANソリューションの基盤となります。このインフラストラクチャーにはサーバー・プラットフォームが混在しています。サーバー統合やeコマースなどの取り組みによりSANの必要性が高まり、ネットワーク・ストレージの重要性が増しています。
ストレージ・システムは、ディスク・システムと磁気テープ・システムで構成されています。ディスク・システムには、HDD、SSD、フラッシュ・ドライブなどが含まれています。テープ・システムは、磁気テープ・ドライブ、磁気テープ・オートローダー、磁気テープ・ライブラリーで構成されています。
SANの接続は、ストレージ・デバイスとサーバーを相互接続するハードウェアとソフトウェアのコンポーネントで構成されます。ハードウェアには、ハブ、スイッチ、ディレクター、ルーターなどがあります。
今日、データ・ストレージは、データ管理の俊敏性と効率を高めるソフトウェア定義ストレージ(SDS)やその関連技術を中心としたソフトウェア・アプローチへと進化しています。 Tech Navioのレポートによると、世界のソフトウェア定義ストレージ(SDS)市場規模は、2024年から2029年にかけて1,050億7,000万米ドル成長すると推定されています。1
ソフトウェア定義ストレージ(SDS)はデータ・ストレージの一種で、ソフトウェア層がストレージ・リソースを、基盤となる物理ストレージ・ハードウェア・インフラストラクチャーから分離します。SDSでは仮想化を用いて、ストレージ・リソースの統合プールを作成し、これを自動または手動でAPIダッシュボードを通じて動的に割り当てることができます。
従来のNASやSANシステムとは異なり、SDSは複雑な デジタル・トランスフォーメーションのプロセスに対応できる柔軟性を備えています。例えば、SDSはプロビジョニング、監視、トラブルシューティングに関連するワークロードを自動化することで、ストレージ管理関連のタスクを大幅に効率化できます。
ストレージ仮想化とは、複数のストレージ・システムから物理ストレージ・リソースをプールすることで、すべてのストレージが1つのデバイスに保管されているように見せることを指します。これに対し、SDSはストレージ・サービスを抽象化し、デバイス自体から分離します。ユーザーはコンソールを介してストレージ仮想化を管理することで、仮想化されたサーバーおよびデスクトップ環境におけるデータとストレージ・リソースのセキュリティー、信頼性、効率性を確保します。
ハイパーコンバージド・ストレージとは、SDSリソースがハイパーコンバージド・インフラストラクチャー(HCI) 内でプールおよび管理されるデータ・ストレージ・アーキテクチャーです。
ハイパーコンバージド・ストレージは、すべてのストレージをコンピューティングおよびネットワーク機能とともにHCIスタックに直接統合します。HCI は仮想化を通じて、ストレージ・リソースを個々のハードウェアから切り離し、ハイパーコンバージド・ストレージを従来のストレージ・ソリューションよりもはるかに柔軟でスケーラブルなものにします。
データ・ストレージ・セキュリティーは、オンプレミスおよびクラウドベース環境のデータをデータ侵害、サイバー攻撃、その他のセキュリティー脅威から保護します。
データ侵害はコストがかかり、企業のビジネスにとって継続的な問題となっています。IBMのデータ侵害のコストに関する調査2023によると、この年のデータ侵害の世界平均コストは445万米ドルで、3年間で15%増加しました。また同レポートでは、セキュリティー向けのAIとオートメーションを広範に使用している組織は、使用していない組織と比較して平均176万米ドル節約できていることも明らかになりました。
企業は、データ・ストレージの可視性を高めるため、データ・セキュリティー対策を導入しています。ストレージのセキュリティーに関するハードウェアおよびソフトウェア機能には、特別な権限、暗号化、データ・マスキング、機密ファイルの編集などがあります。最新のセキュリティー・ストレージ・ソフトウェア・ソリューションは、監査を合理化し、規制要件に準拠するために、レポート作成の自動化も支援します。
さらに、サイバー・レジリエンス(組織がサイバーセキュリティー・インシデントを予防し、抵抗し、回復する能力)は、データ・ストレージのセキュリティにおいて不可欠な要素となっています。サイバー・レジリエンスは、事業継続・災害復旧(BCDR)、情報システム・セキュリティー、そして組織的レジリエンスを組み合わせることで、データ・セキュリティーを新たなレベルに引き上げ、組織が脅威に対応しデータを保護できるよう後押しします。
現在、記録の保存やデータ完全性の維持が求められる業界(医療、官公庁・自治体など)では、変更不可能ストレージを選択できます。変更不可能ストレージは、あらかじめ定められた期間または無期限にわたってデータの変更や改ざんを防ぎます。このようなファイル・システムでは、いったん作成されたデータは繰り返しアクセスできますが修正はできないため、データの改ざん、サイバー攻撃、ランサムウェアからの保護に役立ちます。
IBM Storage DS8000は、IBM zSystemsおよびIBM Powerサーバー用の、最も高速で信頼性が高くセキュアなストレージ・システムです。
IBM Storageは、データ・ストレージ・ハードウェア、ソフトウェア定義ストレージ、およびストレージ管理ソフトウェアの製品群です。
IBMは、Webサーバーやデータセンター・インフラストラクチャーに対する事前対応型のサポートを提供しており、ダウンタイムの削減と、ITの可用性の向上を支援します。
1 Software-Defined Storage (SDS) Market size is set to grow by USD 105.07 billion 2024–2028, Surge in cloud adoption boosts the market (ibm.com外部へのリンク), Technavio, June 24, 2024.