日常業務に利用する場合でも、特定のタスクに利用する場合でも、ビジネス・データ(特にビッグデータ)用のクラウドベースのデータ・ストレージは今日において最も注目されています。
データは、顧客や潜在顧客を対象とするプログラムの作成から、製造および業務プロセスの最適化、ウイルス検査およびワクチンの開発、テスト、配布、追跡まで、多くのビジネス機能を推進します。現代のビジネスでは、必要なときに必要なデータを利用できることが求められます。ただし、ニーズに合った最適なオプションを見つけることは簡単ではなく、データのカテゴリーごとに複数の異なるリポジトリーが必要になる場合があります。
まずは基本から始め、ビジネスのニーズを満たすために1つのデータ・リポジトリーまたは複数種類のデータ・リポジトリーが必要になる可能性がある事例をいくつか見ていきましょう。
現時点で3つの異なるタイプのクラウド・ストレージ・リポジトリーが存在し、それぞれが特定のニーズに対応するための異なる目的を果たしています。
データレイクは、非構造化または半構造化された未加工データの大規模なリポジトリーです。このデータはさまざまなソースから集約され、単純に保管されます。特定の目的に合わせたり、特定のフォーマットに合わせて変更されることはありません。このデータを分析用に準備するには、時間のかかるデータ準備、クレンジング、統一性を保つための再フォーマットが必要になります。データレイクは、停電、トラフィック、犯罪、人口統計に関する情報を保管する自治体や組織にとっての優れたリソースです。データは後日、DPWや緊急サービスの予算とリソースの最新情報として使用できます。
データウェアハウスは、多数のソースからのデータを単一の集中リポジトリーに集約したもので、データ品質と形式を統一し、データサイエンティストがデータ・マイニング、人工知能(AI)、機械学習、そして最終的にはビジネス分析やビジネス・インテリジェンスに活用できるようにします。大都市では、データウェアハウスを使用して、スピード違反切符、犬の登録、納税、その他の取引など、さまざまな分野の電子取引を集約することができます。この構造化データは市によって分析され、フォローアップ請求書を発行し、国勢調査データと警察の記録を更新します。また、開発者が車載センサーによって生成されたテラバイト単位のデータを集約し、自動運転ソリューションの意思決定プロセスを支援するために使用することもできます。
データ・マートは、企業または事業単位の特定のユーザーにメリットをもたらすデータウェアハウスのサブセットです。データ・マートは、製造会社のマーケティング部門で使用され、マーケティング計画の作成を支援する理想的なターゲット層やペルソナを決定するために使用できます。また、製造部門で性能とエラー率を分析し、継続的改善を実現するために使用することもできます。データ・マート内のデータ・セットは、多くの場合、現在の分析と実行可能な成果を得るためにリアルタイムで利用されます。
3種類のクラウド・データ・リポジトリーはすべてデータを保持していますが、それぞれの間には明確な違いがあります。例えば、データウェアハウスとデータレイクはどちらも大規模なデータの集合体ですが、データレイクはほとんど構造化されていないため、一般に実装と保守のコスト効率が高くなります。
データレイク・アーキテクチャーは、大量のデータとクラウドベースのコンピューティングをサポートするために、過去数年にわたって進化してきました。セントラル・ロケーションは多数のデータ・ソースから大量のデータを受信します。
データウェアハウスは、次の3つの方法のいずれかで構造化できます。
データウェアハウス内のデータは、データレイク内のデータよりも簡単にさまざまな用途に活用できます。その理由は、データウェアハウスが構造化されており、より簡単にマイニングや分析ができるためです。
一方、データ・マートは、データレイクやデータウェアハウスに比べてデータ量が少なく、特定の用途や人口統計、事業単位ごとにデータが分類されています。データ・マートは、データの論理構造によって定義されるさまざまな形式(スター、スノーフレーク、ボールト)が存在します。ボールト構造は他の形式よりもアジャイルかつ柔軟でスケーラブルです。
データ・マートには、次の3つのタイプがあります。
選択するデータ・リポジトリーのタイプとその構造は、ビジネスのニーズと要求に大きく依存します。あなたのビジネスにとって意味がある場合は、柔軟性、拡張性、そして問題解決と意思決定に対するより広範な情報に基づくアプローチを実現するために、ハイブリッドクラウド・ベースのストレージのメリットを活かしてください。
ある大手多国籍製造会社は、さまざまな用途のために大量のデータを生成しています。データの中には重要なものもあれば、将来的に目的が生まれるものも、そうでないものも存在します。同社は、バルク・データのストレージにクラウドベースのデータウェアハウスを使用していますが、これは他のデータ・ストレージよりも低コストです。ただし、同社はビジネスの特定分野に依存するデータ・マートも導入しており、財務、製造、マーケティングなどの部門のビジネス・ユーザーに価値を提供しています。これらの各マートには、分析しやすいように形式化された、特定の用途向けに指定されたデータが含まれています。例:
大規模な自治体では、手頃な価格で、ある程度使いやすい方法でデータを提供する手頃なソリューションが必要です。同自治体は、クラウド上のデータレイクを使用して交通データを管理しています。現時点ではそのデータを分析して対策を講じる余裕はありませんが、資金が確保できれば準備が整うと見られています。また、オンプレミスのソフトウェア・データウェアハウスを使用して、税金の請求ステータスを追跡しています。さらに、同自治体はハイブリッド・データ・マートを使用して住民間のウイルスの蔓延を追跡し、様々な病院や自治体の医療サービスからのデータを単一のリポジトリに集約して、保健局が分析および利用できるようにしています。
クラウドベースのデータ・リポジトリーには多くの誤解があります。最もよくある誤解には、次のようなものがあります。
各ビジネスは、固有のリソース、目標、課題を備えたユニークな存在です。選択肢を慎重に評価して、ニーズに最適なソリューションを決定しましょう。次のポイントを考慮してください。
これらの考慮事項は、どのソリューションまたはソリューションの組み合わせが目標達成に役立つかを判断するのに役立ちます。
IBMは、クラウド・ストレージとデータサイエンスのニーズを満たすためのいくつかのソリューションを提供しています。