6分間
データ・クラウドは、さまざまなデータ出所を統合して、組織がより効果的に使用できるようにするデータ管理システムです。
現代の企業のほとんどは、クラウド・サービス・プロバイダー(CSP)とサーバーやソフトウェアなどのオンプレミス・リソースを組み合わせた大規模で複雑なITインフラストラクチャーに依存しています。データ・クラウドは、これらのさまざまなデータ出所を統合し、データ管理の効率を高め、データの整合性を改善し、サイロ(ユーザーがアクセスしにくい分離されたデータ・コレクション)を排除するのに役立ちます。
データ・クラウドは、適切に導入されると、医療、金融サービス、マーケティング、航空宇宙などの業界の企業がデジタル・トランスフォーメーションを加速し、新しいテクノロジーの機能を活用できるように支援します。
データ・クラウドは、データ出所、データ・アーキテクチャー、データ・プラットフォーム(クラウド・データ・プラットフォームと呼ばれる)の3つのコア・コンポーネントで構成されています。ここでは、各コンポーネントとその機能について説明します。
データ出所は、元の形式のデータの集合です。顧客データの出所の一般的な例としては、取引、メールアドレス、SNSへの投稿、個人を特定できる情報(PII)(個人の名前、年齢、所在地など)などがあります。データ・クラウドが機能するには、さまざまなソースからデータを安全に収集、統合、変換、保存、管理する必要があります。
データ・アーキテクチャー(別名、データウェアハウス・アーキテクチャー)とは、データ・リポジトリーの設計のことを指し、データの収集から変換、配布、消費に至るまで、組織によるデータの管理方法を表します。企業は、ビジネスニーズに応じて、データウェアハウス、データレイク、データ・パイプライン、データ・メッシュなど、幅広いデータ・アーキテクチャーとデータ・モデルを使用しています。
データ・クラウドのデータ・アーキテクチャーには、クラウド・エコシステムでのデータの収集と処理をより効率的に行うために設計された特定のプロトコルが含まれています。例えば、多くの最新のデータ・クラウドでは、機械学習(ML)を使用してデータをより効率的に処理しています。
MLは、予測分析や、クラウド・アーキテクチャーを使用した自動意思決定などの機能を実現するのに役立ち、オンプレミスで必要なITアーキテクチャーを構築および管理するコストを回避します。ML機能は、データ・クラウドを多くの企業にとって非常にスケーラブルなソリューションにする機能の1つです。
データ・プラットフォームは、データの収集、保存、分析、ガバナンスを可能にするテクノロジー・ソリューションです。クラウド環境では、データ・プラットフォームはクラウド・データ・プラットフォームと呼ばれ、特にデータを取り込んでオンプレミスのストレージからクラウドに移動するために設計されています。
最新のクラウド・データ・プラットフォームは、組織がクラウドまたはマルチクラウド・アーキテクチャー内のデータを管理および分析し、構造化データセットと非構造化データセットの両方を最適化するのに役立ちます。
データ・クラウドは、新規顧客に関する洞察の特定から、以前は人間の入力を必要としていたタスクの自動化まで、さまざまな方法で組織を支援します。企業レベルでデータ・クラウドを実行することで得られる最も一般的なメリットは次のとおりです。
データ・クラウドにより、ITリーダーは、多数の相互接続された分断型システムではなく、単一の統合プラットフォームからデータを管理および処理できるようになります。例えば、企業内のユーザー間でデータの権限を割り当てる場合、データ・クラウドの管理者は複数の場所ではなく単一の制御ポイントを使用してポリシーを制御できるため、データ・ガバナンスとセキュリティーが向上します。
データ・クラウドを使用すると、物理的なワークスペースの外側でデータを制御および共有することができ、リモート・ワークフォースに不可欠な要素となります。データ・クラウドを使用すると、ユーザーはセキュリティー・リスクを生じさせることなく、世界中のどこからでも重要なデータに安全にアクセスできます。
また、データレイクやデータウェアハウスなどの一般的なシステム間でデータをシームレスに移動して安全かつ効率的に処理したり、Salesforce Data Cloud、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud Platform(GCP)などの一般的なデータ・クラウドプロバイダーにアクセスして、高度にスケーラブルなSoftware as a Service(SaaS)モデルで最新のデータ・クラウドソリューションを入手したりすることもできます。
データ・クラウドは、最新のデータ共有プロトコルを利用して、クラウド・ストレージ・ソリューション間のデータ交換を改善し、機能するためにデータに依存するアプリケーションのパフォーマンスを最適化します。データ・クラウドは、アプリケーション・プログラミング・インターフェース(API)を使用して、外部アプリケーションをデータベースに接続し、データの種類、形式、構造に関係なく、アプリケーションがデータを処理できるようにします。
データ・クラウド・ソリューションは、トランザクション・データや分析データ、さらには画像や動画などの非構造化データなど、アプリケーションが依存するさまざまな種類のビジネス・データを簡単に処理します。データ・クラウドのメトリクスは、IT管理者がデータ・クラウド・ソリューションの有効性を監視し、さらなる効率化とコスト削減の機会を特定するのに役立ちます。
データ・クラウドは、さまざまな種類のデータへのユーザー・アクセスを改善し、各種プロセスを合理化し、企業全体の従業員が、多くの場合単一のダッシュボードから効果的なコラボレーションに必要な情報に、安全かつセキュアにアクセスできるようにします。
強力で最新のデータ・クラウド・ソリューションを使用すると、従業員は構造化データセットと非構造化データセットの両方にアクセスし、高度な分析を適用して貴重な洞察を得ることができます。
データ・クラウドの導入には多くのメリットがある一方で、いくつかの課題もあります。具体的には、オンプレミス環境からクラウドに大量のデータを移動しようとしている組織は、データの取り込み、データの整合性、およびデータ・クラウドを操作する従業員のスキルアップという3つの共通の課題に直面しています。
大規模で多様なデータセットをクラウドに移行するということは、多くの場合、形式が異なっている可能性があり、安全に転送および管理するために異なる環境を必要とする出所からデータを移動することを意味します。このプロセスは、データ取り込みと呼ばれます。
データの取り込みでは、さまざまなデータ・ファイルがさまざまなソースから収集され、データベースにインポートされて、組織がアクセスできるようにクリーニングおよび保存されます。
さまざまな出所からのデータを、データレイクやウェアハウスなどの新しいストレージ環境に転送する前にクリーンアップまたは標準化する必要がある場合、プロセスに時間がかかったり、エラーが発生したりする可能性があります。
データの整合性(データの正確性、一貫性、完全性)を維持するために、企業はデータ転送プロセス全体を通じて高いレベルの精度を維持する必要があります。特にリスクが高い領域の1つは、複数の規制に直面しながらデータの整合性を維持することです。
データをクラウドに移動する場合、組織は地域によって異なるデータ・プライバシーに関する規制に準拠する必要があります。組織が所有および運用するインフラストラクチャー内のオンプレミスに保存されるデータは、あるコンプライアンス法によって規制されますが、そのデータがクラウドに保存される場合は、別のコンプライアンス法によって規制される可能性があります。
メタデータ(データセットの出所に関する情報)には、データに関連付けられた個人の名前、IPアドレス、物理的な場所など、機密性の高い個人情報(PII)が含まれることが多いため、悪意のある行為者に対して特に脆弱です。
オンプレミスのストレージからクラウドにデータを移動するには、クラウド・コンピューティングにおけるデータ管理の専門知識が必要であり、企業は新しい人材を雇用するか、既存のITチームを再教育する(いわゆるスキルアップ)必要があります。どちらもコストがかかり、リソースを大量に消費する可能性があります。
データ・クラウド環境で作業するためにITチームが習得する必要がある新しいスキルの一般的な例としては、データ・ガバナンスとセキュリティーへの対処、クラウドのデータ・モデリングとワークフローの習得、クラウド・ストレージ環境へのデータの取り込みと統合に関する学習などが挙げられます。
新しい革新的なアプリケーションの構築から顧客体験の向上まで、データ・クラウドは組織が最も価値のあるデータを管理および使用する新しい方法を見つけるのに役立ちます。ここでは、今日のデータ・クラウドの最も人気があり効果的なユースケースをいくつか紹介します。
クラウド・コンピューティングは現代のアプリケーション開発の中心であり、開発者はコードの記述、データベースの導入と管理、アプリケーション機能のテストをすべてクラウド内で行うことで、開発ライフサイクルを効率化できます。
データ・クラウドは、開発者がデータセットを操作し、開発中のアプリケーションに統合する方法を簡素化します。データ・クラウドは、エッジ・コンピューティングとモノのインターネット(IoT)を使用して、アプリケーションをデータ出所に近づけ、TwitchやTikTokなどの大量のリアルタイム・データ(データ・ストリームと呼ばれる)をストリーミングするアプリケーションが適切に機能できるようにします。
最新のデータ・クラウドには構造化データと非構造化データの両方が保存されるため、ユーザーはさまざまな分析目的で両方のデータ・セットを簡単かつ安全に分析できます。例えば、アナリストはデータ・クラウドを使用して、顧客関係管理(CRM)と顧客データをより深く理解し、ビジネス上の問題の解決に役立つ顧客プロファイルを作成できます。このプロセスはIDデータ検証/照合と呼ばれます。
データ・クラウドは、感情分析や、大量のテキスト・データを分析してそれが肯定的な感情を表しているか否定的な感情を表しているかを判断する顧客データ・プラットフォームの作成にも広く使用されています。
ビジネス目的で人工知能(AI)の利用を検討している組織は、AIモデルのトレーニング中に大量のデータを処理できる、集中管理された拡張性の高いデータ・ストレージ・ソリューションとしてデータ・クラウドを活用しています。最新のデータ・クラウドでは、テキスト、画像、音声、動画、感覚的データ、その他の種類のデータをすべて安全に保存し、安全な場所から簡単にアクセスできます。
マーケティングにおけるデータ・クラウド(別名、マーケティング・クラウド)は、予測分析、自然言語処理(NLP)、画像認識などの最先端のAI機能を高度なアプリケーションにプログラムできるようにするのに役立ちます。例えば、Salesforce社のAgentforceは、これまでは人間の介入が必要だった複数のビジネス機能で、データ主導のアクションを実行するAIソリューションです。1
最新のデータ・クラウドは、事業継続性災害復旧(BCDR)プロセスにおいて重要な役割を果たし、災害発生時に企業が通常業務に戻れるよう支援します。
データ・クラウドが登場する前は、異なるプラットフォーム上のストレージ間でデータを移動する必要がありましたが、企業が保存する必要のあるデータの量が増大するにつれて、このプロセスはますます困難になっていました。
データ・クラウドは、1つの接続されたインフラストラクチャーでミッションクリティカルなワークロードをホストし、高速で安全なアクセスと、堅牢な一連のセキュリティーおよびリカバリー・オプションを提供します。
無料のIBM Cloudアカウントを作成して、IBM Watson APIを含む40以上の常時無料の製品にアクセスしましょう。
IBM Cloudは、規制の多い業種・業務向けに設計されたエンタープライズ・クラウド・プラットフォームであり、オープンでAI対応のセキュアなハイブリッド・ソリューションです。
IBMのクラウド・コンサルティング・サービスで新しい機能にアクセスし、ビジネスの俊敏性を高めましょう。ハイブリッドクラウド戦略や専門家とのパートナーシップを通じて、ソリューションを共創し、デジタル・トランスフォーメーションを加速させ、パフォーマンスを最適化する方法をご覧ください。
1 「Agentforce from Salesforce—Impacts on Enterprise Data」、『Forbes』誌、2024年9月3日。