ビッグデータ分析は、非常に大規模で多様なビッグデータ・セット(構造化/半構造化/非構造化など、さまざまなソース、またテラバイトからゼタバイトまでさまざまなサイズ)に対して高度な分析手法を使用することです。
ビッグデータとは正確には何か これは、データ・セットのサイズまたはタイプが従来の、待ち時間が短い状態でデータを取り込み、管理し、処理するリレーショナル・データベースの能力を超えているデータセットとして定義できます。 ビッグデータの特徴には、大容量、高速性、多様性などがあります。 データのソースは、人工知能(AI)モバイル・デバイス、ソーシャル・メディア、モノのインターネット(IoT)によって駆動されているため、従来のデータのソースよりも複雑になっています。 例えば、さまざまなタイプのデータが、センサー、デバイス、ビデオ/オーディオ、ネットワーク、ログ・ファイル、トランザクション・アプリケーション、Web、ソーシャル・メディアから発生し、その多くがリアルタイムで非常に大規模に生成されます。
ビッグデータ分析を使用すると、最終的には、将来の成果と強化されたビジネス・インテリジェンスの意思決定、モデリング、予測をより適切かつ迅速に向上さることができます。 ビッグデータ・ソリューションを構築するときは、次のようなオープンソース・ソフトウェアを検討してください。Apache Hadoop、Apache Sparkおよび現在生成されているデータの量に対応するよう設計された、費用対効果が高く、柔軟なデータ処理とストレージのツールとしてのHadoopエコシステム全体です。
企業は、大量のデータにアクセスし、多種多様なデータ・ソースを分析して、新しい洞察を得て行動を起こすことが可能です。 小規模なものから始めて、履歴からデータをリアルタイムで処理できるように拡張していきます。
柔軟なデータ処理とストレージ・ツールは、組織が大量のデータを保存し分析する際のコスト節約に役立ちます。 ビジネスをより効率的に行うことを特定するのに役立つパターンと洞察をご覧ください。
センサー、デバイス、ビデオ、ログ、トランザクション・アプリケーション、Web、ソーシャル・メディアからのデータを分析することで、組織はデータ駆動型になります。 顧客のニーズと潜在的なリスクを測定し、新しい製品とサービスを作り出します。
Cloudera社のHadoopディストリビューションをIBMとCloudera社の製品エコシステムに統合するビッグデータ・プラットフォームで分析を加速します。
高度なデータ・クエリ用のハイブリッドSQL-on-Hadoopエンジンを使用して、異なるソースのために、待ち時間が短く、高性能の単一データベース接続を実現します。
リアルタイムのData Replicationを使用して、ダウンタイムを最小限に抑え、オンプレミス・サイトとクラウド・データ・ストレージ・サイトのHadoopディストリビューション全体でデータの一貫性を維持します。
AIモデルと機械学習モデルの構築とトレーニング、データの準備と分析をすべて、柔軟なハイブリッド・クラウド環境で行います。