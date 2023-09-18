データ統合にはいくつかの種類があり、それぞれに独自の長所と短所があります。データ統合の最適な方法は、組織のデータ・ニーズ、テクノロジー・ランドスケープ、パフォーマンス要件、予算の制約などの要因によって異なります。

抽出、ロード、変換（ELT）では、ソースからデータを抽出し、それをデータベースまたはデータウェアハウスにロードし、その後ビジネス・ニーズに適した形式に変換します。これには、データのクリーニング、集約、または要約が含まれる場合があります。ELTのデータ・パイプラインは、速度と拡張性が重要になるビッグデータのプロジェクトやリアルタイム処理でよく使用されます。



ELTのプロセスは、最新のデータ・ストレージ・システムの能力と拡張性に大きく依存しています。データを変換する前にデータをロードすることで、ELTはこれらのシステムの計算能力を最大限に活用します。このアプローチでは、従来の方法と比較して、より迅速なデータ処理と柔軟なデータ管理が可能になります。



ETL（抽出、変換、ロード） では、データはデータ・ストレージ・システムにロードされる前に変換されます。つまり、変換はデータ・ストレージ・システムの外部、通常は別のステージング領域で行われます。



ELTは最新のデータ・ストレージ・システムを活用しているため、パフォーマンスの点でしばしば優位に立っています。一方、ETLのデータ・パイプラインは、変換プロセスに厳密なデータ・クリーニングと検証ステップを含めることができるため、データの品質と一貫性が最も重要なシナリオでは、より良い選択となり得ます。



リアルタイム・データ統合では、ソース・システムで利用可能になったデータを取り込んで処理し、直ちにターゲット・システムに統合します。このストリーミング・データ方式は通常、リアルタイム分析、不正アクセス検知、モニタリングなど、分刻みの洞察が必要とされるシナリオで使用されます。



リアルタイム・データ統合の1つである変更データ・キャプチャー（CDC）は、ソースシステムのデータに加えられた更新をデータウェアハウスやその他のリポジトリに適用します。これらの変更は、別のデータ・リポジトリに適用したり、ETLなどのデータ統合ツールで利用可能な形式にしたりすることができます。



アプリケーション統合（API）は、シームレスなデータフローと相互運用性を確保するために、異なるソフトウェアアプリケーション間でデータを統合することを含みます。このデータ統合方法は、人事システムが財務システムと同じデータを持つようにするなど、異なるアプリケーションがデータを共有し、連携する必要があるシナリオで一般的に使用されます。



データ仮想化では、データが物理的にどこに存在するかに関係なく、異なるソースからのデータを統一表示する仮想レイヤーが作成されます。これにより、ユーザーは物理的なデータ移動を必要とせずに、オンデマンドで統合データにアクセスし、クエリーを実行できるようになります。これは、アジリティーと統合データへのリアルタイム・アクセスが重要となるシナリオで特に役立ちます。

フェデレーション・データ統合では、データは元のソース・システムに残り、必要な情報を取得するためにクエリーがこれらの異種システム間でリアルタイムで実行されます。これは、データを物理的に移動する必要がなく、分析のために仮想的にデータを統合できるシナリオに最適です。フェデレーション統合によりデータの重複は減少しますが、パフォーマンス上の問題が発生する可能性があります。