最新のETLの特長を理解するには、まず従来のアプローチから見ていくことが重要です。従来のETLは、ソース・システムからデータを抽出し、使用可能な形式に変換して、データウェアハウスなどのターゲット・システムにロードする、従来から用いられているデータ統合プロセスです。

しかし、従来のETLには、特に、今日のビッグ・データ環境においては顕著な次のような限界がいくつもあります。

夜間に実行されることの多いバッチ処理への過度な依存





静的なスキーマを前提としたオンプレミス環境向けの設計





大量かつリアルタイムの環境において拡張性を確保するのが困難

データ・エコシステムがますます複雑化する中、リアルタイムの取り込みや大規模なデータ処理を支えるために、抽出・ロード・変換（ELT）や変更データ・キャプチャー（CDC）といったアプローチが登場しています。

これらの手法は、スピード、拡張性、柔軟性を備えた次世代型アプローチである最新のETLへの大きな転換を示しています。このアナロジーに戻ると、最新のETLが頭脳だとすると、企業のデータ・スタックは神経系に相当します。最新のETLは、リアルタイムの洞察に依存するAIモデルとデータ・スタックの中核システムとの間で情報を継続的にルーティングします。

最新のETLは、クラウド・サービス、自動化、ストリーミング機能を活用し、変換済みデータをリアルタイムで提供します。Amazon Redshift、Google BigQuery、Microsoft Azure Synapseなどのツールは、このオーケストレーションを支援し、AIが企業の業務の中心的存在となる中で、より迅速な意思決定を可能にします。