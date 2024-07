ELT kann leicht mit dem verwandten Prozess, der zudem ganz ähnlich heißt, verwechselt werden. Es gibt jedoch einige deutliche Unterschiede zwischen ELT und dem ETL-Prozess, der für Extrahieren, Transformieren und Laden steht. Dabei handelt es sich um einen Datenintegrationsprozess, der Daten aus verschiedenen Datenquellen in einem einzigen, konsistenten Datenspeicher zusammenführt, der in ein Data-Warehouse oder ein anderes Zielsystem geladen wird. Ursprünglich wurden ETL-Tools für die Erstellung von Data Warehousing zur Unterstützung von Business-Intelligence- und Artificial-Intelligence-Anwendungen entwickelt.

ETL und ELT – wo liegen die Unterschiede?

Der offensichtliche Unterschied ist, dass der ELT-Prozess die Ladefunktion vor der Transformationsfunktion ausführt – also eine Umkehrung des zweiten und dritten Schritts des ETL-Prozesses. ELT kopiert oder exportiert die Daten von den Quellspeichern, aber anstatt sie zur Transformation in einen Staging-Bereich zu verschieben, lädt es die Rohdaten direkt in den Zieldatenspeicher, wo sie nach Bedarf transformiert werden können. ELT transformiert Daten nicht während der Übertragung.

Aber die Reihenfolge der Schritte ist nicht der einzige Unterschied. Bei ELT kann der Zieldatenspeicher ein Data-Warehouse sein, häufiger ist es jedoch ein Data-Lake, ein großer zentraler Speicher, der sowohl strukturierte als auch unstrukturierte Daten in großem Umfang speichern kann.

Data-Lakes werden mit einer Big-Data-Plattform (z. B. Apache Hadoop) oder einem verteilten NoSQL-Datenmanagementsystem verwaltet. Sie können Business Intelligence unterstützen, aber häufiger werden sie zur Unterstützung von künstlicher Intelligenz, maschinellem Lernen, Predictive Analytics und Anwendungen entwickelt, die von Echtzeitdaten und Ereignisströmen gesteuert werden.

Darüber hinaus gibt es weitere Unterschiede zwischen ETL und ELT. Da ETL Daten transformiert, bevor sie in das zentrale Repository verschoben werden, kann dieser Prozess einfacher und systematischer für die Einhaltung des Datenschutzes sorgen als ELT (z. B. wenn Analysten sensible Daten nicht transformieren, bevor sie sie verwenden müssen, könnten sie unmaskiert im Data-Lake vorliegen). Data-Scientists bevorzugen jedoch ELT, mit dem sie in einer „Sandbox“ mit Rohdaten experimentieren und ihre eigenen, auf spezifische Anwendungen zugeschnittenen Datentransformationen vornehmen können. In den meisten Fällen wird die Entscheidung zwischen ETL und ELT jedoch von den verfügbaren Unternehmensressourcen und -anforderungen abhängen.