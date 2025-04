Beim Aufbau einer Pipeline automatisiert ein Data Engineer die Integration mit Skripten – Codezeilen, die sich wiederholende Aufgaben ausführen. Je nach Bedarf ihres Unternehmens konstruieren Data Engineers Pipelines in einem von zwei Formaten: ETL oder ELT.

ETL: Extrahieren, Transformieren, Laden. ETL-Pipelines automatisieren das Abrufen und die Speicherung von Daten in einer Datenbank. Die Rohdaten werden aus der Quelle extrahiert, durch Skripte in ein standardisiertes Format umgewandelt und dann in ein Speicherziel geladen. ETL ist die am häufigsten verwendete Methode zur Datenintegration, insbesondere beim Zusammenführen von Daten aus mehreren Quellen in einem einheitlichen Format.

ELT: extrahieren, laden, transformieren. ELT-Pipelines extrahieren Rohdaten und importieren sie in ein zentrales Repository, bevor sie durch Transformation standardisiert werden. Die gesammelten Daten können später je nach Bedarf formatiert werden und bieten so ein höheres Maß an Flexibilität als ELT-Pipelines.