La diferencia obvia es que el proceso ELT realiza la función Cargar antes que la función Transformar, una inversión del segundo y tercer paso del proceso ETL. ELT copia o exporta los datos desde las ubicaciones de origen, pero en lugar de moverlos a un área de preparación para la transformación, carga los datos sin procesar directamente en el almacén de datos de destino, donde se pueden transformar según sea necesario. ELT no transforma ningún dato en tránsito.
Sin embargo, el orden de los pasos no es la única diferencia. En ELT, el almacén de datos de destino puede ser un almacén de datos, pero más a menudo es un lago de datos, que es un gran almacén central diseñado para contener datos estructurados y no estructurados a escala masiva.
Los lagos de datos se gestionan mediante una plataforma de big data (como Apache Hadoop) o un sistema de gestión de datos NoSQL distribuido. Pueden admitir business intelligence, pero, con mayor frecuencia, se crean para admitir inteligencia artificial, machine learning, analytics predictivos y aplicaciones impulsadas por datos en tiempo real y flujos de eventos.
También existen otras diferencias entre ETL y ELT. Por ejemplo, debido a que transforma los datos antes de moverlos al repositorio central, ETL puede hacer que el cumplimiento de la privacidad de los datos sea más simple, o más sistemático, que ELT (por ejemplo, si los analistas no transforman los datos confidenciales antes de que necesiten usarlos, podrían quedar desenmascarados en el lago de datos). Sin embargo, los científicos de datos podrían preferir ELT, que les permite experimentar en un “sandbox” de datos sin procesar y hacer su propia transformación de datos de datos adaptada a aplicaciones específicas. Pero, en la mayoría de los casos, la elección entre ETL y ELT dependerá de la elección entre los recursos comerciales disponibles y las necesidades.