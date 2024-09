É possível confundir ELT com seu processo irmão conhecido por um acrônimo quase idêntico. No entanto, existem várias diferenças distintas entre ELT e ETL, que significa extrair, transformar e carregar. É um processo de integração de dados que combina dados de várias fontes de dados em um armazenamento de dados único e consistente que é carregado para um armazém de dados ou outro sistema de destino. As ferramentas ETL tradicionais foram projetadas para criar data warehousing em suporte de aplicativos de Business Intelligence (BI) e de Inteligência Artificial (IA).

ETL e ELT, quais são as diferenças?

A diferença óbvia é que o processo ELT executa a função Carregar antes da função Transformar, uma inversão da segunda e terceira etapas do processo ETL. O ELT copia ou exporta os dados dos locais de origem, mas, em vez de carregá-los em uma área de preparação para transformação, ele carrega os dados brutos diretamente no armazenamento de dados de destino para serem transformados conforme necessário. O ELT não transforma nenhum dado no trânsito.

No entanto, a ordem das etapas não é a única diferença. No ELT, o armazenamento de dados de destino pode ser um armazém de dados, mas, mais frequentemente, é um data lake, que é um armazenamento central grande projetado para manter tanto dados estruturados quanto não estruturados em grande escala.

Os data lakes são gerenciados usando uma plataforma big data (como a Apache Hadoop) ou um sistema de gerenciamento de dados noSQL distribuído. Eles podem suportar inteligência de negócios, mas, mais frequentemente, eles são criados para suportar inteligência artificial, aprendizado de máquina, análise preditiva e aplicativos orientados por dados em tempo real e fluxos de eventos.

Também existem outras diferenças entre ETL e ELT. Por exemplo, uma vez que ele transforma os dados antes de migrá-los para um repositório central, o ETL pode tornar a conformidade da privacidade de dados mais simples ou mais sistemática do que o ELT (por exemplo, se os analistas não transformarem dados sensíveis antes de precisarem usá-los, esses dados podem permanecer sem máscara no data lake). No entanto, os cientistas de dados podem preferir o ELT, que os permite testar em um "ambiente de simulação" de dados brutos e executar sua própria transformação de dados customizada para aplicativos específicos. Mas, na maioria dos casos, a opção entre ETL e ELT dependerá da opção entre recursos de negócios disponíveis e as necessidades.