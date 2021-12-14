ELT (extrair, carregar, transformar) e ETL (extrair, transformar, carregar) são processos de integração de dados que migrar dados brutos de um sistema de origem para um banco de dados de destino, como um data lake ou data warehouse. Essas fontes de dados podem estar em vários repositórios diferentes ou em sistemas legados que são então transferidos usando ELT ou ETL para um local de dados de destino.
Boletim informativo do setor
Mantenha-se atualizado sobre as tendências mais importantes e fascinantes do setor em IA, automação, dados e muito mais com o boletim informativo da Think. Consulte a declaração de privacidade da IBM.
Sua inscrição será entregue em inglês. Você pode encontrar um link para cancelar a inscrição em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa declaração de privacidade da IBM para obter mais informações.
Com o ELT, dados não estruturados são extraídos de um sistema de origem e carregados em um sistema de destino para serem transformados posteriormente, conforme necessário. Esses dados não estruturados e extraídos são disponibilizados para sistemas de business intelligence, e não há necessidade de preparação de dados. O ELT Aproveite o data warehousing para fazer transformação de dados, como validação de dados ou remoção de dados duplicados. Esses processos são atualizados em tempo real e usados para grandes quantidades de dados brutos. O ELT é um processo mais recente que não atingiu todo o seu potencial em comparação com sua irmã mais velha, ETL. O processo ELT foi originalmente baseado em scripts SQL rígidos codificados. Esses scripts SQL são mais propensos a ter possíveis erros de codificação do que os métodos mais avançados usados em ETL.
Com o ETL, dados não estruturados são extraídos de um sistema de origem e pontos de dados específicos e "chaves" em potencial são identificados antes de carregar os dados nos sistemas de destino. Em um cenário de ETL tradicional, os dados de origem são extraídos para uma área de preparação e movidos para o sistema de destino. Na área de preparação, os dados passam por um processo de transformação que organiza e limpa todos os tipos de dados. Esse processo de transformação permite que os dados agora estruturados sejam compatíveis com os sistemas de armazenamento de dados de destino. O ETL foi originalmente projetado para trabalhar com bancos de dados relacionais, que historicamente dominavam o mercado. Engenheiros de dados trabalham em processos de ETL desde a década de 1970, dando-lhes tempo para refinar significativamente os processos de ETL de ciência de dados.
No vídeo a seguir, Jamil Spain se aprofunda no ETL:
A abordagem ELT permite uma implementação mais rápida do que o processo ETL, embora os dados fiquem confusos quando são migrados. A transformação ocorre após a função de carregamento, evitando a desaceleração da migração que pode ocorrer durante esse processo. O ELT desvincula os estágios de transformação e carregamento, garantindo que um erro de codificação (ou outro erro no estágio de transformação) não interrompa o esforço de migração. Além disso, o ELT evita problemas de dimensionamento do servidor usando o poder de processamento e o tamanho do data warehouse para permitir a Transformação (ou computação Escalável) em grande escala. O ELT também trabalha com soluções de data warehouse na nuvem para suportar tipos de dados estruturados, não estruturados, semiestruturados e dados brutos.
ETL leva mais tempo para ser implementado, mas tem resultados em dados mais limpos. Esse processo é adequado para repositórios de dados de destino menores que exigem atualizações menos frequentes. A ETL também trabalha com data warehouses na nuvem usando plataformas SaaS baseadas na nuvem e data warehouse no local.
Há também muitas ferramentas de ETL comerciais e de código aberto com recursos e benefícios que incluem o seguinte:
Um processo de ELT é mais adequado em conjuntos de dados de alto volume ou ambientes de uso de dados em tempo real.
Exemplos específicos incluem os seguintes:
O ETL é mais adequado para sincronizar vários ambientes de uso de dados e migrar dados de sistemas legados.
Veja a seguir alguns exemplos específicos:
As principais diferenças entre ELT e ETL são a ordem das operações entre os dois processos que os tornam exclusivamente adequados para diferentes situações. Outras diferenças estão no tamanho dos dados e nos tipos de dados que cada processo pode manipular. Embora ELT e ETL pareçam semelhantes, sua aplicação é diferente.
Com o ELT, o processo é simplificado, pois não precisa de "chaves" ou outros identificadores para que os dados sejam transferidos e usados. O processo de ELT foi refinado e há muitas ferramentas de ELT evoluídas usadas para ajudar a migrar dados. Os tempos de carregamento são mais curtos porque o processo não tem tantas etapas a passar. A solução ELT para sistemas de business intelligence vem da necessidade de carregar dados não estruturados com rapidez. Uma solução de ELT automatizada baseada na nuvem também pode demandar um nível relativamente baixo de manutenção para oferecer suporte.
Os dados ETL oferecem mais definição desde o início, o que geralmente requer mais tempo para transferir os dados com precisão. Esse processo requer apenas atualizações periódicas de informações, em vez de atualizações em tempo real. Os tempos de carregamento do ETL são mais longos do que o ELT devido às muitas etapas no estágio de transformação que devem ocorrer antes do carregamento de dados.
A IBM oferece vários serviços e soluções de integração de dados projetados para compatibilidade com um pipeline de dados pronto para os negócios e fornecer à sua empresa as ferramentas necessárias para escalar com eficiência.
A IBM, líder em integração de dados locais e baseada em nuvem, oferece às empresas a confiança necessária ao gerenciar projetos de big data, aplicações e tecnologia de aprendizado de máquina. Com plataformas líderes do setor, como o IBM Cloud Pak for Data, as organizações podem modernizar seus processos de DataOps e, ao mesmo tempo, usar as melhores ferramentas de virtualização da categoria para alcançar a velocidade e a escalabilidade que seus negócios precisam agora e no futuro.
Para obter mais informações sobre como sua empresa pode criar e executar uma estratégia eficaz de integração de dados, explore o pacote de ofertas de integração de dados da IBM.
Inscreva-se para obter um IBMid e crie sua conta do IBM Cloud
Saiba como uma abordagem de data lakehouse aberta pode oferecer dados confiáveis e execução mais rápida para as análises de dados e projetos de IA.
IBM reconhecida como líder pelo 19.º ano consecutivo no Gartner Magic Quadrant 2024 em Ferramentas de integração de dados.
Explore o guia do líder de dados para criar uma organização baseada em dados e gerar vantagem comercial.
Descubra por que a inteligência e a integração de dados impulsionadas por IA são críticas para estimular a preparação de dados estruturados e não estruturados e acelerar os resultados da IA.
Simplifique o acesso aos dados e automatize a governança dos dados. Conheça o poder da integração de uma estratégia de data lakehouse à sua arquitetura de dados, incluindo a otimização dos custos das suas cargas de trabalho e a escala de IA, com todos os seus dados, em qualquer lugar.
Explore como a pesquisa da IBM é regularmente integrada a novos recursos do IBM® Cloud Pak for Data.
Crie e gerencie pipelines de dados de streaming inteligentes por meio de uma interface gráfica intuitiva, facilitando a integração sem dificuldades dos dados em ambientes híbridos e de multinuvem.
O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.
Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights, que traz vantagem para os negócios.
Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.