ETL e ELT são apenas dois métodos de integração de dados, e existem outras abordagens que também são usadas para facilitar os fluxos de trabalho de integração de dados. Alguns deles incluem:
- Captura de dados de mudança (CDC)
- Data Replication
- A virtualização de dados
- A integração de dados de fluxo (SDI)
Captura de dados de mudança (CDC)
Identifica e captura apenas os dados de origem que foram alterados e move esses dados para o sistema de destino.
A CDC pode ser usada para reduzir os recursos necessários durante a etapa de "extração" de ETL; ele também pode ser usado de forma independente para mover dados que foram transformados em um data lake ou outro repositório em tempo real.
Data Replication
Copia as alterações nas fontes de dados em tempo real ou em lotes para um banco de dados central.
Data Replication é frequentemente listada como um método de integração de dados. Na verdade, ele é usado com mais frequência para criar backups para recuperação de desastres.
A virtualização de dados
Usa uma camada de abstração de software para criar uma visão unificada, integrada e totalmente utilizável dos dados, sem copiar, transformar ou carregar fisicamente os dados de origem em um sistema de destino.
A funcionalidade de virtualização de dados permite que uma organização crie data warehouses virtuais, data lakes e data marts a partir dos mesmos dados de origem para armazenamento de dados sem o custo e a complexidade de construir e gerenciar plataformas separadas para cada um. Embora a virtualização de dados possa ser usada em conjunto com o ETL, ela é cada vez mais vista como uma alternativa ao ETL e a outros métodos físicos de integração de dados.
A integração de dados de fluxo (SDI)
É exatamente o que parece: consome continuamente fluxos de dados em tempo real, transforma-os e carrega-os em um sistema de destino para análise.
A palavra-chave aqui é continuamente. Em vez de integrar instantâneos de dados extraídos de fontes em um determinado momento, a SDI integra dados constantemente à medida que eles se tornam disponíveis. A SDI permite um armazenamento de dados para potencializar a análise, o aprendizado de máquina e os aplicativos em tempo real para melhorar a experiência do cliente, a detecção de fraudes e muito mais.