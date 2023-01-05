A arquitetura de dados correta pode ajudar sua organização a melhorar a qualidade de dados, pois fornece o framework que determina como os dados são coletados, transportados, armazenados, protegidos, usados e compartilhados para casos de uso de business intelligence e ciência de dados.

A primeira geração de arquiteturas de dados representada pelo data warehouse empresarial e plataformas de business intelligence foi caracterizada por milhares de trabalhos de ETL, tabelas e relatórios que apenas um pequeno grupo de engenheiros de dados especializados entendeu, resultando em um impacto positivo subrealizado no negócio. A última geração de plataformas de big data e trabalhos em lote de longa execução operados por uma equipe central de engenheiros de dados têm frequentemente levado a pântanos de data lake.

Ambas as abordagens eram arquiteturas tipicamente monolíticas e centralizadas, organizadas em torno de funções mecânicas de ingestão de dados, processamento, limpeza, agregação e veiculação de dados. Isso criou uma série de gargalos organizacionais e tecnológicos que proibiam a integração de dados e a escala em várias dimensões: mudança constante do cenário de dados, proliferação de fontes de dados e consumidores de dados, diversidade de transformação e processamento de dados que os casos de uso exigem e velocidade de resposta às mudanças.