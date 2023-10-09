A arquitetura de plataforma de dados tem uma história interessante. Na virada do milênio, as empresas começaram a perceber que a carga de trabalho de relatórios e business intelligence exigia uma nova solução em vez das aplicações transacionais. Surgiu uma plataforma de leitura otimizada que pode integrar dados de várias aplicações. Era o data warehouse.

Em outra década, a internet e os dispositivos móveis começaram a gerar dados de volume, variedade e velocidade imprevistos. Era necessária uma solução de plataforma de dados diferente. Assim, surgiu o data lake, que lida com dados estruturados e não estruturados com um grande volume.

Mais uma década se passou. E ficou claro que o data lake e o data warehouse não são mais suficientes para lidar com a complexidade dos negócios e a nova carga de trabalho das empresas. É muito caro. O valor dos projetos de dados é difícil de realizar. As plataformas de dados são difíceis de alterar. O tempo exigia uma nova solução, novamente.

Adivinhe? Desta vez, pelo menos três soluções diferentes de plataformas de dados estão surgindo: data lakehouse, malha de dados e data mesh. Embora isso seja encorajador, também está criando confusão no mercado. Os conceitos e valores estão sobrepostos. Às vezes, surgem diferentes interpretações dependendo de quem está sendo consultado.

Este artigo visa aliviar essas confusões. Os conceitos serão explicados. E então será introduzido um framework que mostrará como esses três conceitos podem se interligar ou ser usados em conjunto.