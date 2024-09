Como mencionado anteriormente, os data lakehouses combinam os melhores recursos dos data warehouses com os mais otimizados dos data lakes. Ele aproveita estruturas de dados semelhantes dos data warehouses e as combina com o armazenamento de baixo custo e a flexibilidade dos data lakes, permitindo que as organizações armazenem e acessem big data de forma rápida e mais eficiente, ao mesmo tempo em que lhes permite mitigar potenciais problemas de qualidade de dados. Ele suporta conjuntos de dados diversos, ou seja, tanto dados estruturados quanto não estruturados, atendendo às necessidades de fluxos de trabalho de business intelligence e ciência de dados. Ele geralmente suporta linguagens de programação como Python, R e SQL de alta performance.

Data lakehouses também suportam transações ACID em cargas de trabalho de dados maiores. ACID significa atomicidade, consistência, isolamento e durabilidade; todas propriedades essenciais que definem uma transação para garantir a integridade dos dados.A atomicidade pode ser definida como a realização de todas as alterações em dados como se constituíssem uma única ação. Consistência é quando os dados estão em um estado consistente quando uma transação começa e quando ela termina. Isolamento refere-se ao estado intermediário da transação sendo invisível para outras transações. Como resultado, transações que são executadas simultaneamente parecem ser serializadas. Durabilidade é quando, após uma transação ser concluída com sucesso, as alterações nos dados persistem e não são desfeitas, mesmo no caso de uma falha do sistema.Esta característica é crítica para garantir a consistência dos dados à medida que múltiplos usuários leem e escrevem dados simultaneamente.