A ascensão da modernização da nuvem não vai reduzir necessariamente a complexidade ou os custos, remover silos de dados ou gerenciar a governança e a conformidade. Na verdade, as pesquisas mostram que 68% dos dados não são utilizados.¹
E aí que entra a malha de dados, uma abordagem de arquitetura para simplificar o acesso a dados e facilitar o consumo democratizado de dados para uma melhor tomada de decisão. Uma malha de dados inclui os controles apropriados para dar suporte aos fluxos de dados, processos e consumidores necessários desses dados dentro de uma organização. Essa moderna arquitetura de dados facilita a integração ponta a ponta de vários pipelines de dados e ambientes de nuvem por meio de recursos inteligentes e automatizados.
A base de uma malha de dados são metadados ativos federados, geralmente chamados de dados que descrevem dados. Bancos de dados ou fontes e destinos de dados também são componentes essenciais. Essas fontes precisam ser selecionadas com base em suas capacidades para suportar qualquer carga de trabalho necessária, seja ela transacional, operacional ou processamento transacional e analítico híbrido, envolvendo IA, business intelligence, relatórios ou análise de dados avançada.
“Os clientes podem ter até nove tipos de bancos de dados diferentes e muitas instâncias em cada um. Uma malha de dados organiza os silos e a fragmentação de dados que os clientes tentam gerenciar”, explicar Edward Calvesbert, líder de produto do portfólio de banco de dados da IBM.
Por meio de uma camada de virtualização, a malha de dados reúne dados em tempo real de diversas fontes, incluindo sistemas existentes, bancos de dados, data lakes, data warehouses, edge e repositórios na memória. Essas fontes podem executar cargas de trabalho transacionais, operacionais ou analíticas e armazenar tipos de dados estruturados e não estruturados. Essa orquestração fornece um alcance centralizado em todos os pontos do ambiente de dados.
Com recursos de ponta a ponta, uma malha de dados ajuda a garantir que dados de diversas fontes possam ser combinados, acessados e controlados com sucesso para que os usuários corporativos, cientistas de dados, engenheiros de dados e analistas de dados utilizem os dados de maneira eficaz. Também permite a inovação em escala em áreas como IA, fornecendo conjuntos de dados governados para alimentar as aplicações de IA.