A democratização de dados exige uma migração para longe da arquitetura tradicional de "dados em repouso", que é destinada ao armazenamento de dados estáticos. Tradicionalmente, os dados eram vistos como informações a serem colocadas em reserva, chamadas apenas durante interações com clientes ou execução de um programa. Atualmente, a forma como as empresas utilizam os dados é muito mais fluida; funcionários que entendem de dados usam dados em centenas de aplicativos, analisam dados para a tomada de decisão e acessam dados de vários locais.

A democratização de dados usa uma arquitetura de dados adequada ao objetivo, projetada para a maneira como as empresas atuais operam, em tempo real. Ela é distribuída tanto na nuvem quanto no local, permitindo uso extenso e movimentação entre nuvens, aplicativos e redes, bem como armazenamentos de dados em repouso. Uma arquitetura projetada para a democratização de dados tem como objetivo ser flexível, integrada, ágil e segura para permitir o uso de dados e inteligência artificial (IA) em escala. Aqui estão alguns exemplos dos tipos de arquiteturas adequadas para a democratização de dados.

Malha de dados

As arquiteturas de malha de dados são projetadas para conectar plataformas de dados às aplicações onde os usuários interagem com informações para acesso a dados em uma organização e consumo democratizado de dados. Ao aproveitar serviços de dados e APIs, uma malha de dados também pode reunir dados de sistemas legados, data lakes, data warehouses e SQL Databases, fornecendo uma visão holística do desempenho de negócios.

Os dados dentro de uma malha de dados são definidos usando metadados e podem ser armazenados em um data lake, um ambiente de armazenamento que abriga grandes armazenamentos de dados estruturados, semiestruturados e dados não estruturados para análise de dados, aprendizado de máquina e outras aplicações.

Malha de dados

Outra abordagem à democratização de dados usa uma data mesh, uma arquitetura descentralizada que organiza os dados por um domínio de negócios específico. Ele usa gráficos de conhecimento, semântica e tecnologia IA/ML para descobrir padrões em vários tipos de metadados. Em seguida, aplica esses insights para automatizar e orquestrar o ciclo de vida de dados. Em vez de lidar com operações de extração, transformação e carregamento (ETL) em um data lake, uma data mesh define os dados como um produto em vários repositórios, cada um com seu próprio domínio para gerenciar seu pipeline de dados.

Assim como a arquitetura de microsserviços, em que serviços leves são acoplados, uma data mesh usa domínios funcionais para definir parâmetros em torno dos dados. Isso permite que os usuários em toda a organização tratem os dados como um produto com acesso generalizado. Por exemplo, as equipes de marketing, vendas e atendimento ao cliente teriam seus próprios domínios, dando mais propriedade aos produtores de um determinado conjunto de dados, e ainda permitindo o compartilhamento entre diferentes equipes.

As arquiteturas de malha de dados e data mesh não são mutuamente exclusivas; eles podem até mesmo ser usadas para complementar uma à outra. Por exemplo, uma malha de dados pode tornar a data mesh mais forte porque pode automatizar processos-chave, como criar produtos de dados mais rapidamente, aplicar governança global e facilitar a orquestação da combinação de vários produtos de dados.

Leia mais: malha de dados versus data mesh: qual é a certo para você?