O que é malha de dados?

Um gráfico 3D de cubos azuis e retângulos em um fundo branco.

Autores

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

O que é malha de dados?

Uma malha de dados é uma arquitetura de dados moderna projetada para democratizar o acesso a dados em toda uma organização. Ela usa sistemas inteligentes e automatizados para derrubar silos, gerenciar ativos de dados e otimizar o gerenciamento de dados em escala.

Ao longo da última década, os avanços na nuvem híbridainteligência artificial, a Internet das coisas (IoT) e edge computing impulsionaram o crescimento exponencial dos big data. Esse aumento criou ambientes de dados cada vez mais complexos, com vastos volumes de dados espalhados por unidades de negócios díspares.

De acordo com um estudo de 2025 do IBM Institute for Business Value (IBV), 50% dos CEOs afirmam que sua organização desconectou a tecnologia devido ao ritmo dos investimentos recentes. Como resultado, a unificação e a governança de dados tornaram-se críticas para superar desafios como silos, riscos de segurança e gargalos na tomada de decisão.

Uma malha de dados oferece gerenciamento de dados integrado de ponta a ponta, com compatibilidade com aprendizado de máquina (ML), metadados ativos, interfaces de programação de aplicativos (APIs) e outras tecnologias.

Não é um software, mas sim uma abordagem de design que cria uma visão unificada dos dados nos ambientes multinuvem e no local de uma organização, a partir de data lakesdata warehousesSQL databases e outras fontes. Com essa abordagem, as organizações não precisam migrar dados distribuídos para um único local ou armazenamento de dados, nem precisam adotar uma abordagem completamente descentralizada.

Esses recursos fundamentais não apenas lidam com os silos de dados e os crescentes volumes de dados, mas também permitem acesso a dados de autoatendimento para usuários corporativos. O resultado é uma rede de dados em tempo real e dados históricos de alta qualidade que aceleram as iniciativas de transformação digital e business intelligence (BI) em todas as empresas, enquanto a governança automatizada garante uma estratégia de dados segura e em conformidade.

Para que são usadas as malhas de dados?

Para muitas organizações, o crescimento explosivo de dados (de dados estruturados, semiestruturados e não estruturados) superou as abordagens tradicionais de gerenciamento de dados. Esse desafio é intensificado pela proliferação de data warehouses, data lakes e ambientes de nuvem híbrida.

Esses sistemas de armazenamento geralmente são aproveitados como soluções de baixo custo para grandes quantidades de dados. No entanto, muitas vezes não possuem um gerenciamento de metadados adequado, o que torna os dados difíceis de localizar, interpretar e usar de forma eficaz.

Dados isolados aumentam essa complexidade. Historicamente, uma empresa pode ter plataformas de dados separadas para informações de RH, cadeia de suprimentos e clientes, cada uma operando isoladamente, apesar da sobreposição de tipos e necessidades de dados.

Esses desafios levam a enormes acúmulos de dados obscuros — informações que são negligenciadas, consideradas não confiáveis e que, por fim, não são utilizadas. Na verdade, estima-se que 60% dos dados corporativos permanecem sem análise.1

As empresas usam malhas de dados para lidar com esses desafios. A arquitetura moderna unifica dados, automatiza a governança e permite acesso a dados de autoatendimento em escala. Ao conectar dados em sistemas díspares, a malha de dados capacita os tomadores de decisão a fazer conexões que antes estavam ocultas e obter resultados de negócios mais valiosos a partir de dados que, de outra forma, não seriam utilizados.

Além das vantagens de democratização e tomada de decisão, as soluções de malhas de dados também estão se mostrando essenciais para os fluxos de trabalho de IA empresariais. De acordo com estudos de 2024 do IBM IBV, 67% dos CFOs afirmam que sua diretoria executiva tem os dados necessários para aproveitar rapidamente em novas tecnologias. Porém,apenas 29% dos líderes de tecnologia concordam fortemente que seus dados têm a qualidade, a acessibilidade e a segurança necessárias para escalar com eficiência a IA generativa.

Com uma malha de dados, as organizações podem criar com mais facilidade uma infraestrutura de dados confiável para entrega de dados a seus sistemas de IA, com requisitos de governança e privacidade aplicados automaticamente.

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Mantenha-se atualizado sobre as tendências mais importantes e fascinantes do setor em IA, automação, dados e muito mais com o boletim informativo da Think. Consulte a declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua inscrição será entregue em inglês. Você pode encontrar um link para cancelar a inscrição em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa declaração de privacidade da IBM para obter mais informações.

Recursos fundamentais da malha de dados

A arquitetura de malha de dados minimiza os obstáculos de acesso a dados, integração e proteção de dados por meio dos seguintes recursos fundamentais:
 
  • Catálogos de dados
  • Integração de dados
  • Segurança e governança de dados
  • Acesso a dados de autoatendimento
  • Ciclo de vida unificado

Catálogos de dados

As arquiteturas de malha de dados aproveitam catálogos de dados, que são bibliotecas detalhadas de ativos de dados. Esses catálogos empregam metadados ativos (que usam gráficos de conhecimento, semântica e IA) para organizar ativos de dados em tempo real para que os usuários possam encontrar com rapidez e facilidade os dados certos para seus casos de uso. Esses metadados também fornecem uma compreensão de negócios comum de diferentes dados por meio de taxonomias, informações sobre propriedade e atividade, ativos relacionados e muito mais.

Integração de dados

Em uma malha de dados, o processo de integração de dados unifica dados de fontes de dados díspares, transforma-os em uma estrutura consistente e torna-os acessíveis para análise de dados e tomada de decisão. Essa conexão ocorre por meio de vários estilos de integração, como processamento em lote, integração de dados em tempo real e captura de dados de alterações (CDC). Processos de integração inteligentes podem maximizar o desempenho e, ao mesmo tempo, minimizar os custos de armazenamento.

Gestão e segurança de dados

Uma malha de dados fornece uma maneira unificada de criar e aplicar políticas de gestão de dados e segurança de dados em escala. Por exemplo, os controles de acesso a dados podem ser vinculados de forma fácil e automática a dados confidenciais por meio de metadados, como grupos de usuários ou classificações de dados. Por meio desses dados confiáveis e protegidos prontos para a empresa, as malhas de dados podem ajudar as organizações a operacionalizar a IA.

Acesso a dados de autoatendimento

Uma malha de dados atua como um mercado de autoatendimento para o consumo de dados. Por meio de recursos de governança importantes, como criação de perfis de dados e gerenciamento de metadados, ela capacita engenheiros de dados, cientistas de dados e usuários corporativos a descobrir, acessar e colaborar rapidamente em dados de alta qualidade. Os usuários podem pesquisar ativos de dados, marcá-los, fazer anotações neles e adicionar comentários. Como resultado, a dependência do departamento de TI é significativamente reduzida.

Ciclo de vida unificado

As malhas de dados também incluem gerenciamento de ponta a ponta durante todo o ciclo de vida da malha de dados. Ao aproveitar operações de aprendizado de máquina (MLOps) e IA, essa abordagem oferece uma experiência unificada para compor, construir, testar, implementar, otimizar e monitorar os vários componentes de uma arquitetura de malha de dados, como pipelines de dados.

Mixture of Experts | 28 de agosto, episódio 70

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Malha de dados versus data mesh

Uma data mesh é uma arquitetura de dados descentralizada que organiza os dados por domínio de negócios específico (por exemplo, marketing, vendas ou atendimento ao cliente) para dar mais propriedade aos produtores de um determinado conjunto de dados.

As malhas de dados coexistem com data meshs, e muitas vezes melhoram sua funcionalidade. Elas podem automatizar os principais componentes de uma data mesh, como a criação de produtos de dados e a imposição da governança global.

Malha de dados versus data lakehouse

Os data lakehouses surgiram para lidar com as falhas das plataformas tradicionais de gerenciamento de dados. Eles combinam os recursos flexíveis de armazenamento de dados dos data lakes com a análise de dados de alto desempenho dos data warehouses.

As malhas de dados podem ser consideradas o próximo estágio na evolução dos data lakehouses e outras plataformas de dados. As organizações as usam para simplificar o gerenciamento de dados e melhorar o acesso aos dados dos lakehouses. Elas ajudam a promover o compartilhamento de dados, automatizar a integração e a governança de dados e oferecer suporte ao consumo democratizado de dados — recursos que os repositórios de armazenamento por si só não podem fornecer.

Como funciona uma malha de dados?

Ao contrário dos sistemas de armazenamento de dados individuais, as malhas de dados podem criar fluidez nos ambientes de dados, neutralizando o problema da gravidade dos dados — a ideia de que os dados se tornam mais difíceis de migrar à medida que volumes crescentes de novos dados chegam. Uma malha de dados elimina as complexidades tecnológicas necessárias para a migração, transformação e integração dos dados, disponibilizando todos os dados em toda a empresa.

Mas como uma malha de dados consegue isso?

As malhas de dados usam uma variedade de serviços de dados. Para entender como isso funciona, é útil explorar três componentes fundamentais: virtualização de dados, metadados ativos federados e aprendizado de máquina.

Virtualização de dados

A virtualização de dados  torna os dados acessíveis sem movê-los fisicamente. Em vez de usar processos tradicionais de ETL (extrair, transformar, carregar), uma ferramenta de virtualização de dados se conecta diretamente a diferentes fontes, integrando apenas os metadados necessários. Em seguida, cria uma camada de dados virtual que permite aos usuários pesquisar e acessar dados em tempo real, como se estivessem em um repositório centralizado.

Metadados ativos federados

Os metadados ativos federados tornam os dados mais fáceis de serem descobertos e utilizados. Diferentemente dos metadados passivos, que são estáticos e com seleção manual, os metadados ativos federados usam gráficos de conhecimento semânticos e tecnologias de IA/ML para analisar continuamente os metadados, detectar padrões e unificar os dados em diversos sistemas e formatos.

Esses sistemas podem marcar, traçar perfis e classificar os dados automaticamente. Eles também podem acionar alertas ou ações com base em alterações nos metadados, tornando os ecossistemas de dados mais resilientes e autogerenciáveis.

Aprendizado de máquina

O aprendizado de máquina automatiza processos críticos em uma malha de dados, tornando-a uma arquitetura de dados avançada e inteligente. O ML pode ser usado para impor automaticamente políticas de governança, gerar insights em tempo real, detectar vulnerabilidades de segurança, rastrear a linhagem de dados, corrigir problemas de qualidade de dados e muito mais.

Arquitetura do malha de dados

Embora as malhas de dados variem de acordo com as necessidades de negócios, elas compartilham funcionalidades comuns. De acordo com o relatório Enterprise Data Fabric Enables DataOps da Forrester, uma malha de dados normalmente consiste em seis componentes fundamentais:2

  1. Gerenciamento de dados: essa camada é responsável pela governança, segurança e qualidade dos dados.

  2. Ingestão de dados: essa camada combina dados de várias fontes (dados locais e na nuvem) na malha.

  3. Processamento de dados: essa camada transforma, integra e limpa dados, tornando-os utilizáveis para equipes em toda a empresa.

  4. Orquestração de dados: essa camada gerencia a migração de dados entre vários sistemas de dados para que estejam disponíveis para uso.

  5. Descoberta de dados: essa camada usa catalogação de dados e gerenciamento de metadados para ajudar os usuários a encontrar e entender os dados com facilidade.

  6. Acesso a dados: essa camada facilita o consumo de dados com dashboards e outras ferramentas de visualização de dados e assegura as permissões corretas.

Quais são os benefícios de uma malha de dados?

Além de melhorar o gerenciamento e o acesos geral de dados, a malha de dados também oferece os seguintes benefícios:

  • Ganhos de eficiência
  • Democratização de dados
  • Redução de riscos
  • Escalabilidade e agilidade
Ganhos de eficiência

Automatizar a gestão de dados, a integração e outros serviços de dados em várias plataformas simplifica o gerenciamento e a análise de dados. Ao reduzir os gargalos, as empresas podem aumentar a produtividade, permitindo que os usuários corporativos tomem decisões mais rápidas e diminuindo as cargas de trabalho das equipes técnicas.

Além disso, os recursos inteligentes de integração podem ajudar a otimizar o desempenho e, ao mesmo tempo, minimizar o armazenamento e os custos.

Democratização de dados

As arquiteturas de malhas de dados facilitam os aplicativos de autoatendimento, ampliando o acesso a dados além das equipes técnicas. Elas fornecem aos usuários uma visão unificada dos dados organizacionais, criando conexões independentemente de onde os dados residem ou do quanto eles estavam isolados anteriormente.

Redução de riscos

Dados acessíveis e visíveis facilitam muito a catalogação de dados e a imposição da governança. O acesso mais amplo a dados geralmente também resulta em mais barreiras de governança e abordagens de segurança de dados, como mascaramento e criptografia de dados confidenciais.

Escalabilidade e agilidade

As arquiteturas de malha de dados são modulares e construídas para escalar. Elas podem escalar tanto horizontal (para acomodar volumes de dados cada vez maiores) quanto verticalmente (para aprimorar os processos e o desempenho).

Soluções relacionadas
IBM StreamSets

Crie e gerencie pipelines de dados de streaming inteligentes por meio de uma interface gráfica intuitiva, facilitando a integração sem dificuldades dos dados em ambientes híbridos e de multinuvem.

Explore o StreamSets
Soluções de malha de dados

Crie uma arquitetura de dados que acelere a prontidão dos dados para a IA generativa e libere uma produtividade incomparável para as equipes de dados.

Explore as soluções de malha de dados
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights, que proporciona vantagem comercial.

Conheça os serviços de análise de dados
Dê o próximo passo

Para prosperar, as empresas devem utilizar os dados para conquistar a fidelidade do cliente, automatizar processos de negócios e inovar com soluções orientadas por IA.

Explore soluções de análise de dados Conheça os serviços de análise de dados