As empresas estão coletando dados de diversas plataformas e dispositivos com uma rapidez nunca vista. Esse fato, combinado à capacidade computacional sem precedentes, aos algoritmos mais avançados e ao armazenamento mais econômico, está revelando o poder inovador e transformador dos dados.
Entretanto, pôr os dados para trabalhar não é tarefa fácil. O aumento da dispersão e do volume de dados, os ecossistemas diferentes e a profusão de sistemas de gerenciamento já implementados impedem a utilização ideal dos dados. As pesquisas mostram que, na maioria das organizações, o volume de dados não analisados chega a 68%¹ e que até 82%² das empresas são prejudicadas pelos silos de dados.
Uma empresa movida por dados precisa utilizar uma estratégia e uma arquitetura de dados integradas, capazes de vencer o desafio da complexidade dos dados.
Uma malha de dados (Data fabric) é uma arquitetura que simplifica o acesso a dados, para que a organização consuma dos dados por autoatendimento. Para essa arquitetura, os ambientes, processos, utilitários e áreas geográficas dos dados são indiferentes, e ela consegue integrar recursos para gerenciamento dos dados de ponta a ponta. A malha de dados automatiza a descoberta, a governança e o consumo dos dados, permitindo à empresa usá-los para maximizar a cadeia de valor. Com a malha de dados, a empresa aumenta o valor dos dados, pois oferece os dados certos na hora certa, onde quer que eles residam.
Veja por que no Data Quality Solutions do Gartner Magic Quadrant de 2021
Uma camada de abstração que proporciona à empresa o entendimento comum dos dados e a automação para agir com base nos insights
Um conjunto de estilos de integração para extrair, ingerir, transmitir, virtualizar e transformar dados acionado por políticas de dados para maximizar o desempenho e minimizar os custos e o armazenamento
Um mercado que possibilita o consumo de dados por autoatendimento e permite aos usuários colaborar, encontrar e acessar dados de alta qualidade
Gerenciamento de ponta a ponta do ciclo de vida para compor, construir, testar e implementar os vários recursos da arquitetura de data fabric
Definição e cumprimento unificados de políticas de dados, governança de dados e administração de dados, para um pipeline de dados prontos para os negócios
Uma arquitetura modular, permeada por IA e criada para ambientes de nuvem híbridos
Integração e unificação inteligentes em ambientes híbridos e multicloud, para entregar dados confiáveis e acelerar o valor para os negócios.
Garanta o cumprimento de políticas e regras de forma consistente e automatizada para dados em qualquer nuvem, aumentando a visibilidade e a colaboração e reduzindo o risco de conformidade.
Consolide as ferramentas de gerenciamento de dados e minimize sua duplicação, agilizando o acesso a dados mais completos e de maior qualidade, que permitem insights mais profundos.
O IBM Cloud Pak for Data proporciona uma solução de data fabric para chegar a resultados de IA mais rápidos e confiáveis ao levar os dados certos, no momento certo, às pessoas certas, onde quer que sejam necessários. Utilize uma plataforma unificada que abrange ambientes híbridos e multicloud para ingerir, analisar, preparar, gerenciar, governar e entregar dados em escala petabyte para a IA pronta para os negócios.
As ferramentas de gerenciamento de dados tiveram início com os bancos de dados e, com o surgimento de problemas de negócios mais complexos, evoluíram para data warehouses e data lakes. A data fabric é a próxima fase na evolução dessas ferramentas. Com essa arquitetura, você pode simplificar o gerenciamento de dados enquanto continua a usar os vários repositórios de dados nos quais já investiu. A data fabric ajuda a maximizar o potencial dos dados, promove o seu compartilhamento e acelera as iniciativas de dados, pois automatiza a integração dos dados, incorpora governança e facilita o consumo dos dados por autoatendimento de uma forma que os repositórios de armazenamento simplesmente não permitem.
A virtualização de dados é uma das tecnologias que permitem a abordagem de malha de dados. Em vez de migrar os dados fisicamente de várias fontes nas instalações e na nuvem usando o processo padrão ETL de extrair, transformar e carregar, uma ferramenta de virtualização de dados conecta-se às diversas fontes de dados, integra apenas os metadados necessários e cria uma camada de dados virtual. Isso permite a utilização em tempo real dos dados na fonte.
Os dados continuam a aumentar e muitas vezes a organização tem dificuldade para acessar as informações. Esses dados guardam insights ainda desconhecidos, provocando uma lacuna de conhecimento.
Com os recursos de virtualização de dados na arquitetura de malha de dados, a organização pode acessar o dado na fonte sem migrá-lo, o que ajuda a acelerar o valor por meio de consultas mais rápidas e precisas.
¹Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, 8,3 MB, o link é externo à ibm.com), Seagate Technology, julho de 2020
²“The Total Economic Impact Of IBM Garage”, um estudo encomendado conduzido pela Forrester Consulting, outubro de 2020 (o link é externo à ibm.com)