Data Virtualization

 

Descrição

O Data Virtualization permite o acesso a dados físicos de várias origens de maneira virtual, para que os dados possam ser acessados, manipulados e analisados a partir de um local central, sem a necessidade de saber seu formato ou local físico e sem precisar movê-los ou copiá-los.

O Data Virtualization está totalmente integrado no Cloud Pak for Data as a Service on IBM Cloud como parte da malha de dados O Data Virtualization fornece os recursos de virtualização da arquitetura de malha de dados

Para começar, crie uma instância de serviço do Data Virtualization e ative-a em Cloud Pak for Data as a Service Em seguida, crie conexões com suas fontes de dados para que você possa criar rapidamente visualizações em todos os dados da sua organização.

Com o Data Virtualization, sua empresa pode alcançar essas metas:

  • Simplifique seus analíticos e os torne mais precisos porque você está consultando os dados mais recentes em sua origem.
  • Usar análise em tempo real de forma eficiente e obter a análise atual para origens de dados distribuídas, sem necessidade de armazenar dados fora de seu data center.
  • Acelerar tempos de processamento ao organizar automaticamente seus nós de dados em uma rede colaborativa para eficiência computacional.
  • Aproveitar a SQL padrão por meio de interfaces comuns, como R, Spark, Python e Jupyter Notebooks em um único repositório de dados no qual seus aplicativos SQL podem se conectar e serem executados.
  • Centralizar a autenticação e a autorização para origens de dados em um ambiente confiável no qual as credenciais para seus bancos de dados privados são armazenadas e criptografadas no dispositivo local e são privadas nesse dispositivo.

Esse serviço inclui uma área de trabalho no Cloud Pak for Data as a Service

Casos de uso

A tabela a seguir descreve como o Data Virtualization aborda as necessidades críticas de uma organização:

Instrução do Problema O que o Data Virtualization ativa Valor
Fazer uso de muitos dados em diferentes locais e formatos é um desafio e leva a um pipeline de dados complexo. Uma camada semântica que fica em cima da expansão de dados que permite que os usuários consultem diferentes origens de dados e formatos em tempo real.. Capacitar os consumidores de dados para autoatendimento.

Armazenando dados em diferentes locais na nuvem e no local com software e sistemas que não trabalham juntos perfeitamente para criar pipelines de dados de ponta a ponta.

Os engenheiros de dados podem atender rapidamente solicitações de integração de dados ad hoc para validar hipóteses ou cenários "hipotéticos" com segurança e controle. Acelere o ciclo de vida de dados e reduza o tempo de maturação para abordar as questões de negócios
Incapacidade de gerenciar a governança e impor regulamentos de privacidade em escala. Controle de dados abstratos e aplique políticas de dados em todas as suas origens de dados por meio de uma única camada. Aumente a conformidade com os regulamentos de proteção de dados, reduzindo a sobrecarga do gerenciamento de controle de acesso em escala.

Links rápidos

Serviços necessários

Tabela 1. Serviços necessários. Os serviços a seguir são necessários para este serviço.
Serviço Capacidade
IBM® Knowledge Catalog Crie catálogos de ativos curados com esta plataforma de gerenciamento de catálogos corporativa e segura que é suportada por uma estrutura de controle de dados.

Serviços integrados

Tabela 2. Serviços relacionados. Os serviços relacionados a seguir são frequentemente utilizados com este serviço e fornecem recursos complementares, mas eles não são necessários.
Serviço Capacidade
watsonx.ai™ Studio Prepare, analise e modele dados em um ambiente colaborativo com ferramentas para cientistas de dados, desenvolvedores e especialistas em domínios.