Data Virtualization

Descrição

O Data Virtualization permite o acesso a dados físicos de várias origens de maneira virtual, para que os dados possam ser acessados, manipulados e analisados a partir de um local central, sem a necessidade de saber seu formato ou local físico e sem precisar movê-los ou copiá-los.

O Data Virtualization está totalmente integrado no Cloud Pak for Data as a Service on IBM Cloud como parte da malha de dados O Data Virtualization fornece os recursos de virtualização da arquitetura de malha de dados

Para começar, crie uma instância de serviço do Data Virtualization e ative-a em Cloud Pak for Data as a Service Em seguida, crie conexões com suas fontes de dados para que você possa criar rapidamente visualizações em todos os dados da sua organização.

Com o Data Virtualization, sua empresa pode alcançar essas metas:

Simplifique seus analíticos e os torne mais precisos porque você está consultando os dados mais recentes em sua origem.
Usar análise em tempo real de forma eficiente e obter a análise atual para origens de dados distribuídas, sem necessidade de armazenar dados fora de seu data center.
Acelerar tempos de processamento ao organizar automaticamente seus nós de dados em uma rede colaborativa para eficiência computacional.
Aproveitar a SQL padrão por meio de interfaces comuns, como R, Spark, Python e Jupyter Notebooks em um único repositório de dados no qual seus aplicativos SQL podem se conectar e serem executados.
Centralizar a autenticação e a autorização para origens de dados em um ambiente confiável no qual as credenciais para seus bancos de dados privados são armazenadas e criptografadas no dispositivo local e são privadas nesse dispositivo.

Esse serviço inclui uma área de trabalho no Cloud Pak for Data as a Service

Casos de uso

A tabela a seguir descreve como o Data Virtualization aborda as necessidades críticas de uma organização:

Instrução do Problema	O que o Data Virtualization ativa	Valor
Fazer uso de muitos dados em diferentes locais e formatos é um desafio e leva a um pipeline de dados complexo.	Uma camada semântica que fica em cima da expansão de dados que permite que os usuários consultem diferentes origens de dados e formatos em tempo real..	Capacitar os consumidores de dados para autoatendimento.
Armazenando dados em diferentes locais na nuvem e no local com software e sistemas que não trabalham juntos perfeitamente para criar pipelines de dados de ponta a ponta.	Os engenheiros de dados podem atender rapidamente solicitações de integração de dados ad hoc para validar hipóteses ou cenários "hipotéticos" com segurança e controle.	Acelere o ciclo de vida de dados e reduza o tempo de maturação para abordar as questões de negócios
Incapacidade de gerenciar a governança e impor regulamentos de privacidade em escala.	Controle de dados abstratos e aplique políticas de dados em todas as suas origens de dados por meio de uma única camada.	Aumente a conformidade com os regulamentos de proteção de dados, reduzindo a sobrecarga do gerenciamento de controle de acesso em escala.

Links rápidos

Configurar: configure o serviço
Administrar: gerenciar e manter o serviço
Desenvolver: Gravar código e desenvolver aplicativos
O que há de novo: Veja o que há de novo a cada semana
Criar: Criar a instância de serviço

Serviços necessários

Tabela 1. Serviços necessários. Os serviços a seguir são necessários para este serviço.
Serviço	Capacidade
IBM® Knowledge Catalog	Crie catálogos de ativos curados com esta plataforma de gerenciamento de catálogos corporativa e segura que é suportada por uma estrutura de controle de dados.

Serviços integrados

Tabela 2. Serviços relacionados. Os serviços relacionados a seguir são frequentemente utilizados com este serviço e fornecem recursos complementares, mas eles não são necessários.
Serviço	Capacidade
watsonx.ai™ Studio	Prepare, analise e modele dados em um ambiente colaborativo com ferramentas para cientistas de dados, desenvolvedores e especialistas em domínios.