Diferenças de recursos entre as implementações do Cloud Pak for Data

O software Cloud Pak for Data as a Service e Cloud Pak for Data têm algumas diferenças em recursos e implementação. O Cloud Pak for Data as a Service é um conjunto de serviços da IBM Cloud. Cloud Pak for Data 5.2 é oferecido como um software que você deve instalar e manter em IBM Software Hub. Os serviços que estão disponíveis em ambas as implantações também têm diferenças de recursos em Cloud Pak for Data as a Service em comparação com Cloud Pak for Data 5.2, 5.1 e 5.0.

Diferenças de plataforma
Recursos comuns entre os serviços
watsonx.ai Studio comparado ao Watson Studio
tempo de execuçãowatsonx.ai em comparação com o Watson Machine Learning
watsonx.governance
IBM watsonx.data intelligence
DataStage
Data Virtualization

Diferenças de plataforma

O software Cloud Pak for Data as a Service e o software Cloud Pak for Data compartilham uma base de código comum, no entanto, eles diferem nas principais maneiras a seguir:

Diferenças de plataforma
Recursos	Como um serviço	Software
Software, hardware e instalação	O Cloud Pak for Data as a Service é totalmente gerenciado pela IBM na IBM Cloud. As atualizações de software são automáticas. O ajuste de escala de recursos de computação e de armazenamento é automático. Você se inscreve no Try Cloud Pak for Data as a Service.	Você fornece e mantém hardware. Instale, mantenha e faça upgrade do software. Consulte Requisitos de software.
Armazenamento	Você provisiona uma instância de serviço IBM Cloud Object Storage para fornecer armazenamento. Consulte IBM Cloud Object Storage.	Você fornece armazenamento persistente em um cluster Red Hat OpenShift . Consulte Requisitos de armazenamento.
Recursos de computação para execução de cargas de trabalho	Os usuários escolhem o tempo de execução adequado para suas tarefas. O uso da computação é faturado com base na taxa para o ambiente de tempo de execução e na duração da tarefa. Veja Monitorar o uso do recurso da conta.	Configure o número de nós do Red Hat OpenShift com o número apropriado de vCPUs. Consulte Requisitos de hardware e Monitoramento da plataforma.
Custo	Você compra cada serviço que precisar no nível de plano adequado. Muitos serviços faturam o consumo de recursos de computação. Consulte cada página de serviço no catálogoIBM Cloud ou no catálogo de serviços do Cloud Pak for Data as a Service, selecionando Services > Services catalog no menu de navegação.	Você compra uma licença de software com base nos serviços necessários. Por exemplo, a licença Cloud Pak for Data Enterprise Edition inclui o direito a serviços como watsonx.ai Studio e IBM watsonx.data intelligence. Consulte Licenças e direitos.
Segurança, conformidade e isolamento	A segurança de dados, a segurança de rede, a conformidade com normas de segurança e o isolamento do Cloud Pak for Data as a Service são gerenciados pela IBM Cloud. É possível configurar opções extras de segurança e de criptografia. Veja Segurança do Cloud Pak for Data as a Service.	O Red Hat OpenShift Container Platform fornece recursos básicos de segurança. O Cloud Pak for Data é avaliado para vários regulamentos de privacidade e conformidade e fornece recursos que você pode usar na preparação para várias avaliações de privacidade e de conformidade. Você é responsável por recursos de segurança adicionais, criptografia e isolamento de rede. Consulte Considerações de segurança.
Serviços disponíveis	A maioria dos serviços de malha de dados está disponível em ambos os ambientes de implementação. Veja Serviços para o Cloud Pak for Data as a Service.	Inclui muitos outros serviços. Consulte Serviços.
Gerenciamento de Usuários	É possível incluir usuários e grupos de usuários e gerenciar suas funções e permissões de conta com o IBM Cloud Identity and Access Management. Veja Incluir usuários na conta. Também é possível configurar a federação SAML na IBM Cloud. Consulte os documentos do IBM Cloud: Como o IBM Cloud IAM funciona.	É possível incluir usuários e criar grupos de usuários a partir do menu Administração. É possível usar o Identity and Access Management Service ou usar o seu provedor SAML SSO ou LDAP existente para gerenciamento de identidade e de senha. Você pode criar grupos de usuários dinâmicos e baseados em atributos. Consulte Gerenciamento de usuários.

Funcionalidade principal comum entre serviços

A funcionalidade principal a seguir, fornecida com a plataforma, é efetivamente a mesma para serviços nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, versões 5.2, 5.1 e 5.0:

Pesquisa inteligente de ativos e artefatos em toda a plataforma
Catálogo de ativos da Plataforma para compartilhamento de conexões em toda a plataforma
Gerenciamento de usuários baseado em função nas áreas de trabalho colaborativas em toda a plataforma
Infraestrutura comum para ativos e áreas de trabalho
Um catálogo de serviços para inclusão de serviços
Visualize o uso de computação no menu Administração

A tabela a seguir descreve as diferenças na funcionalidade principal dos serviços entre as versões de software Cloud Pak for Data as a Service e Cloud Pak for Data 5.2, 5.1 e 5.0.

Diferenças em recursos comuns entre serviços
Recurso	Como um serviço	Software
Gerenciar todos os projetos	Os usuários com a permissão Gerenciar projetos da função Gerenciador de acesso ao serviço IAM para o serviço IBM Cloud Pak for Data podem participar de qualquer projeto com a função Administrador e, em seguida, gerenciar ou excluir o projeto.	Os usuários com a permissão Gerenciar projetos podem se juntar a qualquer projeto com a função Admin e, em seguida, gerenciar ou excluir o projeto.
Conexões com fontes de dados remotas	A maioria das fontes de dados suportadas é comum aos dois ambientes de implementação. Consulte Conectores.	Consulte Fontes de dados suportadas.
Credenciais de conexão que são pessoais ou compartilhadas	As conexões em projetos e catálogos podem exigir credenciais pessoais ou permitir credenciais compartilhadas. As credenciais compartilhadas podem ser desativadas no nível da conta.	As conexões da plataforma podem exigir credenciais pessoais ou permitir credenciais compartilhadas. As credenciais compartilhadas podem ser desativadas no nível da plataforma.
Credenciais de conexão de segredos em uma área segura	Não disponível	Disponível
autenticação Kerberos	Não disponível	Disponível para alguns serviços e conexões
Ativos e projetos de amostra do app do hub de Recurso...	Disponível	Não disponível
Conector JDBC customizado	Não disponível	Disponível
Definições de origem de dados	Disponível	Disponível a partir de 5.0 Consulte Proteção de dados com definições de origem de dados

IBM watsonx.ai Estúdio em comparação com Watson Studio

Os seguintes recursos do watsonx.ai Studio no Cloud Pak for Data as a Service são efetivamente os mesmos que os recursos do Watson Studio no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:

Colaboração em projetos e espaços de implementação
Acessando ativos do projeto programaticamente
Importação e exportação do projeto usando um arquivo ZIP do projeto
Blocos de notas Jupyter
Planejamento de tarefa
Data Refinery
Watson Natural Language Processing para Python
Recursos de IA generativa

Esta tabela descreve as diferenças de recursos entre o serviço watsonx.ai Studio no ambiente de implantação como serviço e o serviço Watson Studio no ambiente de implantação de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter mais informações sobre as diferenças de recursos entre os planos de oferta no Cloud Pak for Data as a Service, consulte os planos de oferta dowatsonx.ai Studio.

Diferenças no watsonx.ai Studio
Recurso	Como um serviço	Software
Criar projeto	Criar: Um projeto vazio Um projeto de uma amostra no hub de recursos Um projeto do arquivo	Criar: • Um projeto vazio • Um projeto do arquivo • Um projeto com a integração Git
Integração do Git	• Publique notebooks em GitHub • Publicar notebooks como gist	• Integrar um projeto com Git • sincronizar ativos para repositório em um projeto e usar esses ativos em outro projeto
Terminal de projeto para operações avançadas do Git	Não disponível	Disponível em projetos com integração padrão do Git
JupyterLab	Não disponível	Disponível em projetos com integração Git
Visual Studio Code	Não disponível	Disponível em projetos com integração Git
RStudio	Não pode se integrar com o Git	Pode se integrar com o Git. Requer um serviço RStudio Server Runtimes .
Scripts Python	Não disponível	Trabalhe com scripts do Python no JupyterLab. Requer um serviço Watson Studio Runtimes.
Carregar dados em um notebook usando código ( Flight service )	Não disponível	Disponível
Gerenciar ciclo de vida do bloco de notas	Não disponível	Usar CPDCTL para gerenciamento de ciclo de vida de bloco de notas
Ativos do pacote de código (conjunto de arquivos dependentes em uma estrutura de pastas)	Não disponível	Usar CPDCTL para criar ativos de pacotes de código em um espaço de implementação
Promover blocos de notas nos espaços	Não disponível	Disponível manualmente a partir da página de Ativos do projeto ou programaticamente usando CPDCTL
Python com GPU	Suporte disponível apenas para um único tipo de GPU	Suporte disponível para vários tipos de GPU Nvidia. Requer um serviço Watson Studio Runtimes.
Criar e usar imagens customizadas	Não disponível	Crie imagens personalizadas para os ambientes Python (com e sem GPU), R, JupyterLab (com e sem GPU), RStudio e SPSS. Requer um Watson Studio Runtimes e outros serviços aplicáveis.
Repositório Anaconda	Não disponível	Use para criar ambientes e imagens customizados
Integração do Hadoop	Não disponível	Construir e treinar modelos e executar fluxos do Data Refinery em um cluster Hadoop. Requer o serviço Execution Engine for Apache Hadoop.
Decision Optimization	Disponível	Requer o serviço de Otimização de decisão.
SPSS Modeler	Disponível	Requer o serviço SPSS Modeler.
Pipelines de orquestração	Disponível	Requer o serviço Orchestration Pipelines.

tempo de execução watsonx.ai em comparação com o Watson Machine Learning

Os seguintes recursos de tempo de execução do watsonx.ai em Cloud Pak for Data as a Service são efetivamente os mesmos que os recursos do Watson Machine Learning no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:

Colaboração em projetos e espaços de implementação
Implementar modelos
Implementar funções
aPI REST de tempo de execução watsonx.ai e API REST de Watson Machine Learning
cliente Python watsonx.ai
Criar implementações on-line
Implementações de escala e atualização
Definir e usar componentes customizados
Monitorar implementações em espaços
Formulários atualizados para testar a implementação online
Usar dutos aninhados
AutoAI imputação de dados
AutoAI avaliação de justiça
AutoAI série temporal suportando recursos

Esta tabela descreve as diferenças de recursos entre o serviço watsonx.ai Runtime no ambiente de implantação como serviço e o serviço Watson Machine Learning no ambiente de implantação de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter detalhes sobre as diferenças de funcionalidade entre os planos de oferta no Cloud Pak for Data as a Service, consulte planos de oferta de tempo de execuçãowatsonx.ai.

Diferenças de recursos entre as implantações de tempo de execução watsonx.ai
Recurso	Como um serviço	Software
Entrada de treinamento AutoAI	Atuais fontes de dados suportadas	Fontes de dados suportadas alteração por release
Configuração de cálculo do experimento AutoAI	Diferentes tamanhos disponíveis	Diferentes tamanhos disponíveis
AutoAI limites em tamanho de dados e número de destinos de predição	Limites de set	Limites diferem por configuração de computação
Implementar usando frameworks populares e especificações de software	Confira as versões suportadas mais recentes	Versões suportadas diferem por liberação
Conectar a bancos de dados para implementações em lote	Confira o suporte por tipo de implementação	Confira o suporte por tipo de implementação e por versão
Implementar e marcar scripts Python	Disponível por meio do cliente Python	Criar scripts em JupyterLab ou cliente Python , em seguida, implementar
Implantação e pontuação de lote R Scripts	Não disponível	Disponível
Implementar aplicativos Shiny	Não disponível	Criar e implementar apps Shiny Deploy a partir do pacote de códigos
Avaliar tarefas para justiça ou desvio	Requer o serviço watsonx.governance	Requer o serviço Watson OpenScale ou watsonx.governance
Avaliar implementações on-line em um espaço para justiça, desvio ou explicabilidade	Não disponível	Disponível Requer o serviço Watson OpenScale ou watsonx.governance
Avaliar modelos de prompt implementados em um espaço		Disponível
Avaliar modelos de prompt desconectados em um espaço	Disponível
Criação de espaço de controle	Sem restrições por função	Use permissões para controlar quem pode visualizar e criar espaços
Importar do projeto GIT para o espaço	Não disponível	Disponível
Pacote de código criado automaticamente ao importar do projeto Git para o espaço	Não disponível	Disponível
Atualizar app RShiny do pacote de código	Não disponível	Disponível
Criar e usar imagens customizadas	Não disponível	Criar imagens customizadas para Python ou SPSS
Notificar colaboradores sobre eventos de Pipeline	Não disponível	Use Enviar e-mail para notificar os colaboradores
Experimentos de deep learning	Não disponível	Requer o serviço IBM Scheduler
Provisionar e gerenciar instâncias de serviço IBM Cloud	Adicionar instâncias para watsonx.ai Runtime ou Watson OpenScale	Os serviços são provisionados no cluster pelo administrador

watsonx.governance

Os recursos de governança a seguir são efetivamente os mesmos nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, nas versões 5.2, 5.1 e 5.0:

Avaliar implementações para justiça
Avaliar a qualidade das implementações
Monitorar implementações para desvio
Visualizar e comparar resultados do modelo em um painel do Insights
Inclua implementações do provedor de aprendizado de máquina de sua escolha
Configurar alertas para acionar quando as avaliações caem abaixo de um limite especificado
Avaliar implementações em uma interface de usuário ou notebook
Avaliações e métricas customizadas
Visualizar detalhes sobre avaliações em fichas técnicas de modelo

Esta tabela descreve as diferenças de recursos entre o serviço watsonx.governance nos ambientes de implantação como serviço e de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais.

Diferenças de recursos entrewatsonx.governance implantações
Recurso	Como um serviço	Software
Avalie modelos de aprendizado de máquina	True	True
Upload de dados de teste pré-pontuados	Não disponível	Disponível
IBM SPSS Collaboration and Deployment Services	Não disponível	Disponível
Processamento em lote	Não disponível	Disponível
Controlar o controle de acesso por grupos de usuários	Não disponível	Disponível
Banco de dados grátis e planos Postgres	Disponível	Postgres disponível

IBM watsonx.data intelligence

Os recursos a seguir são efetivamente os mesmos para IBM watsonx.data intelligence em Cloud Pak for Data as a Service e no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:

Colaboração em projetos e catálogos
Importação e exportação do projeto usando um arquivo ZIP do projeto
Pesquisa com IA em catálogos
Classificação e revisão de ativos em catálogos
Ferramenta Data Refinery em projetos
Categorias com funções de colaborador
Classificações predefinidas e customizadas
Classes de dados predefinidas e customizadas
Regras de controle
Políticas
Regras de proteção de dados
Regras do SLA de qualidade de dados
Criação de perfil manual de ativos de dados relacionais individuais em um projeto ou catálogo
Criação de perfil automática de ativos de dados relacionais adicionados a um catálogo governado
Ferramenta de enriquecimento de metadados em projetos para execução de perfis, atribuição de termos, análise de qualidade e análise de chave ou relacionamento em grandes conjuntos de ativos de dados
Tipos de ativos customizados, propriedades customizadas para ativos e relacionamentos customizados entre ativos em catálogos
Monitorar tarefas de workflow
Entregar conjuntos de dados mascarado em projetos com fluxos de mascaramentos
Informações detalhadas sobre a qualidade dos dados para ativos de dados em projetos e catálogos, e como parte dos resultados de enriquecimento de metadados
Fluxos de trabalho de correção para problemas de qualidade de dados
Criar ativos de dados conectados e ativos de dados segmentados com consultas SQL
Executar painel de métricas e janelas de execução para trabalhos de enriquecimento de metadados

Esta tabela descreve as diferenças de recursos entre o serviço IBM watsonx.data intelligence nos ambientes de implantação como serviço e de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter mais informações sobre as diferenças de recursos entre os planos de oferta em Cloud Pak for Data as a Service, consulte IBM Knowledge Catalog legacy service plans e watsonx.data intelligence offering plans.

A partir da versão Cloud Pak for Data 5.0, você pode instalar o cartucho IBM Knowledge Catalog Premium ou o cartucho IBM Knowledge Catalog Standard em vez do serviço IBM watsonx.data intelligence. IBM Knowledge Catalog Premium oferece os mesmos recursos que o serviço IBM watsonx.data intelligence, além de recursos de IA generativa. IBM Knowledge Catalog Standard fornece um subconjunto de recursos do IBM watsonx.data intelligence, além de recursos generativos de IA.

Diferenças em IBM watsonx.data intelligence
Recurso	Como um serviço	Software
Organizar ativos em projetos com pastas	Disponível (beta)	Disponível
Metadata import ferramenta em projetos-descoberta	Importar ativos de dados em projetos ou catálogos. Suporte para um subconjunto de conexões de projeto e de catálogo. Consulte Origens de dados suportadas para curadoria e qualidade de dados.	Importar diferentes tipos de ativos: • Importar ativos de dados em projetos ou catálogos. A maioria das conexões suportadas são as mesmas em ambos os ambientes de implementação. • Importe relatórios de inteligência de negócios, ativos com seus scripts de transformação associados, tarefas ETL ou modelos de dados em catálogos Requer instalação do MANTA Automated Data Lineage sem uma chave de licença. Suporte para um subconjunto de conexões de catálogo. ' Consulte Fontes de dados compatíveis para curadoria e qualidade de dados.
Metadata import ferramenta em projetos-linhagem	Disponível. A linhagem de dados deve estar ativada. Limites por plano.	- Importar a linhagem de ativos de dados para os catálogos. Requer a instalação do IBM Manta Data Lineage ou MANTA Automated Data Lineage com uma chave de licença. - Capture e acesse a linhagem de trabalhos de ETL no MANTA Automated Data Lineage. Requer a instalação do MANTA Automated Data Lineage com uma chave de licença. Suporte para um subconjunto de conexões de catálogo. Consulte Fontes de dados compatíveis para curadoria e qualidade de dados.
Enriquecimento aprimorado usando IA generativa	Disponível.	Não disponível. A partir da versão 5.0, instale o IBM Knowledge Catalog Premium ou o IBM Knowledge Catalog Standard.
Gerar e executar automaticamente verificações de qualidade de dados como parte do enriquecimento de metadados	Disponível.	Disponível a partir de 5.2.
Regras de qualidade de dados em projetos	Disponível Requer o serviço do DataStage	Disponível. Requer o serviço DataStage .
Incluir diversos ativos em um catálogo com um arquivo	Disponível.	Disponível.
Atividades do ativo	Requer um plano pago. Disponível em projetos e catálogos.	Disponível em projetos e catálogos.
Linhagem de Negócios	Não disponível	Disponível.
Linhagem de dados técnicos	Não Disponível.	Disponível. Requer a instalação de uma versão licenciada do MANTA Automated Data Lineage for IBM Cloud Pak for Data. Gerado executando a ferramenta de importação de metadados. Pode ser acessado a partir de catálogos.
Linhagem de Dados	Requer habilitação.	Requer a ativação e o serviço IBM Manta Data Lineage.
Termos de negócios	Limites para alguns planos.	Disponível.
Termos comerciais predefinidos	Os termos comerciais predefinidos e a categoria de dados pessoais de amostra do Knowledge Accelerator que os inclui estão disponíveis somente se você criar uma instância de serviço IBM watsonx.data intelligence com um plano Lite ou Standard após 7 de outubro de 2022.	Não Disponível.
Conjuntos de dados de referência	Limites por plano.	Disponível.
Relacionamentos customizados para artefatos	Requer um plano pago.	Disponível.
Knowledge Accelerators	Requer um plano Enterprise do hub de recursos.	Fornecido com a plataforma.
Configurações de fluxo de trabalho customizadas para artefatos de governança e solicitações	Disponível para artefatos de governança.	Disponível.
Funções de categoria customizadas	Limites por plano.	Disponível.
Regras de proteção de dados de exportação e importação	Para exportar regras de proteção de dados de qualquer sistema e importar as regras para o mesmo sistema ou para um sistema diferente, você pode usar APIs. Para obter detalhes, consulte Migração de regras de proteção de dados.	Para exportar regras de proteção de dados de qualquer sistema e importar as regras para o mesmo sistema ou para um sistema diferente, você pode usar APIs ou comandos cpd-cli. Para obter detalhes, consulte Migração de regras de proteção de dados.
Relatórios administrativos	Requer um plano pago.	Disponível.
Explorador de relacionamento	Disponível.	Disponível a partir de 5.0 É necessário instalar o componente opcional de gráfico de conhecimento com IBM watsonx.data intelligence.

DataStage

A tabela a seguir descreve as diferenças de recursos entre DataStage on Cloud Pak for Data as a Service e DataStage no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0.

Diferenças no DataStage
Recurso	Como um serviço	Software
Gerenciamento de instância PX	É possível provisionar instâncias a partir de um conjunto de tamanhos pré-definidos. O tamanho personalizado está disponível no site DataStage-aaS Anywhere.	É possível provisionar instâncias de forma mais flexível usando administração de instância do Cloud Pak for Data.
Compilação de tarefas	O OSH é gerado durante a compilação. O transformador é compilado no tempo de execução.	O OSH é gerado durante a compilação. O transformador é compilado durante o tempo de compilação e é disponibilizado para a montagem do `/ds-storage`. A compilação é feita de forma sincronizada.
Tempo de execução de tarefas	É possível enviar quantas tarefas desejar, sujeito a enfileiramento.	Execuções de tarefas simultâneas são suportadas. A simultaneidade é determinada pela capacidade da instância e configurações no arquivo `/px-storage/config/wlm.config.xml`.
Gerenciamento de ativos	Para arquivos do tipo .xls, .xlsx, .xml e .json, apenas estruturas simples são suportadas. Esquemas multinível / aninhados não podem ser analisados.	O suporte completo de arquivos do tipo .csv, .txt, .xls, .xlsx, .xml e .json está disponível.
Armazenamento	O armazenamento real baseado em arquivo do tipo POSIX não está disponível. O armazenamento é emulado pelo uso de um bucket de projeto do Cloud Object Storage.	O armazenamento real está disponível no `/px-storage` e no `/ds-storage`. É possível montar mais armazenamento no pod do tempo de execução do PX. Consulte Configuração de uma montagem NFS no DataStage.
Estágio Java Integration	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Componente da biblioteca Java	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Conexão JDBC genérica	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Excel	Disponível comDataStage-aaS Em qualquer lugar	Disponível
AVI	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Estágio External Source	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Estágio External Target	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Estágio hierárquico	A opção de arquivo único ou de conjunto de arquivos para XML Parser e JSON Parser não está disponível. Arquivo único, conjunto de arquivos e opção de Objeto Grande para XML Composer e JSON Composer não estão disponíveis.	Disponível
SMP	S, M, L são configuração de nó único SMP. Use um mecanismo de tempo de execução remoto para definir uma configuração alternativa.	Cargas de trabalho paralelas são gerenciadas por meio de partições lógicas, que são configuradas com a opção APT_CONFIG_FILE.
SAP Bulk Extract conexão	Não disponível	Disponível
SAP Delta Extract	Não disponível	Disponível
Estágio Wrapped	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Conexão SAP HANA	Não disponível	Disponível
Fonte de dados de texto em conexão ODBC	Não disponível	Disponível
Estágio Build	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Enviar relatórios usando subroutines anteriores / after-job	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Estágio customizado	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Apache HBase	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Autenticação de Kerberos para conexões Apache Hive	Não disponível	Disponível
Funções definidas pelo usuário	Disponível comDataStage-aaS Em qualquer lugar	Disponível
APT_CONFIG_FILEs criados pelo usuário	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Propriedades antes / depois do trabalho	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Conector de serviço de dados	Não disponível	Disponível
Db2 Sequência de banco de dados em estágio Lentamente Mudando Dimensão, estágio do Gerador de Chave Substituta e estágio Transformador	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Use a conexão Apache Hive como um alvo. (Disponível quando Usar DataStage é selecionado no conector.)	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Parametrizar propriedades com conexões locais	Não disponível	Disponível
Operational Decision Manager estágio	Disponível comDataStage-aaS Em qualquer lugar	Disponível
Espaços de implementação	Não disponível	Disponível

Data Virtualization

No Cloud Pak for Data as a Service, a funcionalidade de virtualização de dados é fornecida pelo serviço Data Virtualization. A funcionalidade de virtualização de dados a seguir é efetivamente a mesma nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, nas versões 5.2, 5.1 e 5.0.

Conectando-se a origens de dados suportadas
Virtualizando dados
Governando dados virtuais usando políticas e regras de proteção de dados
Monitorando e explorando o serviço
Usando a interface SQL
Armazenando em Cache
Mascaramento de coluna
Explore a visualização e o recarregamento de tabelas
Amostragem de dados na coleta de estatísticas
Enriquecimento de metadados

A funcionalidade de virtualização de dados a seguir parece ser diferente na interface com o usuário, mas fornece a mesma funcionalidade básica:

Esta tabela descreve as diferenças de recursos entre o software " Data Virtualization (antigo " Watson Query) no " Cloud Pak for Data as a Service e o " Data Virtualization (antigo " Watson Query) no " Cloud Pak for Data.

Diferenças na Data Virtualization
Recurso	Como um serviço	Software
Use o Cloud Pak for Data Data Source Definitions (DSD) para aplicar as regras de proteção de dados do IBM watsonx.data intelligence	Não aplicável para SaaS	Disponível a partir de 5.0
Consultar dados em origens de dados da API REST	Não aplicável para SaaS	Disponível a partir de 5.0
Tabelas de consultas de catálogos anteriores do Presto e Databricks com suporte a vários catálogos	Não aplicável para SaaS	Disponível a partir de 5.0
Escalar instâncias de serviço automaticamente	Não aplicável para SaaS	Disponível a partir de 5.0
Mascarar caracteres multibyte para privacidade aprimorada de dados sensíveis	Não aplicável para SaaS	Disponível a partir de 5.0
Visualizar as regras de proteção de dados que são aplicadas a um usuário	Não aplicável para SaaS	Disponível a partir de 5.0
Segurança aprimorada para resultados de criação de perfil em visualizações de Data Virtualization	Não aplicável para SaaS	Disponível a partir de 5.0
As conexões de Data Virtualization em catálogos agora referenciam a conexão da plataforma	Não aplicável para SaaS	Disponível a partir de 5.0
As conexões de Data Virtualization em catálogos agora referenciam a conexão da plataforma	Não aplicável para SaaS	Disponível a partir de 5.0
Segurança aprimorada para a função Administrador: a função Administrador não tem acesso padrão a todos os dados.	Não aplicável para SaaS	Disponível
IBM watsonx.data intelligence as regras de proteção de dados estão sempre ativadas para os dados do Watson Query	Não aplicável para SaaS	Disponível
Proteja seus objetos não governados: Com as regras de proteção de dados do IBM watsonx.data intelligence em Watson Query, os objetos virtualizados que não são publicados em um catálogo controlado seguem a configuração da convenção de acesso a dados padrão de suas configurações de regra.	Não aplicável para SaaS	Disponível
Consultar dados Presto : é possível criar uma conexão com o Presto para acessar e consultar dados no Presto.	Não aplicável para SaaS	Disponível
Criação de log de auditoria para monitorar a atividade do usuário e acesso a dados	Disponível	Disponível
Integração com o site IBM watsonx.data intelligence	Necessário	Opcional
Autorização baseada em grupo e acesso de nível de objeto para grupos	Não disponível	Disponível
Suporte para conectores remotos	Não aplicável para SaaS	Disponível
Suporte para origens de dados baseadas em sistema de arquivos, exceto no Cloud Object Storage	Não aplicável para SaaS	Disponível
Conectando-se a fontes de dados que requerem um driver JDBC carregados, por exemplo, SAP HANA, Geric JDBC	Não aplicável para SaaS	Disponível
Coleta de estatísticas na interface com o usuário	Não disponível	Disponível
Coleta de estatísticas automática durante a virtualização de objetos	Não disponível	Disponível
Gerenciamento de acesso para vários grupos	Não disponível	Disponível
Suporte para arquivos CSV ou TSV em Cloud Object Storage	Não aplicável para SaaS	Disponível
Credenciais em cofres para conexões em Cloud Object Storage	Não aplicável para SaaS	Disponível
Armazenamento automático de consultas em cache	Não disponível	Disponível a partir da versão 5.0.3