Diferenças de recursos entre as implementações do Cloud Pak for Data
O software Cloud Pak for Data as a Service e Cloud Pak for Data têm algumas diferenças em recursos e implementação. O Cloud Pak for Data as a Service é um conjunto de serviços da IBM Cloud. Cloud Pak for Data 5.2 é oferecido como um software que você deve instalar e manter em IBM Software Hub. Os serviços que estão disponíveis em ambas as implantações também têm diferenças de recursos em Cloud Pak for Data as a Service em comparação com Cloud Pak for Data 5.2, 5.1 e 5.0.
- Diferenças de plataforma
- Recursos comuns entre os serviços
- watsonx.ai Studio comparado ao Watson Studio
- tempo de execuçãowatsonx.ai em comparação com o Watson Machine Learning
- watsonx.governance
- IBM watsonx.data intelligence
- DataStage
- Data Virtualization
Diferenças de plataforma
O software Cloud Pak for Data as a Service e o software Cloud Pak for Data compartilham uma base de código comum, no entanto, eles diferem nas principais maneiras a seguir:
| Recursos | Como um serviço | Software |
|---|---|---|
| Software, hardware e instalação | O Cloud Pak for Data as a Service é totalmente gerenciado pela IBM na IBM Cloud. As atualizações de software são automáticas. O ajuste de escala de recursos de computação e de armazenamento é automático. Você se inscreve no Try Cloud Pak for Data as a Service. | Você fornece e mantém hardware. Instale, mantenha e faça upgrade do software. Consulte Requisitos de software. |
| Armazenamento | Você provisiona uma instância de serviço IBM Cloud Object Storage para fornecer armazenamento. Consulte IBM Cloud Object Storage. | Você fornece armazenamento persistente em um cluster Red Hat OpenShift . Consulte Requisitos de armazenamento. |
| Recursos de computação para execução de cargas de trabalho | Os usuários escolhem o tempo de execução adequado para suas tarefas. O uso da computação é faturado com base na taxa para o ambiente de tempo de execução e na duração da tarefa. Veja Monitorar o uso do recurso da conta. | Configure o número de nós do Red Hat OpenShift com o número apropriado de vCPUs. Consulte Requisitos de hardware e Monitoramento da plataforma. |
| Custo | Você compra cada serviço que precisar no nível de plano adequado. Muitos serviços faturam o consumo de recursos de computação. Consulte cada página de serviço no catálogoIBM Cloud ou no catálogo de serviços do Cloud Pak for Data as a Service, selecionando Services > Services catalog no menu de navegação. | Você compra uma licença de software com base nos serviços necessários. Por exemplo, a licença Cloud Pak for Data Enterprise Edition inclui o direito a serviços como watsonx.ai Studio e IBM watsonx.data intelligence. Consulte Licenças e direitos. |
| Segurança, conformidade e isolamento | A segurança de dados, a segurança de rede, a conformidade com normas de segurança e o isolamento do Cloud Pak for Data as a Service são gerenciados pela IBM Cloud. É possível configurar opções extras de segurança e de criptografia. Veja Segurança do Cloud Pak for Data as a Service. | O Red Hat OpenShift Container Platform fornece recursos básicos de segurança. O Cloud Pak for Data é avaliado para vários regulamentos de privacidade e conformidade e fornece recursos que você pode usar na preparação para várias avaliações de privacidade e de conformidade. Você é responsável por recursos de segurança adicionais, criptografia e isolamento de rede. Consulte Considerações de segurança. |
| Serviços disponíveis | A maioria dos serviços de malha de dados está disponível em ambos os ambientes de implementação. Veja Serviços para o Cloud Pak for Data as a Service. |
Inclui muitos outros serviços. Consulte Serviços. |
| Gerenciamento de Usuários | É possível incluir usuários e grupos de usuários e gerenciar suas funções e permissões de conta com o IBM Cloud Identity and Access Management. Veja Incluir usuários na conta. Também é possível configurar a federação SAML na IBM Cloud. Consulte os documentos do IBM Cloud: Como o IBM Cloud IAM funciona. |
É possível incluir usuários e criar grupos de usuários a partir do menu Administração. É possível usar o Identity and Access Management Service ou usar o seu provedor SAML SSO ou LDAP existente para gerenciamento de identidade e de senha. Você pode criar grupos de usuários dinâmicos e baseados em atributos. Consulte Gerenciamento de usuários. |
Funcionalidade principal comum entre serviços
A funcionalidade principal a seguir, fornecida com a plataforma, é efetivamente a mesma para serviços nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, versões 5.2, 5.1 e 5.0:
- Pesquisa inteligente de ativos e artefatos em toda a plataforma
- Catálogo de ativos da Plataforma para compartilhamento de conexões em toda a plataforma
- Gerenciamento de usuários baseado em função nas áreas de trabalho colaborativas em toda a plataforma
- Infraestrutura comum para ativos e áreas de trabalho
- Um catálogo de serviços para inclusão de serviços
- Visualize o uso de computação no menu Administração
A tabela a seguir descreve as diferenças na funcionalidade principal dos serviços entre as versões de software Cloud Pak for Data as a Service e Cloud Pak for Data 5.2, 5.1 e 5.0.
| Recurso | Como um serviço | Software |
|---|---|---|
| Gerenciar todos os projetos | Os usuários com a permissão Gerenciar projetos da função Gerenciador de acesso ao serviço IAM para o serviço IBM Cloud Pak for Data podem participar de qualquer projeto com a função Administrador e, em seguida, gerenciar ou excluir o projeto. | Os usuários com a permissão Gerenciar projetos podem se juntar a qualquer projeto com a função Admin e, em seguida, gerenciar ou excluir o projeto. |
| Conexões com fontes de dados remotas | A maioria das fontes de dados suportadas é comum aos dois ambientes de implementação. Consulte Conectores. |
Consulte Fontes de dados suportadas. |
| Credenciais de conexão que são pessoais ou compartilhadas | As conexões em projetos e catálogos podem exigir credenciais pessoais ou permitir credenciais compartilhadas. As credenciais compartilhadas podem ser desativadas no nível da conta. | As conexões da plataforma podem exigir credenciais pessoais ou permitir credenciais compartilhadas. As credenciais compartilhadas podem ser desativadas no nível da plataforma. |
| Credenciais de conexão de segredos em uma área segura | Não disponível | Disponível |
| autenticação Kerberos | Não disponível | Disponível para alguns serviços e conexões |
| Ativos e projetos de amostra do app do hub de Recurso... | Disponível | Não disponível |
| Conector JDBC customizado | Não disponível | Disponível |
| Definições de origem de dados | Disponível | Disponível a partir de 5.0 Consulte Proteção de dados com definições de origem de dados |
IBM watsonx.ai Estúdio em comparação com Watson Studio
Os seguintes recursos do watsonx.ai Studio no Cloud Pak for Data as a Service são efetivamente os mesmos que os recursos do Watson Studio no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:
- Colaboração em projetos e espaços de implementação
- Acessando ativos do projeto programaticamente
- Importação e exportação do projeto usando um arquivo ZIP do projeto
- Blocos de notas Jupyter
- Planejamento de tarefa
- Data Refinery
- Watson Natural Language Processing para Python
- Recursos de IA generativa
Esta tabela descreve as diferenças de recursos entre o serviço watsonx.ai Studio no ambiente de implantação como serviço e o serviço Watson Studio no ambiente de implantação de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter mais informações sobre as diferenças de recursos entre os planos de oferta no Cloud Pak for Data as a Service, consulte os planos de oferta dowatsonx.ai Studio.
| Recurso | Como um serviço | Software |
|---|---|---|
| Criar projeto | Criar: Um projeto vazio Um projeto de uma amostra no hub de recursos Um projeto do arquivo |
Criar: • Um projeto vazio • Um projeto do arquivo • Um projeto com a integração Git |
| Integração do Git | • Publique notebooks em GitHub • Publicar notebooks como gist |
• Integrar um projeto com Git • sincronizar ativos para repositório em um projeto e usar esses ativos em outro projeto |
| Terminal de projeto para operações avançadas do Git | Não disponível | Disponível em projetos com integração padrão do Git |
| JupyterLab | Não disponível | Disponível em projetos com integração Git |
| Visual Studio Code | Não disponível | Disponível em projetos com integração Git |
| RStudio | Não pode se integrar com o Git | Pode se integrar com o Git. Requer um serviço RStudio Server Runtimes . |
| Scripts Python | Não disponível | Trabalhe com scripts do Python no JupyterLab. Requer um serviço Watson Studio Runtimes. |
| Carregar dados em um notebook usando código ( Flight service ) | Não disponível | Disponível |
| Gerenciar ciclo de vida do bloco de notas | Não disponível | Usar CPDCTL para gerenciamento de ciclo de vida de bloco de notas |
| Ativos do pacote de código (conjunto de arquivos dependentes em uma estrutura de pastas) | Não disponível | Usar CPDCTL para criar ativos de pacotes de código em um espaço de implementação |
| Promover blocos de notas nos espaços | Não disponível | Disponível manualmente a partir da página de Ativos do projeto ou programaticamente usando CPDCTL |
| Python com GPU | Suporte disponível apenas para um único tipo de GPU | Suporte disponível para vários tipos de GPU Nvidia. Requer um serviço Watson Studio Runtimes. |
| Criar e usar imagens customizadas | Não disponível | Crie imagens personalizadas para os ambientes Python (com e sem GPU), R, JupyterLab (com e sem GPU), RStudio e SPSS. Requer um Watson Studio Runtimes e outros serviços aplicáveis. |
| Repositório Anaconda | Não disponível | Use para criar ambientes e imagens customizados |
| Integração do Hadoop | Não disponível | Construir e treinar modelos e executar fluxos do Data Refinery em um cluster Hadoop. Requer o serviço Execution Engine for Apache Hadoop. |
| Decision Optimization | Disponível | Requer o serviço de Otimização de decisão. |
| SPSS Modeler | Disponível | Requer o serviço SPSS Modeler. |
| Pipelines de orquestração | Disponível | Requer o serviço Orchestration Pipelines. |
tempo de execução watsonx.ai em comparação com o Watson Machine Learning
Os seguintes recursos de tempo de execução do watsonx.ai em Cloud Pak for Data as a Service são efetivamente os mesmos que os recursos do Watson Machine Learning no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:
- Colaboração em projetos e espaços de implementação
- Implementar modelos
- Implementar funções
- aPI REST de tempo de execução watsonx.ai e API REST de Watson Machine Learning
- cliente Python watsonx.ai
- Criar implementações on-line
- Implementações de escala e atualização
- Definir e usar componentes customizados
- Monitorar implementações em espaços
- Formulários atualizados para testar a implementação online
- Usar dutos aninhados
- AutoAI imputação de dados
- AutoAI avaliação de justiça
- AutoAI série temporal suportando recursos
Esta tabela descreve as diferenças de recursos entre o serviço watsonx.ai Runtime no ambiente de implantação como serviço e o serviço Watson Machine Learning no ambiente de implantação de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter detalhes sobre as diferenças de funcionalidade entre os planos de oferta no Cloud Pak for Data as a Service, consulte planos de oferta de tempo de execuçãowatsonx.ai.
| Recurso | Como um serviço | Software |
|---|---|---|
| Entrada de treinamento AutoAI | Atuais fontes de dados suportadas | Fontes de dados suportadas alteração por release |
| Configuração de cálculo do experimento AutoAI | Diferentes tamanhos disponíveis | Diferentes tamanhos disponíveis |
| AutoAI limites em tamanho de dados e número de destinos de predição |
Limites de set | Limites diferem por configuração de computação |
| Implementar usando frameworks populares e especificações de software |
Confira as versões suportadas mais recentes | Versões suportadas diferem por liberação |
| Conectar a bancos de dados para implementações em lote | Confira o suporte por tipo de implementação | Confira o suporte por tipo de implementação e por versão |
| Implementar e marcar scripts Python | Disponível por meio do cliente Python | Criar scripts em JupyterLab ou cliente Python , em seguida, implementar |
| Implantação e pontuação de lote R Scripts | Não disponível | Disponível |
| Implementar aplicativos Shiny | Não disponível | Criar e implementar apps Shiny Deploy a partir do pacote de códigos |
| Avaliar tarefas para justiça ou desvio | Requer o serviço watsonx.governance | Requer o serviço Watson OpenScale ou watsonx.governance |
| Avaliar implementações on-line em um espaço para justiça, desvio ou explicabilidade |
Não disponível | Disponível Requer o serviço Watson OpenScale ou watsonx.governance |
| Avaliar modelos de prompt implementados em um espaço | Disponível | |
| Avaliar modelos de prompt desconectados em um espaço | Disponível | |
| Criação de espaço de controle | Sem restrições por função | Use permissões para controlar quem pode visualizar e criar espaços |
| Importar do projeto GIT para o espaço | Não disponível | Disponível |
| Pacote de código criado automaticamente ao importar do projeto Git para o espaço |
Não disponível | Disponível |
| Atualizar app RShiny do pacote de código | Não disponível | Disponível |
| Criar e usar imagens customizadas | Não disponível | Criar imagens customizadas para Python ou SPSS |
| Notificar colaboradores sobre eventos de Pipeline | Não disponível | Use Enviar e-mail para notificar os colaboradores |
| Experimentos de deep learning | Não disponível | Requer o serviço IBM Scheduler |
| Provisionar e gerenciar instâncias de serviço IBM Cloud | Adicionar instâncias para watsonx.ai Runtime ou Watson OpenScale |
Os serviços são provisionados no cluster pelo administrador |
watsonx.governance
Os recursos de governança a seguir são efetivamente os mesmos nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, nas versões 5.2, 5.1 e 5.0:
- Avaliar implementações para justiça
- Avaliar a qualidade das implementações
- Monitorar implementações para desvio
- Visualizar e comparar resultados do modelo em um painel do Insights
- Inclua implementações do provedor de aprendizado de máquina de sua escolha
- Configurar alertas para acionar quando as avaliações caem abaixo de um limite especificado
- Avaliar implementações em uma interface de usuário ou notebook
- Avaliações e métricas customizadas
- Visualizar detalhes sobre avaliações em fichas técnicas de modelo
Esta tabela descreve as diferenças de recursos entre o serviço watsonx.governance nos ambientes de implantação como serviço e de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais.
| Recurso | Como um serviço | Software |
|---|---|---|
| Avalie modelos de aprendizado de máquina | True | True |
| Upload de dados de teste pré-pontuados | Não disponível | Disponível |
| IBM SPSS Collaboration and Deployment Services | Não disponível | Disponível |
| Processamento em lote | Não disponível | Disponível |
| Controlar o controle de acesso por grupos de usuários | Não disponível | Disponível |
| Banco de dados grátis e planos Postgres | Disponível | Postgres disponível |
IBM watsonx.data intelligence
Os recursos a seguir são efetivamente os mesmos para IBM watsonx.data intelligence em Cloud Pak for Data as a Service e no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0:
- Colaboração em projetos e catálogos
- Importação e exportação do projeto usando um arquivo ZIP do projeto
- Pesquisa com IA em catálogos
- Classificação e revisão de ativos em catálogos
- Ferramenta Data Refinery em projetos
- Categorias com funções de colaborador
- Classificações predefinidas e customizadas
- Classes de dados predefinidas e customizadas
- Regras de controle
- Políticas
- Regras de proteção de dados
- Regras do SLA de qualidade de dados
- Criação de perfil manual de ativos de dados relacionais individuais em um projeto ou catálogo
- Criação de perfil automática de ativos de dados relacionais adicionados a um catálogo governado
- Ferramenta de enriquecimento de metadados em projetos para execução de perfis, atribuição de termos, análise de qualidade e análise de chave ou relacionamento em grandes conjuntos de ativos de dados
- Tipos de ativos customizados, propriedades customizadas para ativos e relacionamentos customizados entre ativos em catálogos
- Monitorar tarefas de workflow
- Entregar conjuntos de dados mascarado em projetos com fluxos de mascaramentos
- Informações detalhadas sobre a qualidade dos dados para ativos de dados em projetos e catálogos, e como parte dos resultados de enriquecimento de metadados
- Fluxos de trabalho de correção para problemas de qualidade de dados
- Criar ativos de dados conectados e ativos de dados segmentados com consultas SQL
- Executar painel de métricas e janelas de execução para trabalhos de enriquecimento de metadados
Esta tabela descreve as diferenças de recursos entre o serviço IBM watsonx.data intelligence nos ambientes de implantação como serviço e de software, as diferenças entre os planos de oferta e se são necessários serviços adicionais. Para obter mais informações sobre as diferenças de recursos entre os planos de oferta em Cloud Pak for Data as a Service, consulte IBM Knowledge Catalog legacy service plans e watsonx.data intelligence offering plans.
A partir da versão Cloud Pak for Data 5.0, você pode instalar o cartucho IBM Knowledge Catalog Premium ou o cartucho IBM Knowledge Catalog Standard em vez do serviço IBM watsonx.data intelligence. IBM Knowledge Catalog Premium oferece os mesmos recursos que o serviço IBM watsonx.data intelligence, além de recursos de IA generativa. IBM Knowledge Catalog Standard fornece um subconjunto de recursos do IBM watsonx.data intelligence, além de recursos generativos de IA.
| Recurso | Como um serviço | Software |
|---|---|---|
| Organizar ativos em projetos com pastas | Disponível (beta) | Disponível |
| Metadata import ferramenta em projetos-descoberta | Importar ativos de dados em projetos ou catálogos. Suporte para um subconjunto de conexões de projeto e de catálogo. Consulte Origens de dados suportadas para curadoria e qualidade de dados. | Importar diferentes tipos de ativos: • Importar ativos de dados em projetos ou catálogos. A maioria das conexões suportadas são as mesmas em ambos os ambientes de implementação. • Importe relatórios de inteligência de negócios, ativos com seus scripts de transformação associados, tarefas ETL ou modelos de dados em catálogos Requer instalação do MANTA Automated Data Lineage sem uma chave de licença. Suporte para um subconjunto de conexões de catálogo. ' Consulte Fontes de dados compatíveis para curadoria e qualidade de dados. |
| Metadata import ferramenta em projetos-linhagem | Disponível. A linhagem de dados deve estar ativada. Limites por plano. |
- Importar a linhagem de ativos de dados para os catálogos. Requer a instalação do IBM Manta Data Lineage ou MANTA Automated Data Lineage com uma chave de licença. - Capture e acesse a linhagem de trabalhos de ETL no MANTA Automated Data Lineage. Requer a instalação do MANTA Automated Data Lineage com uma chave de licença. Suporte para um subconjunto de conexões de catálogo. Consulte Fontes de dados compatíveis para curadoria e qualidade de dados. |
| Enriquecimento aprimorado usando IA generativa | Disponível. | Não disponível. A partir da versão 5.0, instale o IBM Knowledge Catalog Premium ou o IBM Knowledge Catalog Standard. |
| Gerar e executar automaticamente verificações de qualidade de dados como parte do enriquecimento de metadados | Disponível. | Disponível a partir de 5.2. |
| Regras de qualidade de dados em projetos | Disponível Requer o serviço do DataStage |
Disponível. Requer o serviço DataStage . |
| Incluir diversos ativos em um catálogo com um arquivo | Disponível. | Disponível. |
| Atividades do ativo | Requer um plano pago. Disponível em projetos e catálogos. |
Disponível em projetos e catálogos. |
| Linhagem de Negócios | Não disponível | Disponível. |
| Linhagem de dados técnicos | Não Disponível. | Disponível. Requer a instalação de uma versão licenciada do MANTA Automated Data Lineage for IBM Cloud Pak for Data. Gerado executando a ferramenta de importação de metadados. Pode ser acessado a partir de catálogos. |
| Linhagem de Dados | Requer habilitação. | Requer a ativação e o serviço IBM Manta Data Lineage. |
| Termos de negócios | Limites para alguns planos. | Disponível. |
| Termos comerciais predefinidos | Os termos comerciais predefinidos e a categoria de dados pessoais de amostra do Knowledge Accelerator que os inclui estão disponíveis somente se você criar uma instância de serviço IBM watsonx.data intelligence com um plano Lite ou Standard após 7 de outubro de 2022. | Não Disponível. |
| Conjuntos de dados de referência | Limites por plano. | Disponível. |
| Relacionamentos customizados para artefatos | Requer um plano pago. | Disponível. |
| Knowledge Accelerators | Requer um plano Enterprise do hub de recursos. |
Fornecido com a plataforma. |
| Configurações de fluxo de trabalho customizadas para artefatos de governança e solicitações | Disponível para artefatos de governança. | Disponível. |
| Funções de categoria customizadas | Limites por plano. | Disponível. |
| Regras de proteção de dados de exportação e importação | Para exportar regras de proteção de dados de qualquer sistema e importar as regras para o mesmo sistema ou para um sistema diferente, você pode usar APIs. Para obter detalhes, consulte Migração de regras de proteção de dados. | Para exportar regras de proteção de dados de qualquer sistema e importar as regras para o mesmo sistema ou para um sistema diferente, você pode usar APIs ou comandos cpd-cli. Para obter detalhes, consulte Migração de regras de proteção de dados. |
| Relatórios administrativos | Requer um plano pago. | Disponível. |
| Explorador de relacionamento | Disponível. | Disponível a partir de 5.0 É necessário instalar o componente opcional de gráfico de conhecimento com IBM watsonx.data intelligence. |
DataStage
A tabela a seguir descreve as diferenças de recursos entre DataStage on Cloud Pak for Data as a Service e DataStage no software Cloud Pak for Data, versões 5.2, 5.1 e 5.0.
| Recurso | Como um serviço | Software |
|---|---|---|
| Gerenciamento de instância PX | É possível provisionar instâncias a partir de um conjunto de tamanhos pré-definidos. O tamanho personalizado está disponível no site DataStage-aaS Anywhere. | É possível provisionar instâncias de forma mais flexível usando administração de instância do Cloud Pak for Data. |
| Compilação de tarefas |
|
|
| Tempo de execução de tarefas | É possível enviar quantas tarefas desejar, sujeito a enfileiramento. |
|
| Gerenciamento de ativos | Para arquivos do tipo .xls, .xlsx, .xml e .json, apenas estruturas simples são suportadas. Esquemas multinível / aninhados não podem ser analisados. | O suporte completo de arquivos do tipo .csv, .txt, .xls, .xlsx, .xml e .json está disponível. |
| Armazenamento |
|
|
| Estágio Java Integration | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Componente da biblioteca Java | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Conexão JDBC genérica | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Excel | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| AVI | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Estágio External Source | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Estágio External Target | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Estágio hierárquico |
|
Disponível |
| SMP | S, M, L são configuração de nó único SMP. Use um mecanismo de tempo de execução remoto para definir uma configuração alternativa. | Cargas de trabalho paralelas são gerenciadas por meio de partições lógicas, que são configuradas com a opção APT_CONFIG_FILE. |
| SAP Bulk Extract conexão | Não disponível | Disponível |
| SAP Delta Extract | Não disponível | Disponível |
| Estágio Wrapped | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Conexão SAP HANA | Não disponível | Disponível |
| Fonte de dados de texto em conexão ODBC | Não disponível | Disponível |
| Estágio Build | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Enviar relatórios usando subroutines anteriores / after-job | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Estágio customizado | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Apache HBase | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Autenticação de Kerberos para conexões Apache Hive | Não disponível | Disponível |
| Funções definidas pelo usuário | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| APT_CONFIG_FILEs criados pelo usuário | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Propriedades antes / depois do trabalho | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Conector de serviço de dados | Não disponível | Disponível |
| Db2 Sequência de banco de dados em estágio Lentamente Mudando Dimensão, estágio do Gerador de Chave Substituta e estágio Transformador | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Use a conexão Apache Hive como um alvo. (Disponível quando Usar DataStage é selecionado no conector.) | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Parametrizar propriedades com conexões locais | Não disponível | Disponível |
| Operational Decision Manager estágio | Disponível comDataStage-aaS Em qualquer lugar | Disponível |
| Espaços de implementação | Não disponível | Disponível |
Data Virtualization
No Cloud Pak for Data as a Service, a funcionalidade de virtualização de dados é fornecida pelo serviço Data Virtualization. A funcionalidade de virtualização de dados a seguir é efetivamente a mesma nos softwares Cloud Pak for Data as a Service e Cloud Pak for Data, nas versões 5.2, 5.1 e 5.0.
- Conectando-se a origens de dados suportadas
- Virtualizando dados
- Governando dados virtuais usando políticas e regras de proteção de dados
- Monitorando e explorando o serviço
- Usando a interface SQL
- Armazenando em Cache
- Mascaramento de coluna
- Explore a visualização e o recarregamento de tabelas
- Amostragem de dados na coleta de estatísticas
- Enriquecimento de metadados
A funcionalidade de virtualização de dados a seguir parece ser diferente na interface com o usuário, mas fornece a mesma funcionalidade básica:
- Publicando dados virtuais em catálogos
- Gerenciando o acesso a objetos virtuais
- Administrando usuários e funções
- Ajustando a escala do serviço
- Coleta de estatísticas no cliente Web na Data Virtualization
Esta tabela descreve as diferenças de recursos entre o software " Data Virtualization (antigo " Watson Query) no " Cloud Pak for Data as a Service e o " Data Virtualization (antigo " Watson Query) no " Cloud Pak for Data.
| Recurso | Como um serviço | Software |
|---|---|---|
| Use o Cloud Pak for Data Data Source Definitions (DSD) para aplicar as regras de proteção de dados do IBM watsonx.data intelligence | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Consultar dados em origens de dados da API REST | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Tabelas de consultas de catálogos anteriores do Presto e Databricks com suporte a vários catálogos | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Escalar instâncias de serviço automaticamente | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Mascarar caracteres multibyte para privacidade aprimorada de dados sensíveis | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Visualizar as regras de proteção de dados que são aplicadas a um usuário | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Segurança aprimorada para resultados de criação de perfil em visualizações de Data Virtualization | Não aplicável para SaaS | Disponível a partir de 5.0 |
| As conexões de Data Virtualization em catálogos agora referenciam a conexão da plataforma | Não aplicável para SaaS | Disponível a partir de 5.0 |
| As conexões de Data Virtualization em catálogos agora referenciam a conexão da plataforma | Não aplicável para SaaS | Disponível a partir de 5.0 |
| Segurança aprimorada para a função Administrador: a função Administrador não tem acesso padrão a todos os dados. | Não aplicável para SaaS | Disponível |
| IBM watsonx.data intelligence as regras de proteção de dados estão sempre ativadas para os dados do Watson Query | Não aplicável para SaaS | Disponível |
| Proteja seus objetos não governados: Com as regras de proteção de dados do IBM watsonx.data intelligence em Watson Query, os objetos virtualizados que não são publicados em um catálogo controlado seguem a configuração da convenção de acesso a dados padrão de suas configurações de regra. | Não aplicável para SaaS | Disponível |
| Consultar dados Presto : é possível criar uma conexão com o Presto para acessar e consultar dados no Presto. | Não aplicável para SaaS | Disponível |
| Criação de log de auditoria para monitorar a atividade do usuário e acesso a dados | Disponível | Disponível |
| Integração com o site IBM watsonx.data intelligence | Necessário | Opcional |
| Autorização baseada em grupo e acesso de nível de objeto para grupos | Não disponível | Disponível |
| Suporte para conectores remotos | Não aplicável para SaaS | Disponível |
| Suporte para origens de dados baseadas em sistema de arquivos, exceto no Cloud Object Storage | Não aplicável para SaaS | Disponível |
| Conectando-se a fontes de dados que requerem um driver JDBC carregados, por exemplo, SAP HANA, Geric JDBC | Não aplicável para SaaS | Disponível |
| Coleta de estatísticas na interface com o usuário | Não disponível | Disponível |
| Coleta de estatísticas automática durante a virtualização de objetos | Não disponível | Disponível |
| Gerenciamento de acesso para vários grupos | Não disponível | Disponível |
| Suporte para arquivos CSV ou TSV em Cloud Object Storage | Não aplicável para SaaS | Disponível |
| Credenciais em cofres para conexões em Cloud Object Storage | Não aplicável para SaaS | Disponível |
| Armazenamento automático de consultas em cache | Não disponível | Disponível a partir da versão 5.0.3 |