O que é o IBM Watson Knowledge Catalog?

O IBM Watson® Knowledge Catalog é um repositório de metadados corporativos baseado em cloud, que permite catalogar seus ativos de conhecimento e análise, incluindo modelos de machine learning e dados estruturados e não estruturados, onde quer que eles estejam, para que possam ser facilmente acessados e usados para impulsionar a ciência de dados e todas as formas de IA.

Para tipos de fonte selecionados, o Watson Knowledge Catalog pode descobrir e registrar automaticamente ativos de dados na conexão fornecida. Os ativos são automaticamente indexados e classificados assim que são incluídos no catálogo, facilitando sua localização, seu entendimento, seu compartilhamento e seu uso por usuários, como engenheiros de dados, cientistas de dados, organizadores de dados e analistas de negócios. A procura e as recomendações desenvolvidas com IA orientam os usuários para os ativos mais relevantes no catálogo, com base no entendimento de relacionamentos entre ativos, como esses ativos são usados e conexões sociais entre usuários.

O Watson Knowledge Catalog também fornece um modelo de controle inteligente e robusto, que permite definir e aplicar dados e políticas de acesso para garantir que os dados certos cheguem às pessoas certas. 

Por meio do glossário de negócios do Watson Knowledge Catalog, os usuários podem criar um vocabulário de negócios comum e associá-lo a seus ativos, políticas e regras, fornecendo a ponte entre o domínio de negócios e seus ativos técnicos.

Em quais regiões o Watson Knowledge Catalog pode ser implementado?

Se houver restrições de dados regionais, será possível implementar em uma das cidades a seguir: Dallas,  Londres,  Frankfurt ou  Tóquio.

O Watson Knowledge Catalog está disponível em outros lugares do mundo?

Sim.  Além dos EUA, é possível inscrever-se para o Watson Knowledge Catalog no Reino Unido,  Alemanha,  e no Japão.

É necessário migrar meus dados para o Watson Knowledge Catalog?

Não. É possível manter seus dados em seus repositórios existentes. O Watson Knowledge Catalog armazena os metadados de seus ativos.

Quais fontes de dados e tipos de ativos são suportados?

A IBM fornece mais de 30 conectores para os tipos de fontes de dados em cloud ou on premisses que permitirão a conexão aos seus ativos de dados remotos. Por exemplo, conectores para o IBM Db2® em cloud ou local, o IBM Cloudant®, o IBM Cloud™ Object Storage, o Oracle, o Microsoft SQL Server, o Microsoft Azure, o Amazon S3, o Salesforce.com, o Hortonworks HDFS, o Sybase e muitos outros estão disponíveis na IBM.

Além de ativos de fontes de dados remotas, o Watson Knowledge Catalog suporta outros tipos de ativos, como dados estruturados (linha/coluna), semiestruturados e não estruturados. Por exemplo, é possível incluir CSV, Microsoft Excel, PDF, Text, Microsoft Word, Jupyter Notebook (IPYNB), imagem e arquivos HTML, para citar alguns, no catálogo para a criação de perfil e o compartilhamento com outros usuários.

Qual é o número máximo de ativos que posso ter no Watson Knowledge Catalog?

Com o plano Professional, não há um limite no número de ativos que você pode ter no Knowledge Catalog. Com os planos Lite e Standard, os limites são 50 e 500 ativos, respectivamente.

O Watson Knowledge Catalog fornece serviços de governança?

O Watson Knowledge Catalog inclui um mecanismo de aplicação de política automatizado, que determina os resultados com base nas políticas e na ação tomada. O Watson Knowledge Catalog fornece a capacidade de configurar suas políticas de controle dentro do sistema, para seja possível restringir o acesso aos dados ou transformá-los mascarando conteúdos sensíveis. 

É possível excluir ou mudar a fonte de dados original com uma política de dados que mascara dados?

Não. Quando uma política de proteção de dados torna os dados sensíveis anônimo no catálogo, somente os dados de visualização gerenciados pelo aplicativo são transformados. Os dados fonte originais não são modificados.

O Watson Knowledge Catalog fornece serviços de classificação?

O Watson Knowledge Catalog pode classificar automaticamente as colunas em seus ativos de dados quando eles forem incluídos no catálogo. Os componentes integrados fornecem mais de 160 classificadores de atributos, incluindo nomes, e-mails, endereços postais, números de cartões de crédito, números de carteira de motorista, números de identificação do governo, data de nascimento, informações demográficas, números do Data Universal Numbering System (DUNS) e muito mais. Os catálogos também criam perfis de dados não estruturados e extraem metadados do conteúdo, como categorias, conceitos, impressão e emoção. Consulte Criação de perfil de ativos de dados.

Há recursos de preparação de dados no Watson Knowledge Catalog?

Sim. Os recursos de preparação de dados estão disponíveis por meio do Data Refinery, que faz parte do Watson Knowledge Catalog. O Data Refinery fornece um rico conjunto de recursos que não somente permite a descoberta, a limpeza e a transformação de seus dados com operações integradas, mas também é fornecido com ferramentas poderosas de criação de perfil e visualização, como gráficos e estatísticas, para ajudar você a entender e interagir com seus dados. As políticas de transformação e acesso a dados definidas no Watson Knowledge Catalog também são aplicadas no Data Refiney para garantir que dados sensíveis originados de catálogos controlados permaneçam protegidos.

É possível configurar grupos de acesso para pessoas em diferentes linhas de negócios?

Sim. Os grupos de acesso podem ser configurados por meio do IBM Cloud Identity and Asset Management.No módulo de Controle de Acesso do Watson Knowledge Catalog, é possível incluir um colaborador ou um grupo de usuários.

O que são horas da unidade de capacidade?

Os fluxos do Data Refinery, a IU interativa do Data Refinery e as tarefas de criação de perfil são cobrados pelo número de unidades completas ou de capacidade necessárias por hora para cada tipo de capacidade:

  • Os fluxos do Data Refinery requer 1,5 unidade de capacidade por hora com um ambiente padrão do Spark. Para outros ambientes customizados, o cálculo depende do número de executores e recursos usados para o driver e o executor do Spark.
  • A IU interativa do Data Refinery requer 1,5 unidade de capacidade por hora, desde a inicialização até o encerramento da IU.
  • As tarefas de criação de perfil requerem seis unidades de capacidade por hora. Um encargo mínimo de 0,96 (equivalente a 10 minutos) será aplicado para cada execução de tarefa.

Um número configurado de horas de unidade de capacidade gratuitas é incluído em cada plano para o mês. Para os planos Standard e Professional, os encargos serão aplicados após o limite do plano ser atingido para esse mês. Para um plano Lite, após o limite do plano para esse mês ser atingido, nenhum fluxo do Data Refinery ou tarefa de criação de perfil poderá ser executado até o próximo mês ou até que o plano seja atualizado para o Standard ou Professional.

Exemplos de fluxo do Data Refinery usando o Tipo de Capacidade 3 padrão:

  1. Um fluxo do Data Refinery executado por 1 hora: 1,5 CUHs
  2. Dois fluxos do Data Refinery executados por 1 hora cada: 2 horas * 1,5 CUHs = 3 CUHs
  3. Um fluxo do Data Refinery é executado por 30 minutos: 0,5 horas * 1,5 CUHs = 0,75 CUHs
  4. IU interativa do Data Refinery usada por 1 hora: 1,5 CUHs

Exemplos de criação de perfil (as tarefas de criação de perfil podem ser acionadas automática ou manualmente):

  1. Uma tarefa de criação de perfil executada por 30 minutos: 0,5 horas * 6 CUHs = 3 CUHs
  2. Uma tarefa de criação de perfil executada por 9 minutos. O encargo mínimo se aplica nesse cenário: 0,16 horas * 6 CUHs = 0,96 CUHs

Após a compra de um plano Standard ou Professional, quão complexa é a configuração para tirar total proveito do produto?

O Watson Knowledge Catalog é baseado no autoatendimento, portanto, um administrador pode começar criando um catálogo e, em seguida, incluir e organizar ativos imediatamente. Tarefas adicionais podem incluir:

  • Como criar um glossário de negócios
  • Definir políticas de proteção de dados para controlar o acesso aos dados
  • Convidar usuários para o catálogo

Isso está disponível no IBM Cloud Pak for Data?

Sim. Conheça mais sobre a mais recente plataforma de dados integrados da IBM: IBM Cloud Pak™ for Data

Testar o Watson Knowledge Catalog

Aproveite o machine learning e a IA para analisar seus dados. Catalogue seus dados para facilitar sua localização e utilização.