Preguntas más frecuentes

¿Qué es IBM Watson® Knowledge Catalog?

IBM Watson Knowledge Catalog es un repositorio de metadatos empresarial basado en el cloud que le permite catalogar sus activos de conocimiento y análisis, como modelos de machine learning y datos estructurados y no estructurados, con independencia de dónde residan. De esta forma, es más fácil acceder a esos activos y usarlos para alimentar la ciencia de datos y todas las formas de IA.

Para algunos tipos de origen, IBM Watson Knowledge Catalog es capaz de descubrir activos de datos y registrarlos automáticamente en la conexión suministrada. Según se añaden activos al catálogo, se indexan y clasifican automáticamente, facilitando a ingenieros, científicos de datos, responsables de datos y analistas empresariales la tarea de encontrar, entender, compartir y usar dichos activos. La búsqueda y recomendaciones basadas en IA guían a los usuarios hasta los activos más pertinentes del catálogo, basándose en las relaciones entre activos, su uso y las conexiones sociales entre usuarios.

IBM Watson Knowledge Catalog con una infraestructura de gobierno inteligente y robusta, le permite definir políticas de datos y acceso que contribuyen a asegurar que los datos correctos lleguen a las personas indicadas.

Con el glosario empresarial de IBM Watson Knowledge Catalog, los usuarios logran desarrollar un vocabulario empresarial común, asociándolo a sus activos, políticas y reglas, y creando un puente que une el dominio empresarial con los activos técnicos.

¿En qué regiones se puede desplegar IBM Watson Knowledge Catalog?

Si tiene restricciones de datos regionales, puede implantarlo en una de las siguientes ciudades: Dallas, Londres, Fráncfort o Tokio.

¿Tengo que trasladar mis datos a IBM Watson Knowledge Catalog?

No, puede mantener sus datos en sus repositorio actuales. Watson Knowledge Catalog almacena los metadatos de sus activos.

¿Qué orígenes de datos y tipos de activo son compatibles?

IBM ofrece más de 30 conectores a orígenes de datos en el cloud o locales, lo que le permite conectar sus activos de datos remotos. Por ejemplo, IBM dispone de conectores a IBM® Db2® en el cloud o local, IBM Cloudant®, IBM Cloud® Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase y muchos otros.

Además de los activos de orígenes de datos remotos, IBM Watson Knowledge Catalog admite otros tipos de activos, como datos estructurados (fila/columna), semiestructurados y no estructurados. Por ejemplo, puede añadir al catálogo archivos CSV, Microsoft Excel, PDF, Text, Microsoft Word, Jupyter Notebook (IPYNB), image y HTML, para elaborar un perfil y compartirlo con otros usuarios.

¿Cuál es el número máximo de activos que puedo tener en IBM Watson Knowledge Catalog?

Con el plan Professional, no hay límite en el número de activos que puede tener en IBM Watson Knowledge Catalog. Con los planes Standard y Lite, los límites son 1.000 y 50 activos, respectivamente.

¿IBM Watson Knowledge Catalog presta servicios de gobierno?

IBM Watson Knowledge Catalog incluye un motor de imposición de políticas automático que determina los resultados basándose en las políticas y la acción que se haya realizado. IBM Watson Knowledge Catalog brinda la posibilidad de configurar políticas de gobierno dentro del sistema, de forma que puede restringir acceso a datos o transformar los datos enmascarando contenido confidencial.

¿Se puede borrar o cambiar el origen de datos de origen con una política de datos que enmascare datos?

No. Cuando una política de protección de datos anonimiza datos confidenciales del catálogo, solo se transforman los datos de vista previa que gestiona la aplicación. El origen de datos no se modifica.

¿Hay prácticas recomendadas para gestionar artefactos de gobernabilidad en IBM Watson Knowledge Catalog?

En IBM Watson Knowledge Catalog en IBM Cloud Pak for Data v3.5, se pueden asignar usuarios y responsables de datos a categorías, de forma que puede decidir quién puede ver o gestionar artefactos de gobernabilidad propios de la categoría. Los roles de colaborador de categoría pueden aprovecharse en los flujos de trabajo, permitiendo pasos del flujo de trabajo directamente a las personas responsables de revisiones y aprobaciones. Con esta nueva prestación, se puede otorgar a la comunidad empresarial la capacidad de autogobierno de sus propios activos empresariales.

Pasos importantes para planificar e implementar la administración de sus artefactos de gobernabilidad.

 

¿IBM Watson Knowledge Catalog ofrece servicios de clasificación?

IBM Watson Knowledge Catalog puede clasificar automáticamente las columnas de sus activos de datos cuando se añaden al catálogo. Los componentes integrados disponen de más de 160 clasificadores de atributos, incluidos nombres, direcciones de correo electrónico, direcciones postales, números de tarjeta de crédito, números de carné de conducir, números de carné de identidad, fechas de nacimiento, información demográfica y números de Data Universal Numbering System (DUNS), entre otros. Los catálogos también elaboran perfiles de activos de datos sin estructurar y extraen metadatos del contenido, como categorías, conceptos, sentimiento y emoción.

¿Cuenta IBM Watson Knowledge Catalog con prestaciones de preparación de datos?

Sí. Las prestaciones de preparación de datos están disponibles a través de IBM Data Refinery, que forma parte de IBM Watson Knowledge Catalog. Data Refinery proporciona un abundante conjunto de prestaciones que le permiten descubrir, limpiar y transformar sus datos con operaciones incorporadas. Con potentes herramientas de elaboración de perfiles y visualización, como tablas, gráficos y estadísticas, que ayudan a interactuar con sus datos y comprenderlos. Las políticas de acceso y transformación de datos definidas en IBM Watson Knowledge Catalog, también se aplican en Data Refinery asegurándose que los datos confidenciales originados a partir de catálogos gobernados, siguen estando protegidos.

¿Cómo se accede a las prestaciones de gestión de datos de referencia?

Para acceder a la prestación de gestión de datos de referencia, inicie sesión en su instancia de IBM Cloud Pak for Data. Desde la barra de navegación izquierda, acceda a "Reference Data" en la sección "Governance".

Cuando esté en la página "Reference Data", verá la lista de todos los conjuntos de datos de referencia publicados y en borrador definidos en el sistema. Para empezar, la lista estará vacía y usted podrá crear un conjunto de datos de referencia con el botón "Add Reference Data set" > "New Reference Data Set".

 

¿Se pueden configurar grupos de acceso para personas de diferentes líneas de negocio?

Sí. Pueden configurarse grupos de acceso con IBM Cloud® Identity and Asset Management. En el módulo Access Control de IBM Watson Knowledge Catalog, puede añadir un colaborador o un grupo de usuarios.

¿Qué son las horas unitarias de capacidad (CUH)?

Los flujos de Data Refinery, la interfaz de usuario de Data Refinery y las tareas de elaboración de perfiles, se cobran en función del número total o de las unidades de capacidad necesarias por hora para cada tipo de capacidad:

  • Los flujos de Data Refinery requieren 1,5 unidades de capacidad por hora con un entorno Spark predeterminado. Para otros entornos personalizados, el cálculo depende del número de ejecutores y recursos usados para el controlador y el ejecutor Spark.
  • La interfaz de usuario interactiva de Data Refinery precisa 1,5 unidades de capacidad por hora, a partir de que se inicia la interfaz de usuario de refinería y hasta que se cierra.
  • Las tareas de elaboración de perfiles requieren 6 unidades de capacidad por hora. Para cada ejecución de tarea, se aplicará un coste mínimo de 0,96 (equivalente a 10 minutos).

En cada plan del mes se incluye un número fijo de horas de unidad de capacidad. Para los planes Standard y Professional, se aplicarán costes cuando se alcance el límite del plan para ese mes. En el plan Lite, cuando se alcance el límite del plan para ese mes, no podrán ejecutarse tareas de flujo de Data Refinery ni elaboración de perfiles hasta el mes siguiente, o hasta que el plan se actualice a las categorías Standard o Professional.
Ejemplo de flujo de Data Refinery con el tipo de capacidad 3 predeterminado:

  1. Un flujo de Data Refinery se ejecuta durante una hora: 1,5 CUH
  2. Dos flujos de Data Refinery se ejecutan durante una hora cada uno: 2 horas * 1,5 CUH = 3 CUH
  3. Un flujo de Data Refinery se ejecuta durante 30 minutos: 0,5 horas * 1,5 CUH = 0,75 CUH
  4. Se usa durante una hora la interfaz de usuario interactiva de Data Refinery: 1,5 CUH

Ejemplos de elaboración de perfiles (las tareas de elaboración de perfiles se pueden iniciar de forma automática o manual):

  1. Una tarea de elaboración de perfiles se ejecuta durante 30 minutos: 0,5 horas * 6 CUH = 3 CUH
  2. Una tarea de elaboración de perfiles se ejecuta durante 9 minutos: En este caso, se aplica el coste mínimo. 0,16 horas * 6 CUH = 0,96 CUH

 

Después de comprar un plan Standard o Professional, ¿qué configuración es necesaria para sacar el máximo provecho al producto?

IBM Watson Knowledge Catalog es totalmente autoservicio, así que un administrador puede empezar creando un catálogo y después, añadir y seleccionar activos inmediatamente. Las tareas adicionales pueden ser:

  • Creación de un glosario empresarial
  • Definición de políticas de protección de datos para gobernar el acceso a los datos
  • Invitación de usuarios al catálogo

¿Esto está disponible en IBM Cloud Pak® for Data?

Sí. Descubra más sobre esta plataforma de datos e IA integrada de IBM.

Pruebe IBM Watson Knowledge Catalog

Active datos listos para el negocio para la IA y la analítica con la catalogación inteligente.