Configuración de las herramientas de inteligencia de datos
Habilitar o deshabilitar el uso de IA generativa para herramientas de inteligencia de datos en un proyecto.
Si las capacidades de IA generativa están IBM Knowledge Catalog Premium habilitadas en general, puede desactivar las funciones para proyectos específicos.
Para algunas de las capacidades, se aplican requisitos de implementación adicionales. Para obtener más información, consulte «Preparación para instalar IBM Knowledge Catalog » en la documentación « IBMSoftware Hub ».
Si desactivas estas funciones para un proyecto, dicho proyecto no podrá habilitarse para consultas en lenguaje natural y el uso de la IA generativa quedará desactivado para determinados objetivos de enriquecimiento de metadatos y para las reglas de calidad de los datos.
Es posible que desee hacerlo en proyectos configurados para casos de uso que no dependen de las capacidades de IA generativa de las herramientas de inteligencia de datos, con el fin de evitar el uso innecesario de la IA generativa y limitar así el coste que supone trabajar con modelos de lenguaje grandes.
Si desea que las capacidades de IA genérica estén disponibles en un proyecto más adelante, puede volver a activar las funciones.
Consultas en lenguaje natural
Cuando habilitas proyectos que permiten el uso de IA genérica para consultas en lenguaje natural, se inicia un trabajo Onboard for generative AI_<date-time> con el nombre. Este trabajo inicializa el proyecto para la vectorización de metadatos, de modo que estos puedan utilizarse para convertir solicitudes de texto sin formato en consultas SQL o en búsquedas semánticas. Si el proyecto ya contiene activos de datos, los metadatos de estos activos se vectorizan y almacenan directamente. Los metadatos que se añaden tras la inicialización se procesan y vectorizan automáticamente.
Los metadatos vectorizados se utilizan para las conversiones de texto a SQL. Convierta solicitudes de texto sin formato en consultas SQL complejas y precisas que puede ejecutar en fuentes de datos relacionales. No se requiere acceso a una fuente de datos para generar las consultas SQL. Las consultas se generan en función de los metadatos disponibles.
Opcionalmente, puede ejecutar el enriquecimiento de metadatos para adjuntar más metadatos a sus activos, lo que mejora la precisión de las consultas SQL generadas.
- Genere nombres significativos para las columnas que tienen nombres crípticos en la fuente de datos, por ejemplo, acrónimos o abreviaturas que solo los expertos en la materia pueden descifrar.
- Genera descripciones para las columnas que proporcionen contexto adicional a los modelos.
- Ejecute la asignación de términos para proporcionar un contexto empresarial a sus datos que ayude a asignar las consultas en lenguaje empresarial a las columnas adecuadas.
- Perfila los datos y recopila muestras de datos para proporcionar información sobre el formato de los datos al modelo.
- Ejecutar análisis de claves y relaciones para identificar cómo se vinculan los activos de datos.
Para proporcionar aún más contexto al servicio Text-to-SQL, puede cargar archivos CSV con ejemplos de SQL en el proyecto. Para obtener más información, consulte Proporcionar contexto adicional para convertir consultas en lenguaje natural a SQL.
Si desactiva las consultas en lenguaje natural, se detendrá la vectorización de los nuevos metadatos. Sin embargo, puede volver a habilitar esa función en cualquier momento para que los metadatos se procesen de nuevo.
Puede generar consultas SQL a partir de texto sin formato y ejecutar estas consultas para obtener datos de las siguientes fuentes:
- Amazon RDS for Oracle
- Amazon RDS for PostgreSQL
- Amazon Redshift
- Apache Cassandra
- Apache Hive
- Apache Impala
- DataStax Enterprise
- Google BigQuery
- Greenplum
- IBM Db2
- IBM Db2 Warehouse
- IBM Netezza Performance Server
- IBM watsonx.data Presto
- Microsoft Azure Databricks
- Microsoft Azure SQL Database
- Microsoft SQL Server
- MongoDB
- MySQL
- Oracle
- PostgreSQL
- SAP ASE
- SingleStoreDB
- Snowflake
- Teradata
Enriquecimiento de metadatos
En proyectos en los que se habilitan las capacidades de IA generativa, puede ejecutar el enriquecimiento de metadatos para añadir este tipo de metadatos a sus datos:
- Nombres de visualización generados por IA
- Descripciones generadas por IA
- Asignaciones de términos basadas en IA genérica
Calidad de datos
Esta función está disponible a partir de la versión Cloud Pak for Data 5.3.1.
En proyectos en los que se habilitan las capacidades de IA generativa, puede hacer que la IA genere automáticamente descripciones en inglés sencillo para las reglas de calidad de los datos y las expresiones de reglas que contienen. Estas descripciones ayudan a los usuarios a comprender y revisar reglas complejas de calidad de datos.