Gestión de grupos de características

Crea un grupo de características para conservar un conjunto de columnas de un activo de datos, junto con los metadatos asociados, para su uso en modelos de « Machine Learning ». Publique grupos de características en IBM watsonx.data intelligence para que pueda utilizarse como almacén de características. Los grupos de características de IBM watsonx.data intelligence pueden ser buscados y reutilizados por otras personas sin necesidad de que accedan a su proyecto.

Requisitos y restricciones

Puede ver un grupo de características para activos en las circunstancias siguientes.

Permisos necesarios

Para ver esta página, puede tener cualquier rol en un proyecto o catálogo.

Para editar o actualizar información en esta página, debe tener el rol Editor o Admin en el proyecto o catálogo.

Espacios de trabajo

Puede ver el grupo de características de activo en estos espacios de trabajo:

  • Proyectos
  • Catálogos
Tipos de activos

Estos tipos de activos pueden tener un grupo de características:

  • Formatos tabulares: archivos CSV, TSV, Parquet, XLS, XSLX, AVRO, TXT y JSON
  • Tipos de datos conectados estructurados y compatibles tanto en watsonx.ai Studio como en IBM watsonx.data intelligence
Tamaño de datos

Sin límites

Grupos de características

Utilice IBM watsonx.data intelligence como almacén de funciones, donde puede guardar y anotar activos de datos para utilizarlos en su organización. Crea un grupo de características para conservar un conjunto de columnas de un activo de datos concreto, junto con los metadatos utilizados para la « Machine Learning ». Por ejemplo, si tiene un conjunto de características para un modelo de aprobación de crédito, puede conservar las características utilizadas para entrenar el modelo, así como algunos metadatos, incluyendo qué columna se utiliza como destino de predicción y qué columnas se utilizan para la detección de sesgo. Los grupos de características simplifican la conservación de los metadatos para las características utilizadas para entrenar un modelo de aprendizaje automático para que otros científicos de datos puedan utilizar las mismas características. Puede ver la pestaña de grupo de funciones al obtener una vista previa de un activo determinado.

Creación de un grupo de características en un proyecto

Antes de empezar

Si crea un perfil para el activo de datos antes de crear un grupo de características, puede seleccionar metadatos de perfil para añadir valores a la característica.

Crear un grupo de características

Puede seleccionar columnas concretas de activos de datos para formar un grupo de características.

  1. En la pestaña Activos del proyecto, pulse el nombre del activo relevante para abrir la vista previa y seleccione la pestaña Grupo de características . Aquí puede crear un grupo de características o ver y editar uno existente. Un activo sólo puede tener un grupo de funciones. Pulse Nuevo grupo de características.

    Crear un grupo de características

  2. Seleccione las columnas que desea utilizar en el grupo de características. Seleccione el recuadro de selección Nombre para incluir todas las columnas como características.

    Seleccionar las columnas del grupo de características

También puede crear un grupo de características para los activos de datos en IBM watsonx.data intelligence. Consulte Activos de catálogo para obtener más información.

Edición de un grupo de características

Una vez seleccionadas las columnas del conjunto de datos que se van a utilizar en el grupo de características, puedes ver cada característica y editarla para especificar la función que desempeñará en los modelos de « Machine Learning ».

Ver grupo de características

  1. Pulse un nombre de característica y pulse Editar esta característica. Se abre una ventana que muestra las pestañas siguientes:

    • Detalles : proporcione la información siguiente sobre la característica.

      Detalles

      Seleccione un Rol para asignarlo a la característica:

      • Input: esta característica se puede utilizar como entrada para entrenar un modelo de aprendizaje automático ( Machine Learning ).
      • Target: la característica que se utilizará como objetivo de predicción cuando los datos se utilicen para entrenar un modelo de aprendizaje automático ( Machine Learning ).
      • Identifier: la clave primaria, como el ID de cliente, que se utiliza para identificar los datos de entrada.

      Especifique una Descripción, Receta (cualquier método o fórmula utilizada para crear valores para la característica) y cualquier Etiquetas.

    • Descripciones de valores

      Descripciones de valores

      Las descripciones de valores le permiten aclarar el significado de valores específicos. Por ejemplo, considere una columna "evaluación de crédito" con los valores -1, 0 y 1. Puede utilizar descripciones de valores para proporcionar significado para estos valores. Por ejemplo, -1 puede significar "evaluación rechazada". Puede especificar descripciones para valores concretos. Para valores numéricos, también puede especificar un rango. Para especificar un rango de valores numéricos, especifique el texto siguiente [n, m] donde n es el inicio y m es el final del rango, entre corchetes y pulse Añadir. Por ejemplo, para describir todos los valores de edad entre 18 y 24 como "millenials", especifique [18,24] como el valor y millenials como la descripción. Si tiene un perfil definido, los valores del perfil se muestran en la lista de descripciones de valores. Desde aquí puede seleccionar un valor o varios valores.

  2. Cuando haya editado la característica, pulse Guardar. Ahora puede ver los cambios en la ventana Detalles de característica . Cierre esta ventana para volver al grupo de características.

Eliminación de características de un grupo

Para eliminar una característica de un grupo:

  1. Obtenga una vista previa del activo en el proyecto y seleccione la pestaña Grupo de características .

  2. En la tabla Características que se muestra, seleccione la característica (o características) que desea eliminar.

  3. En la barra de herramientas que aparece, seleccione Eliminar del grupo.

    Eliminación de características

La característica, o grupo de características si ha seleccionado todas las características, se elimina.

Compartir un grupo de características con un catálogo

De un proyecto a un catálogo

Si tiene un catálogo creado](.. /catalog/create-catalog.html ), entonces desde un proyecto, puede seleccionar los tres puntos junto al activo de datos y seleccionar Publicar en catálogo. A continuación, el catálogo también contiene el activo y su grupo de características se muestra con los detalles de las características rellenados en el activo del catálogo.

Si ha publicado anteriormente un activo con un grupo de características de un proyecto en un catálogo y, a continuación, elimina una característica del activo de proyecto, es posible que desee eliminar esta característica también del catálogo. Puede eliminar el activo del catálogo o volver a publicar del proyecto y elegir la acción duplicadaadecuada. Por ejemplo, al seleccionar sobrescribir se eliminará el grupo de características anterior del catálogo.

Si edita la descripción o la etiqueta de una característica en un proyecto, debe volver a publicar el activo en el catálogo y elegir actualizar como acción duplicada o editar la característica directamente en el activo de catálogo si desea propagar los cambios.

De un catálogo a un proyecto

De forma similar, si tiene características definidas en un catálogo, puede ver el activo en el catálogo, editar el activoy añadir el activo de catálogo al proyecto. A continuación, el proyecto contiene el activo y su grupo de funciones se visualiza con los detalles de funciones rellenados en el activo de proyecto.

Búsqueda de un grupo de características

Puede buscar activos o columnas en todos los catálogos y proyectos. Para filtrar los resultados de la búsqueda para buscar activos con un grupo de características, seleccione Datos para ver las opciones de filtro y seleccione Grupo de características. Los activos que contienen un grupo de características se listarán en los resultados de la búsqueda.

Más información

Para ver ejemplos sobre cómo crear y utilizar grupos de características en cuadernos:

  • Creación y utilización de datos de almacén de características. Véase el ejemploFeatureGroup-Project. Seleccione la versión relevante y la subcarpeta Projects .

Consulte también: