Entrenamiento de modelos

Un analista de minería de datos desea obtener las normas contenidas en los datos históricos. Se selecciona un algoritmo de minería específico, se configura y se aplica a un conjunto de datos de entrada especificado. La ejecución del algoritmo de minería se denomina fase de preparación. El resultado de la fase de preparación es un modelo de minería de datos.

Puede utilizar el modelo para las tareas siguientes:
  • Calcular las puntuaciones de los registros nuevos (aplicar el modelo)
  • Exploración gráfica del modelo con el Visualizador de Intelligent Miner ®)
  • Extracción de las reglas como filas de base de datos utilizando las funciones de tabla de Intelligent Miner

En la Figura 1 , la función Modelado buildModel recibe un objeto BldTask que describe el esquema físico (MiningData) y lógico (LogicalDataSpec) de la tabla de entrada, así como los valores que configuran el algoritmo de minería. Produce un modelo de minería.

Figura 1. API de SQL en Intelligent Miner
API de SQL en Intelligent Miner
La fase de preparación consta de los pasos siguientes:
  • Especificación de los datos de minería

    Consiste en el nombre de tabla fuente, los nombres y tipos de columna y los seudónimos opcionales

  • Definición de especificaciones de datos lógicos

    Contiene el nombre y el tipo de campo de minería para todos los campos de la tabla fuente. Opcionalmente, contiene también las correlaciones de nombres, las taxonomías o las propiedades de campos numéricos. Un nombre de campo de minería coincide con un seudónimo de los datos de minería para correlacionar los campos durante el proceso de preparación.

  • Definición de valores de minería
    Consiste en la especificación de datos lógica y los valores específicos de funciones o algoritmos de minería adicionales como, por ejemplo:
    • Campo de transacción/elemento y fiabilidad y soporte para la Asociación
    • Campo de destino para la Clasificación o la Regresión
    • Número de agrupaciones para la Agrupación
  • Definición de tareas de minería
    Combina los valores de minería con los datos de minería. Además, se pueden establecer algunos parámetros de control como, por ejemplo, la ubicación de la información de errores o del proceso. Por ejemplo:
    
    INSERT INTO IDMMX.ClasTasks (ID,TASK)
    WITH MyData (MyDataCol) AS (VALUES(
    IDMMX.DM_MiningData()..DM_defMiningData('HEART')))
    SELECT 'HeartTask', IDMMX.DM_ClasBldTask()..
    DM_defClasBldTask(MyDataCol,cast(NULL as IDMMX.DM_MiningData),
    IDMMX.DM_ClasSettings()..DM_useClasDataSpec(MyDataCol..DM_genDataSpec())..
    DM_setClasTarget('DISEASED')) FROM MyData;
    
    
  • Creación y almacenamiento de los modelos de minería
    La ejecución de una tarea de minería predefinida. El modelo de minería se graba en una tabla durante la ejecución. Por ejemplo:
    
    CALL IDMMX.DM_buildClasModelCmd( 'IDMMX.CLASTASKS', 'TASK','ID','HeartTask', 
         'IDMMX.CLASSIFMODELS','MODEL','MODELNAME','CustModel');