Proceso de minería de datos

El proceso de minería de datos comprende varios pasos como crear, probar y trabajar con los modelos de minería.

El proyecto de minería de datos comienza con un plan bien definido de inteligencia comercial. Los analistas de la empresa definen el problema a resolver y el objetivo concreto de empresa que se desea cumplir. Cuanto mejor sea esta formulación inicial, más claras serán las directrices acerca de los datos y las funciones de minería que se utilizan para conseguir los resultados deseados.

El proyecto de minería de datos consta de las fases principales siguientes:
  1. Selección y preparación de datos.
  2. Creación del modelo de minería de datos (también denominada fase de preparación).

    Un modelo de minería de datos se crea a partir de un conjunto específico de datos de entrada.
    Durante el proceso de creación del modelo, una vez preparados los datos, debe especificar sus decisiones sobre:
    • Dónde residen los datos de entrada
    • Qué campos de los datos de entrada son apropiados
    • Qué valores se deben utilizar para la función de minería determinada que está utilizando
    • Dónde desea almacenar el modelo final
    Intelligent Miner ® utiliza los siguientes objetos de base de datos al crear un modelo:
    • Métodos definidos por el usuario
    • Procedimientos almacenados
    • Funciones definidas por el usuario
    .
  3. Prueba de un modelo y análisis de su calidad.

    Se puede probar un modelo de Clasificación o Regresión. Después, se puede analizar la calidad del modelo.

  4. Utilización de un modelo que ofrece información acerca de:
    • La visualización de los resultados.

      Puede visualizar los resultados de la minería de datos para analizarlos e interpretarlos. Utilice Visualizador de Intelligent Miner para ver y analizar los resultados.

    • Puntuación de los registros de datos.

      Los modelos se aplican a otros datos en la fase de aplicación de la minería de datos. Utilice Intelligent Miner para puntuar los registros de datos.

    • Análisis de un modelo y preparación para otros pasos del proceso.

      Puede utilizar varias funciones para recuperar información acerca del modelo contenida en las tablas a fin de que otros programas de aplicación realicen otros procesos.