Ponderaciones de instancia y ponderaciones de clase

De forma predeterminada, se supone que todos los registros de entrada y todas las clases tienen la misma importancia relativa. Puede cambiar esto asignando ponderaciones individuales a los miembros de uno o ambos elementos. El hacerlo puede ser de utilidad, por ejemplo, si los puntos de datos en sus datos de entrenamiento no están distribuidos de forma realista entre las categorías. Las ponderaciones le permiten sesgar el modelo, de forma que puede compensar esas categorías que están peor representadas en los datos. Al aumentar la ponderación de un valor destino debería aumentar el porcentaje de las predicciones correctas para esa categoría.

En el nodo de modelado del Árbol de decisión, puede especificar dos tipos de ponderación. Ponderaciones de instancias asignan una ponderación a cada fila de datos de entrada. Las ponderaciones se suelen especificar como 1.0 para la mayoría de los casos, con mayor o menor valor solamente a aquellos casos que son más o menos importantes que la mayoría, por ejemplo:

Tabla 1. Ejemplo de ponderación de instancia
ID de registro destino Ponderación de instancia
1 medicamentoA 1.1
2 medicamentoB 1.0
3 medicamentoA 1.0
4 medicamentoB 0.3

Ponderaciones de clase asignan una ponderación a cada categoría del campo de destino, tal como se muestra en la tabla siguiente.

Tabla 2. Ejemplo de ponderación de clase
Clase Ponderación de clase
medicamentoA 1.0
medicamentoB 1.5

Se pueden utilizar ambos tipos de ponderación al mismo tiempo, en caso de que se hayan multiplicado entre sí y se hayan utilizado como ponderaciones de instancias. De este modo, si se han utilizado dos ejemplos previos de forma conjunta, el algoritmo utilizaría ponderaciones de instancia tal como se muestra en la tabla siguiente.

Tabla 3. Ejemplo de cálculo de ponderación de instancia
ID de registro Cálculo Ponderación de instancia
1 1.1*1.0 1.1
2 1.0*1.5 1.5
3 1.0*1.0 1.0
4 0.3*1.5 0.45