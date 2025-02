Por supuesto, cada algoritmo de clasificación de machine learning difiere en sus operaciones internas. Sin embargo, todos siguen un proceso general de clasificación de datos de dos pasos:

Aprendizaje. En el aprendizaje supervisado, un anotador humano asigna una etiqueta a cada punto de datos del conjunto de datos de entrenamiento. Estos puntos se definen como una serie de variables de entrada (o variables independientes), que pueden ser numéricas, cadenas de texto, características de imagen, etc. En términos matemáticos, el modelo considera cada punto de datos como una tuple x. Una tupla es simplemente una secuencia numérica ordenada representada como x = (x 1 , x 2 , x 3 ... x n ). Cada valor en la tuple es una característica dada del punto de datos. El modelo utiliza las características de cada punto de datos junto con su etiqueta de clase para decodificar qué características definen cada clase. Al mapear los datos de entrenamiento según esta ecuación, un modelo aprende esas características generales (o variables) asociadas con cada etiqueta de clase.

Clasificación. El segundo paso en las tareas de clasificación es la clasificación misma. En esta fase, los usuarios despliegan el modelo en un conjunto de prueba de datos no vistos. Los datos no empleados anteriormente son ideales para evaluar la clasificación del modelo con el fin de evitar el sobreajuste. El modelo emplea su función de predicción aprendida y=f(x) para clasificar los datos no vistos en distintas clases de acuerdo con las características de cada muestra. A continuación, los usuarios evalúan la precisión del modelo en función del número de muestras de datos de prueba predichas correctamente.2