Vecinos (Análisis de vecinos más próximos)

Número de vecinos más próximos (k) Especifique el número de vecinos más próximos. Tenga en cuenta que el uso de un número mayor de vecinos no implica que el modelo resultante sea más preciso.

Si se especifica un destino en la pestaña Variables, puede especificar un rango de valores y permitir que el procedimiento seleccione el "mejor" número de vecinos de ese rango. El método para determinar el número de vecinos más próximos depende de si se solicita la selección de características en la pestaña Características.

  • Si la selección de características está activada, ésta se realizará para cada valor de k en el rango solicitado, y se seleccionará la k y el conjunto de funciones compañero con la menor tasa de error (o el menor error cuadrático si el destino es escala).
  • Si la selección de características no está activada, se utilizará la validación cruzada de pliegue en V para seleccionar el “mejor” número de vecinos. Consulte la pestaña Partición para tener control sobre la asignación de pliegues.

Cálculo de distancias. Es la métrica utilizada para especificar la métrica de distancia empleada para medir la similitud de los casos.

  • Métrica euclídea. La distancia entre dos casos, x e y, es la raíz cuadrada de la suma, sobre todas las dimensiones, de las diferencias cuadradas entre los valores de esos casos.
  • Métrica de bloques de ciudad. La distancia entre dos casos es la suma, en todas las dimensiones, de las diferencias absolutas entre los valores de esos casos. También se conoce como la distancia de Manhattan.

Además, si se especifica un destino en la pestaña Variables, puede optar por ponderar características según su importancia normalizada a la hora de calcular distancias. La importancia que una característica tiene para un predictor se calcula en función de la relación entre la tasa de error o errores cuadráticos del modelo sin el predictor y la tasa de error o errores cuadráticos del modelo completo. La importancia normalizada se calcula volviendo a ponderar los valores de importancia de la característica para que sumen 1.

Predicciones del destino de escala. Si se especifica un destino de escala en la pestaña Variables, especificará si el valor predicho se calcula en función de la media o del valor de mediana de los vecinos más próximos.