Regresión por mínimos cuadrados parciales

El procedimiento Regresión de mínimos cuadrados parciales estima los modelos de regresión de los mínimos cuadrados parciales (PLS, también denominados "proyección a la estructura latente"). La PLS es una técnica de predicción alternativa a la regresión de mínimos cuadrados ordinarios (OLS), a la correlación canónica o al modelado de ecuaciones estructurales, y resulta particularmente útil cuando las variables predictoras están muy correlacionadas o cuando el número de predictores es superior al número de casos.

La PLS combina las características del análisis de componentes principales y la regresión múltiple. En primer lugar, extrae un conjunto de factores latentes que explica en la mayor medida posible la covarianza entre las variables dependientes e independientes. A continuación, un paso de regresión pronostica los valores de las variables dependientes mediante la descomposición de las variables independientes.

Tablas: La proporción de la varianza explicada (por factor latente), las ponderaciones y las cargas de los factores latentes, la importancia de la variable independiente en proyección (VIP) y las estimaciones de los parámetros de la regresión (por variable dependiente) se generan de forma predeterminada.
Gráficos: La importancia de las variables en la proyección (VIP), las puntuaciones factoriales, las ponderaciones factoriales para los tres primeros factores latentes y la distancia al modelo se generan desde la pestaña Opciones .

Consideraciones sobre los datos

Nivel de medición: Las variables (predictoras) dependientes e independientes pueden ser de escala, nominales u ordinales. El procedimiento supone que se ha asignado el nivel de medición adecuado a todas las variables, aunque puede cambiar temporalmente el nivel de medición de una variable pulsando el botón derecho la variable en la lista de variables de origen y seleccionando un nivel de medición en el menú emergente. El procedimiento trata por igual las variables categóricas (nominales u ordinales).
Codificación de variables categóricas: El procedimiento recodifica temporalmente las variables dependientes categóricas utilizando la codificación "una de c" durante el procedimiento. Si hay categorías c de una variable, la variable se almacena como vectores c , con la primera categoría indicada (1,0, ..., 0), la siguiente categoría (0,1,0, ..., 0), ..., y la categoría final (0,0, ..., 0, 1). Las variables dependientes categóricas se representan mediante una variable auxiliar o dummy; es decir, omitiendo simplemente el indicador correspondiente a la categoría de referencia.
Ponderaciones de frecuencia: Los valores de ponderación se redondean al número entero más cercano antes de utilizarlos. Los casos con ponderaciones perdidas o ponderaciones inferiores a 0,5 no se emplearán en los análisis.
Valores perdidos: Los valores perdidos del usuario y del sistema se consideran no válidos.
Cambio de escala: Todas las variables del modelo se centran y tipifican, incluidas las variables indicador que representan variables categóricas.

Obtención de regresión por mínimos cuadrados parciales

En los menús seleccione:

Analizar > Regresión > Mínimos cuadrados parciales ...

Seleccione al menos una variable dependiente.
Seleccione al menos una variable independiente.

Si lo desea, puede:

Especificar una categoría de referencia para las variables dependientes categóricas (nominales u ordinales).
Especificar la variable que se utilizará como identificador exclusivo para los resultados por casos y los conjuntos de datos guardados.
Especificar un límite máximo para el número de factores latentes que se extraerán.

Este procedimiento pega la sintaxis del comando PLS .

Requisitos previos

El procedimiento Regresión de mínimos cuadrados parciales es un comando de extensión Python y requiere la funcionalidad Python , que forma parte del producto IBM® SPSS® Statistics . También necesita las bibliotecas NumPy y SciPy de Python, que están disponibles libremente.

Nota: Para los usuarios que trabajan en modo de análisis distribuido (requiere IBM SPSS Statistics Server), NumPy y SciPy deben estar instalados en el servidor. Póngase en contacto con el administrador del sistema para obtener ayuda.

Usuarios de Windows y Mac

Para Windows y Mac, NumPy y SciPy deben estar instalados en una versión separada de Python 3.10 de la versión instalada con IBM SPSS Statistics. Si no tiene una versión separada de Python 3.10, puede descargarla desde http://www.python.org. A continuación, instale NumPy y SciPy para Python versión 3.10. Los instaladores están disponibles en http://www.scipy.org/Download.

Para habilitar el uso de NumPy y SciPy, debe establecer la ubicación de Python en la versión de Python 3.10 donde ha instalado NumPy y SciPy. La ubicación de Python se establece desde la pestaña Ubicaciones de archivos en el diálogo Opciones (Editar > Opciones).

Usuarios de Linux

Se recomienda que el usuario descargue el origen y genere NumPy y SciPy. El origen está disponible en http://www.scipy.org/Download. Puede instalar NumPy y SciPy en la versión de Python 3.10 que se instala con IBM SPSS Statistics. Se encuentra en el directorio Python bajo la ubicación donde está instalado IBM SPSS Statistics .

Si opta por instalar NumPy y SciPy en una versión de Python 3.10 distinta de la versión instalada con IBM SPSS Statistics, debe establecer la ubicación de Python para que apunte a dicha versión. La ubicación de Python se establece desde la pestaña Ubicaciones de archivo en el diálogo Opciones (Editar > Opciones).

Servidor de Windows y Unix

NumPy y SciPy deben estar instalados, en el servidor, en una versión separada de Python 3.10 de la versión instalada con IBM SPSS Statistics. Si no hay una versión separada de Python 3.10 en el servidor, se puede descargar desde http://www.python.org. NumPy y SciPy para Python 3.10 están disponibles en http://www.scipy.org/Download. Para habilitar el uso de NumPy y SciPy, la ubicación de Python para el servidor debe establecerse en la versión de Python 3.10 donde están instalados NumPy y SciPy . La ubicación de Python se establece desde la IBM SPSS Statistics Consola de administración.