Nodo de origen de Excel

El nodo de origen Excel le permite importar datos de Microsoft Excel en el formato de archivo .xlsx.

Tipo de archivo. Seleccione el tipo de archivo de Excel que está importando.

Importar archivo. Especifica el nombre y la ubicación del archivo de hoja de cálculo que se va a importar.

Usar rango con nombre. Permite especificar un rango con nombre de casillas tal y como se define en la hoja de trabajo de Excel. Pulse el botón de puntos suspensivos (...) para realizar una selección en la lista de hojas de trabajo disponibles. Si se utiliza un rango con nombre, no se podrá aplicar otra configuración de rango de datos y hoja de trabajo y, en consecuencia, estará desactivada.

Seleccionar hoja de trabajo. Especifique la hoja de trabajo que se va a importar, por índice o por nombre.

Por índice. Especifique el valor de índice para la hoja de trabajo que desea importar, comenzando por 0 para la primera hoja de trabajo, 1 para la segunda hoja de trabajo y así sucesivamente.
Por nombre. Especifique el nombre de la hoja de trabajo que desea importar. Pulse en el botón de puntos suspensivos (...) para seleccionar de la lista de hojas de trabajo disponibles.

Intervalo en hoja de trabajo. Puede importar datos que comiencen por la primera fila que no esté en blanco o con un rango de casillas explícito.

El intervalo comienza en la primera fila no en blanco. Busca la primera casilla que no esté en blanco y la utiliza como la esquina superior izquierda del rango de datos.
Rango explícito de casillas. Le permite especificar un intervalo explícito por fila y columna. Por ejemplo, para especificar el intervalo de Excel A1:D5, puede introducir A1 en el primer campo y D5 en el segundo (o, de forma alternativa, R1C1 y R5C4). Se devolverán todas las filas del rango especificado, incluidas las filas en blanco.

En filas en blanco. Si se encuentra más de una fila en blanco, puede seleccionar si desea Parar de leer o seleccionar Devolver filas en blanco para continuar leyendo todos los datos hasta el final de la hoja de trabajo, incluidas las filas en blanco.

Primera fila tiene nombres de columnas. Indica que la primera fila del rango concreto debería usarse como nombres de campo (columna). Si no se selecciona, los nombres de campo se generan automáticamente.

Líneas que explorar para columna y tipo. Puede aumentar este valor si desea que IBM® SPSS Modeler explore más filas de datos de Excel para determinar el tipo de columna y el tipo de almacenamiento. El valor predeterminado es 200 filas. Tenga en cuenta que este valor puede afectar al rendimiento.

Almacenamiento de campo y Nivel de medición

Al leer valores de Excel, los campos con almacenamiento numérico se leen con un nivel de medición de Continuo de forma predeterminada y los campos de cadena se leen como Nominales. Puede cambiar el nivel de medición de forma manual (continuo en lugar de nominal) en la pestaña Tipo, pero el almacenamiento viene determinado de forma automática (aunque puede cambiarse mediante la función de conversión, como to_integer, en un nodo Rellenar o un nodo Derivar si es necesario). Consulte Configuración de almacenamiento de campos y formato para obtener más información.

De forma predeterminada, los campos con una mezcla de valores numéricos y de cadena se leen como números, lo que significa que cualquier valor de cadena se establecerá en valores nulos (valores perdidos del sistema) en IBM SPSS Modeler. Esto se produce porque, a diferencia de Excel, IBM SPSS Modeler no permite tipos de almacenamiento mezclados dentro de un campo. Para evitarlo, puede establecer de forma manual el formato de casillas a Texto en la hoja de cálculo de Excel, lo que hará que todos los valores (incluidos los números) se lean como cadenas.