Configuración de opciones para el nodo Datos Usuario
El cuadro de diálogo para el nodo Datos Usuario contiene varias herramientas que puede utilizar para introducir valores y definir la estructura de datos para los datos sintéticos. Para un nodo generado, la tabla de la pestaña Datos contiene nombres de campos del origen de datos original. Para un nodo añadido desde la paleta Orígenes, la tabla está vacía. Si utiliza las opciones de la tabla, podrá realizar las siguientes tareas:
- Añadir nuevos campos mediante el botón Añadir un nuevo campo, situado en la parte derecha de la tabla.
- Cambiar el nombre de los campos existentes.
- Especificar el almacenamiento de datos para cada campo.
- Especificar valores.
- Cambiar el orden de los campos en la visualización.
Introducción de datos
Puede especificar valores o insertarlos desde el conjunto de datos original para cada campo, mediante el botón Selector de valores, situado en la parte derecha de la tabla. Consulte las reglas descritas a continuación, si desea obtener más información acerca de la especificación de valores. También puede dejar el campo vacío:
los campos vacíos se rellenan con el espacio nulo del sistema ($null$
).
Para especificar valores de cadena, simplemente introdúzcalos en la columna Valores separados por espacios:
Fred Ethel Martin
Cadenas que incluyen espacios que se pueden escribir entre comillas dobles:
"Bill Smith" "Fred Martin" "Jack Jones"
Para los campos numéricos, puede introducir varios valores de la misma forma (con espacios entre ellos):
10 12 14 16 18 20
O puede especificar la misma serie de números estableciendo los límites (10, 20) y los pasos entre ellos (2). Con este método, se escribirá lo siguiente:
10,20,2
Estos dos métodos se pueden combinar insertando uno dentro de otro, como se indica a continuación:
1 5 7 10,20,2 21 23
Esta entrada generará los siguientes valores:
1 5 7 10 12 14 16 18 20 21 23
Los valores de fecha y hora se pueden introducir mediante el formato predeterminado actual seleccionado en el cuadro de diálogo Propiedades de ruta, por ejemplo:
11:04:00 11:05:00 11:06:00
2007-03-14 2007-03-15 2007-03-16
Para los valores de marca de tiempo, que tienen un componente de fecha y hora, se deben utilizar comillas dobles:
"2007-03-14 11:04:00" "2007-03-14 11:05:00" "2007-03-14 11:06:00"
Para obtener información adicional consulte los comentarios sobre el almacenamiento de datos a continuación.
Generar datos. Permite especificar cómo se generan los registros al ejecutar la ruta.
- Todas las combinaciones. Genera registros que contienen todas las combinaciones posibles de los valores de campo, por lo tanto, cada valor de campo aparecerá en varios registros. En ocasiones puede generar más datos de los deseados, por lo que es recomendable seguir este nodo con un nodo de muestra.
- En el orden. Genera registros en el orden en que se han especificado los valores de campo. Cada valor de campo aparece solamente en un registro. El número de registros será igual al número más grande de valores de un único campo. Cuando los campos tienen un número menor, se insertan valores no definidos ($null$).
Mostrar ejemplo
Por ejemplo, las entradas siguientes generarán los registros mostrados en los dos ejemplos de la tabla siguiente.
- Edad. 30,60,10
- PS. BAJA
- Colesterol. NORMAL ALTO
- Medicamento. (se deja vacío)
Edad | PS | Colesterol | Medicamento |
---|---|---|---|
30 | BAJA | NORMAL | $null$ |
30 | BAJA | SUPERIOR | $null$ |
40 | BAJA | NORMAL | $null$ |
40 | BAJA | SUPERIOR | $null$ |
50 | BAJA | NORMAL | $null$ |
50 | BAJA | SUPERIOR | $null$ |
60 | BAJA | NORMAL | $null$ |
60 | BAJA | SUPERIOR | $null$ |
Edad | PS | Colesterol | Medicamento |
---|---|---|---|
30 | BAJA | NORMAL | $null$ |
40 | $null$ | SUPERIOR | $null$ |
50 | $null$ | $null$ | $null$ |
60 | $null$ | $null$ | $null$ |
Almacenamiento de datos
Almacenamiento describe la forma en la que los datos se almacenan en un campo. Por ejemplo, un campo con valores 1 y 0 almacena datos enteros. Esto es distinto del nivel de medición, que describe el uso de los datos y no afecta al almacenamiento. Por ejemplo, puede que desee definir el nivel de medición para un campo de enteros con valores de 1 y 0 para una Marca. Esto suele indicar que 1=Verdadero y 0=Falso. Aunque el almacenamiento se debe determinar en el origen, el nivel de medición se puede cambiar utilizando un nodo Tipo en cualquier punto de la ruta. Consulte Niveles de medición para obtener más información.
Los tipos de almacenamiento disponibles son los siguientes:
- Cadena: Se utiliza para campos que contienen datos no numéricos, también llamados datos alfanuméricos. Una cadena puede incluir cualquier secuencia de caracteres, como fred, Clase 2 o 1234. Tenga en cuenta que los números de las cadenas no se pueden utilizar en los cálculos.
- Entero: Un campo cuyos valores son números enteros.
- Real: Los valores son números que pueden incluir decimales (no está limitado a números enteros). El formato de presentación se especifica en el cuadro de diálogo Propiedades de ruta y puede quedar anulado para campos individuales en un nodo Tipo (pestaña Formato).
- Fecha Valores de fecha especificados en un formato estándar como año, mes y día (por ejemplo, 2007-09-26). El formato determinado se especifica en el cuadro de diálogo Propiedades de ruta.
- Tiempo: El tiempo medido como una duración. Por ejemplo, una llamada de servicio que dure 1 hora, 26 minutos y 38 segundos se puede representar como 01:26:38, según el formato de hora actual que se especifica en el cuadro de diálogo Propiedades de ruta.
- Indicación de fecha y hora: Valores que incluyen un componente de fecha y hora, por ejemplo 2007–09–26 09:04:00, en función de los formatos actuales de fecha y hora del cuadro de diálogo Propiedades de ruta. Tenga en cuenta que es posible que los valores de marca de tiempo se tengan que escribir entre comillas dobles para garantizar que se interpretan como un valor único en lugar de valores de fecha y hora diferentes. (Es aplicable, por ejemplo cuando introduce valores en un nodo Datos Usuario.)
- Lista: Introducido en SPSS Modeler versión 17, junto con los nuevos niveles de medición de Geoespacial y Colección, el campo de almacenamiento de lista contiene varios valores para un único registro. Existen versiones de lista de todos los otros tipos de almacenamiento.
Tabla 3. Iconos de tipo de almacenamiento de lista Icono Tipo de almacenamiento Lista de cadenas Lista de enteros Lista de reales Lista de tiempo Lista de fechas Lista de indicaciones de fecha y hora Lista con una profundidad mayor que cero Asimismo, para utilizarlo con el nivel de medición Colección, existen versiones de los siguientes niveles de medición.
Tabla 4. Iconos de nivel de medición de lista Icono Nivel de medición lista de continuos Lista de categóricos Lista de marcas Lista de nominales Lista de ordinales Las listas se pueden importar a SPSS Modeler en uno de los tres nodos de origen (Analytic Server, Geoespacial o Archivo variable), o se pueden crear en sus rutas utilizando los nodos operativos de los campos Derivar o Rellenar.
Para obtener más información acerca de las listas y su interacción con los niveles de medición Colección y Geoespacial, consulte el tema Almacenamiento de lista y niveles de medición asociados
Conversiones del almacenamiento. Puede convertir el almacenamiento de un campo mediante una serie de funciones de conversión, como to_string
y to_integer
, en un nodo Rellenar. Consulte Conversión del almacenamiento mediante el nodo Rellenar para obtener más información. Tenga en cuenta que las funciones de conversión (y otras muchas funciones que requieren un tipo específico de entrada, como un valor de fecha u hora)
dependen de los formatos actuales especificados en el cuadro de diálogo de propiedades de ruta. Por ejemplo, si desea convertir un campo de serie con los valores Ene 2018, Feb 2018, (etc.) en un almacenamiento de fecha, seleccione MES AAAA como formato de fecha predeterminado para la ruta. Las funciones de conversión también están disponibles en el nodo Derivar para la conversión temporal durante un cálculo de derivación. También puede utilizar el nodo Derivar para realizar otras manipulaciones, como volver a codificar los campos con valores categóricos.
Consulte Nueva codificación de valores con el nodo Derivar para obtener más información.
Lectura de datos mezclados. Tenga en cuenta que al leer los campos con almacenamiento numérico (entero, real, hora, marca de tiempo o fecha), cualquier valor no numérico se establece como nulo o perdido por el sistema. Esto ocurre porque, a diferencia de otras aplicaciones, IBM® SPSS Modeler no permite la combinación de tipos de almacenamiento dentro de un campo. Para evitarlo, cualquier campo con datos mezclados debe leerse como cadenas, ya sea cambiando el tipo de almacenamiento en el nodo de origen o en la aplicación externa, según sea necesario.
Nota: los nodos Datos Usuario generados pueden contener ya información de almacenamiento, recogida del nodo de origen si está instanciado. Un nodo que no está instanciado no contiene información acerca del tipo de uso ni del almacenamiento.
Reglas para la especificación de valores
Para los campos simbólicos, debe dejar espacios entre varios valores, como:
ALTA NORMAL BAJA
Para los campos numéricos, puede introducir varios valores de la misma forma (con espacios entre ellos):
10 12 14 16 18 20
O puede especificar la misma serie de números estableciendo los límites (10, 20) y los pasos entre ellos (2). Con este método, se escribirá lo siguiente:
10,20,2
Estos dos métodos se pueden combinar insertando uno dentro de otro, como se indica a continuación:
1 5 7 10,20,2 21 23
Esta entrada generará los siguientes valores:
1 5 7 10 12 14 16 18 20 21 23