Nodo Transformación de extensión - pestaña Sintaxis

Seleccione el tipo de sintaxis: R o Python para Spark. Consulte las secciones siguientes si desea más información. Cuando la sintaxis esté lista, puede pulsar Ejecutar para ejecutar el nodo Transformación de extensión.

Sintaxis de R

Sintaxis de R. Puede especificar, o pegar, sintaxis de scripts R personalizados para el análisis de datos en este campo.

Convertir campos de distintivos. Especifica cómo se tratan los campos de distintivos. Hay dos opciones: Series a factores, números enteros y reales a doble y Valores lógicos (Verdadero, Falso). Si selecciona Valores lógicos (Verdadero, Falso), se pierden los valores originales de los campos de distintivos. Por ejemplo, si un campo tiene valores Masculino y Femenino, éstos se cambian a Verdadero y Falso.

convertir valores perdidos al valor 'no disponible' de R (NA). Cuando se selecciona, cualquier valor perdido se convierte al valor NA de R. R utiliza el valor de NA para identificar valores perdidos. Es posible que algunas funciones de R tengan un argumento que se pueda utilizar para controlar cómo se comporta la función cuando los datos contienen NA. Por ejemplo, es posible que la función le permita elegir de forma automática la exclusión de los registros que contienen NA. Si esta opción no está seleccionada, cualquier valor perdido se pasa a R sin cambios y es posible que cause errores cuando se ejecute el script R.

Convertir campos de fecha/hora a clases R con control especial para husos horarios. Cuando se selecciona, las variables con formatos de fecha o fecha y hora se convierten a los objetos R de fecha/hora. Debe seleccionar una de las opciones siguientes:
  • R POSIXct. Las variables con formatos de fecha o fecha y hora se convierten a objetos R POSIXct.
  • R POSIXlt (lista). Las variables con formatos de fecha o fecha y hora se convierten a objetos R POSIXlt.
Nota: Los formatos POSIX son opciones avanzadas. Utilice estas opciones solo si su script R especifica que los campos de fecha y hora se traten de formas que requieran estos formatos. Los formatos POSIX no se aplican a variables con formatos de hora.

Sintaxis de Python

Sintaxis de Python. Puede especificar o pegar sintaxis de scripts de Python personalizados para el análisis de datos en este campo. Para obtener más información sobre Python para Spark, consulte Python para Spark y Scripts con Python para Spark.