Configurar la máquina local

El entorno R debe estar configurado en la máquina local antes de poder utilizar la funcionalidad R. La configuración incluye la preparación de la conexión ODBC entre la máquina local y Netezza Performance Server. También incluye la instalación de una serie de paquetes adicionales de R que no están incluidos en la instalación base de R.

Las siguientes secciones describen cómo configurar los Drivers ODBC y cómo configurar la máquina local para trabajar con R en el Netezza Performance Server a través de la GUI de R para Windows.

Configuración del controlador ODBC para Windows

Esta sección describe cómo instalar y configurar el controlador ODBC para la versión de 64 bits de Windows y la versión de 32 bits de Windows.

  1. 1. Descargue los controladores ODBC Windows desde Fix Central siguiendo estos pasos:
    1. Pulse Select product.
    2. En la lista " Product Group ", seleccione " Information Management.
    3. En la lista " Select from Information Management ", seleccione " IBM Netezza NPS Software and Clients.
    4. En la lista ' Installed Version ', seleccione la versión de Netezza Performance Server que tiene instalada.
    5. En " Platform list" , seleccione " Windows y, a continuación, haga clic en " Continue.
    6. Seleccione " Browse for fixes y, a continuación, haga clic en " Continue.
    7. Seleccione el fix pack correspondiente a su versión Netezza Performance Server.

      El paquete de correcciones contiene el archivo ' nz-winclient-vxxx.zip ', donde xxx es el número de versión correspondiente.

      Extraiga el archivo ' nz-winclient-vxxx.zip ' y utilice uno de los siguientes archivos:

      • Para Windows de 64 bits, utilice el archivo ' nzodbc32bit4win64.exe '.
      • Para Windows de 32 bits, utilice el archivo ' nzodbcsetup.exe '.
  2. Una vez finalizada la descarga, haga doble clic en el nombre del archivo para iniciar el instalador.
  3. En la ventana que se abre, seleccione el idioma que desea utilizar y haga clic en " OK.
  4. Siga los pasos del paquete de instalación haciendo clic en " Next > " después de cada selección.

    La aplicación instala todos los archivos necesarios en tu ordenador. Puede ser necesario reiniciar el sistema después de la instalación.

  5. Haga clic en " Done " para finalizar la instalación. A continuación, cierre la aplicación de instalación.
  6. Para comprobar si la instalación se ha completado correctamente, abra el Panel de control y seleccione Herramientas administrativas.
  7. En la lista, seleccione fuentes de datosODBC).
  8. En el cuadro de diálogo que se abre, haga clic en la pestaña " Drivers ".

    NetezzaSQL aparece en la lista.

  9. Haz clic en la pestaña " System DSN ".

    Aparece el controlador ' NetezzaSQL ' que se llama NZSQL.

Si la configuración local coincide, la instalación se ha completado. Si la configuración local no coincide, vuelva a instalar el controlador.
Consejo: Si es necesario, puede definir DSN personalizados en la pestaña DSN del sistema.

Configuración del paquete R

Para ejecutar el Lenguaje R, deben instalarse paquetes adicionales a través de la GUI de R.

Paquetes estándar requeridos

Para que R funcione correctamente, los siguientes paquetes estándar deben estar instalados en el cliente. Los paquetes se enumeran por orden alfabético.
arules
Ofrece soporte para reglas de asociación.
arulesViz
Necesario para la visualización de reglas de asociación, tal como se proporciona en el paquete nza.
bitops
Proporciona funciones para operaciones bit a bit.
ca
Proporciona análisis de correspondencia simple, análisis de correspondencia múltiple y análisis de correspondencia conjunta.
caTools
Proporciona herramientas para estadísticas de ventanas móviles, GIF, Base64, ROC AUC y otras.
e1071
Proporciona funciones varias del Departamento de Estadísticae1071).
MASA
Proporciona funciones de apoyo y conjuntos de datos para Venables y Ripley's MASS
rgl
Proporciona un sistema de dispositivos de visualización 3D.
RODBC
Proporciona acceso ODBC a bases de datos.
árbol
Proporciona árboles de clasificación y regresión.
rparte
Proporciona árboles de decisión y regresión.
árbol
Proporciona árboles de clasificación y regresión.
XML
Proporciona herramientas para analizar y generar XML en R.
Nota: Cuando se instalan estos paquetes, también se instalan los paquetes dependientes si es necesario. Por lo tanto, dependiendo del orden en que se instalen los paquetes, puede que no sea necesario instalar manualmente cada uno de ellos. Por ejemplo, al instalar el paquete ca, se instala automáticamente el paquete rgl. Las notificaciones relativas a las dependencias instaladas automáticamente aparecen en la consola R GUI.

Instalación de los paquetes

Para instalar el paquete " nzr, el paquete " nza " y el paquete " nzmatrix ", siga estos pasos.
Nota: En primer lugar, debe instalar el paquete ' nzr ' porque es necesario para utilizar el paquete ' nza y el paquete ' nzmatrix '. También debe descargar los paquetes cliente ' NPS_R ' utilizando el siguiente enlace GitHub netezza-utils/R/.
  1. En la GUI de R, haga clic en Paquetes > Instalar paquete(s) desde archivos zip locales ... .

    Se abre un cuadro de diálogo con una lista de los paquetes disponibles.

  2. Seleccione el paquete " nzr " y, a continuación, haga clic en " OK.
  3. Repita los pasos 1 y 2 para instalar el nza paquete y el nzmatrix paquete.

Adquisición de R

Los plugins de Netezza Performance Server son compatibles con la versión 3.0.x de R GUI para x32 y x64. Las versiones adecuadas de R pueden descargarse del sitio web oficial de R. Sigue las instrucciones de instalación.

Instrucciones de configuración para Windows

La siguiente descripción muestra cómo instalar los paquetes requeridos, y los paquetes ' nzr, ' nza, y ' nzmatrix ' utilizando R GUI en Windows. Los pasos deben ser similares para una plataforma o cliente diferente.

Para instalar los paquetes, siga estos pasos:
  1. Actualice la GUI de R con cualquier paquete apropiado de CRAN seleccionando Packages > Install package(s) from local zip files... .
    Nota: El uso de la opción ' Install Package(s)... ' hace que la GUI de R establezca una conexión con un servidor CRAN. Por lo tanto, puede ser necesario seleccionar el servidor antes de completar este proceso. El uso de esta opción evita la necesidad de descargar manualmente los paquetes a la máquina local.
  2. En la lista de paquetes disponibles, seleccione el paquete adecuado y, a continuación, haga clic en " OK.
  3. Repita los pasos 1 y 2 para cada envase.
  4. Descargue las bibliotecas que necesite.
  5. Una vez finalizada la descarga, en la ventana Paquetes, seleccione Paquetes > Instalar paquete(s) desde archivos zip locales....
  6. Navegue hasta la ubicación del archivo zip en el equipo local o en la red.
  7. Una vez localizado el archivo, haga doble clic en el nombre del archivo en la ventana, o selecciónelo y haga clic en ' Open.
  8. Repita los pasos 5, 6 y 7 para cada paquete.

Verificación de la instalación y comprobación de la conectividad ODBC

Después de instalar todos los componentes de Netezza Netezza Performance Server R Library y completar la configuración del controlador ODBC y la configuración de la base de datos para los componentes Netezza Performance Server Analytics Library for R, Netezza Performance Server R Library y Netezza Performance Server Matrix Library, se debe verificar la conectividad de la GUI de R con el dispositivo Netezza Performance Server. En la siguiente descripción, se asume que el DSN NZSQL está definido y se refiere a una base de datos. También se asume que el usuario enNetezzaNetezza Performance Server tiene los derechos necesarios para acceder a la base de datos NZA y crear nuevas tablas en la base de datos actual.

Para verificar la instalación y la configuración, puede utilizar los siguientes comandos:
  • Para verificar la instalación del paquete Netezza Performance Server R Library y la correcta configuración de la ejecución del software Netezza:
    library(nzr)
    Este comando carga las bibliotecas de Netezza Performance Server R Library en la GUI de R. Una vez cargadas las bibliotecas, ejecute
    demo(nzr)
    Este comando ejecuta un script que demuestra y comprueba la funcionalidad básica de Netezza Performance Server R Library.
  • Para verificar la instalación del paquete Netezza Performance Server Analytics Library for R y la configuración de la ejecución del software Netezza Performance Server:
    library (nza)
    Este comando carga las librerías ' Netezza Performance Server ' Analytics Library for R y ' Netezza Performance Server R Library en el GUI de R. Una vez finalizada la carga, ejecute:
    demo (nza)
    Este comando ejecuta el script de demostración para demostrar y comprobar la funcionalidad básica de Netezza Performance Server Analytics Library for R.
  • Para verificar la instalación del paquete Netezza Performance Server Matrix Library y la configuración de la ejecución del software Netezza Performance Server:
    library (nzmatrix)
    Este comando carga las bibliotecas Matrix Library ' Netezza Performance Server ' y R Library ' Netezza Performance Server ' en la GUI de R. Una vez finalizada la carga, ejecute:
    demo (nzmatrix)
    Este comando ejecuta el script de demostración que demuestra y comprueba las funciones básicas de la Biblioteca Matriz de Netezza Performance Server.

Creación de bases de datos operativas

Antes de empezar a realizar análisis utilizando los paquetes cliente Netezza Performance Server para R, debe crear una base de datos de trabajo para almacenar las tablas de resultados del análisis.
Importante: No utilice bases de datos del sistema, como SYSTEM, NZM, NZA, NZR, NZMSG y NZRC para almacenar las tablas de resultados.

El siguiente ejemplo muestra cómo crear la base de datos ANALYSIS_DB. El propietario de la base de datos es DEVUSER.

Para crear la base de datos ANALYSIS_DB, siga estos pasos:

  1. Inicie sesión en su Netezza Performance Server y ejecute ' nzsql.
  2. Ejecute los mandatos siguientes:
    1. CREATE USER DEVUSER WITH PASSWORD '<password>';
      Donde
      &amp;lt;password>
      Especifica una contraseña de tu elección.
    2. ALTER USER DEVUSER WITH IN GROUP inza_admins;
    3. CREATE DATABASE ANALYSIS_DB;
    4. ALTER DATABASE ANALYSIS_DB OWNER TO DEVUSER;
    5. \c ANALYSIS_DB
    6. GRANT ALL ADMIN TO DEVUSER;
  3. Salir ' nzsql:
    \q
  4. Cambia al directorio ' /nz/export/ae/utilities/bin ':
    cd /nz/export/ae/utilities/bin
  5. Habilitar los derechos para el DEVUSER:
    ./create_inza_db_developer.sh ANALYSIS_DB DEVUSER
    Nota: El grupo INZA_DEVELOPERS es para usuarios que necesitan registrar nuevos EAs, UDXs y procedimientos almacenados.