Conexión a orígenes de datos

Puede conectarse a los orígenes de datos en IBM Cloud Pak for Data a nivel de plataforma o a nivel de servicio. La forma en que se conecta a los orígenes de datos depende de varios factores, incluidos los servicios instalados en Cloud Pak for Data.

Conexión a orígenes de datos a nivel de plataforma

Puede crear conexiones que pueden utilizar otros servicios en toda la plataforma. Cualquier usuario que tenga acceso a la plataforma puede ver estas conexiones. Sin embargo, solo los usuarios con las credenciales del origen de datos pueden utilizar una conexión.

Estas conexiones a nivel de plataforma están disponibles en la página Conexiones de plataforma. Sin embargo, la página Conexiones de plataforma sólo está disponible si se ha instalado Cloud Pak for Data common core services .

Actualmente, los servicios siguientes pueden utilizar conexiones desde la página Conexiones de la plataforma:
  • Cognos Analytics
  • DataStage
  • IBM Knowledge Catalog
  • IBM watsonx.ai
  • Data Virtualization
  • Watson Studio

    Muchas de las herramientas que funcionan con Watson Studio pueden utilizar datos de estas conexiones después de añadir la conexión a un proyecto.

Restricción: No todos los servicios dan soporte a las mismas conexiones. La mayor parte se los servicios dan soporte a un subconjunto de las conexiones soportadas por la plataforma. Para obtener más información, consulte Conexión a orígenes de datos (por servicio).

La página Conexiones de la plataforma es una vista especializada del Catálogo de activos de la plataforma. Las conexiones definidas en la página Conexiones de plataforma también se incluyen en el catálogo de activos dePlatform assets catalog.

La página Conexiones de la plataforma muestra la lista de las conexiones que pueden utilizar varios servicios en la plataforma. Como mínimo, todos los usuarios tienen el rol de Visor en el catálogo, lo que significa que pueden ver las conexiones definidas. Para obtener más información, consulte Gestión de colaboradores en conexiones de plataforma.

Permisos necesarios
Para crear una conexión a nivel de plataforma, debe ser un Editor o un Administrador en el catálogo de activos dePlatform assets catalog.
Sugerencia: Trabaje con el administrador del origen de datos para asegurarse de que tiene la información correcta para conectarse al origen de datos.

Vea este vídeo para saber cómo crear una conexión a nivel de plataforma.

Este vídeo proporciona un método visual para aprender los conceptos y las tareas de esta documentación.

Para crear una conexión en el nivel de la plataforma:

  1. Inicie sesión en el cliente web de Cloud Pak for Data .
  2. En el menú de navegación, seleccione Datos > Conectividad.
  3. Pulse el separador Conexiones de plataforma y, a continuación, pulse Nueva conexión.
  4. Seleccione un tipo de fuente de datos y luego elija el conector.
    Las siguientes conexiones tienen requisitos adicionales que deben cumplirse para poder utilizarlas:
    Conexiones que requieren archivos JAR
    Algunas de las conexiones predefinidas, así como la conexión Genérica JDBC , requieren que un administrador de Cloud Pak for Data cargue controladores JDBC para el origen de datos. Para obtener más información, consulte Importación de controladores JDBC para orígenes de datos.
    Volumen de almacenamiento
    Si desea conectarse a un volumen de almacenamiento, como un servidor NFS externo o una reclamación de volumen persistente, un usuario con los permisos Crear instancias de servicio debe añadir el volumen a Cloud Pak for Data. Para obtener más información, consulte Gestión de volúmenes de almacenamiento.
  5. Especifique un nombre y una descripción para la conexión.
  6. Especifique los detalles para la conexión.

    El conector que está creando determina la información que debe especificar. Normalmente, una conexión requiere:

    • Un nombre de host y número de puerto
    • Un URL

    También es posible que necesite especificar la base de datos a la que desea conectarse.

  7. Especifique sus credenciales para la conexión.
    • Si se le solicita, especifique si desea utilizar credenciales personales o compartidas. No puede cambiar esta opción después de crear la conexión.
      Personal
      Con las credenciales personales, cada usuario debe especificar sus propias credenciales para acceder a la conexión. Las credenciales de cada usuario se guardan pero no se comparten con ningún otro usuario. Utilice credenciales personales en lugar de credenciales compartidas para proteger las credenciales. Por ejemplo, si utiliza credenciales personales y otro usuario cambia las propiedades de conexión (como el nombre de host o el número de puerto), las credenciales se invalidan para evitar la redirección maliciosa.
      Compartido
      Con las credenciales compartidas, todos los usuarios acceden a la conexión con las credenciales que proporciona. El valor predeterminado es Compartido. Las credenciales compartidas pueden ser recuperadas potencialmente por un usuario que tenga acceso al activo de conexión. Puesto que las credenciales son compartidas, es difícil auditar el acceso a la conexión, identificar el origen de la pérdida de datos o identificar el origen de una infracción de seguridad. Un administrador puede inhabilitar credenciales compartidas.
    • El conector determina las credenciales que debe especificar. Normalmente, una conexión requiere un nombre de usuario y una contraseña o una clave de API y una clave secreta. Algunos orígenes de datos permiten conectarse de forma anónima.
    • Es posible que tenga que especificar cómo desea proporcionar sus credenciales. Las opciones disponibles dependen de cómo esté configurada la plataforma.
      Especifique las credenciales manualmente
      Con esta opción, especifique manualmente las credenciales en el cliente web. La plataforma almacena estas credenciales y las utiliza para autenticarse.

      Este es el método predeterminado para especificar credenciales. Sin embargo, un administrador puede inhabilitar opcionalmente este método. Para obtener más información, consulte Requerir que los usuarios utilicen secretos para credenciales al crear conexiones.

      Utilizar secretos de una caja fuerte
      Con esta opción, se seleccionan los secretos que contienen las credenciales adecuadas. Por ejemplo, si necesita especificar su nombre de usuario y contraseña, seleccione el secreto que contiene su nombre de usuario y el secreto que contiene su contraseña. La plataforma utiliza los secretos (que se almacenan en un caja fuerte) para autenticarle.

      Si está utilizando secretos de una caja fuerte externa, debe tener los permisos adecuados para conectarse a cajas fuertes externas o un administrador debe compartir los secretos adecuados con usted. Para obtener más información, consulte Gestión de secretos y cajas fuertes.

      Utilizar mis credenciales de inicio de sesión de plataforma
      Con esta opción, la plataforma utiliza las credenciales de la plataforma para autenticarle.

      Esta opción sólo está disponible si el origen de datos es un servicio que se despliega en la instancia de Cloud Pak for Data donde está creando la conexión.

  8. Establezca Credenciales confidenciales de máscara recuperadas a través de llamadas de API en Activado si desea impedir que los usuarios, incluido el propietario de la conexión, recuperen credenciales confidenciales no enmascaradas a través de llamadas de API. Este valor no tiene ningún efecto en el propio formulario de conexión. Las herramientas siguientes dan soporte a este valor:
    • Analytics Engine powered by Apache Spark
    • AutoAI (Watson Machine Learning)
    • Data Refinery (Watson Studio)
    • Decision Optimization
    • IBM Match 360 with Watson
    • Cuadernos (Watson Studio). Actualice los cuadernos que hacen referencia a la conexión a través de llamadas de API para utilizar el Flight service.
  9. Si procede, especifique la información SSL necesaria para conectar con el origen de datos.

    Algunos orígenes de datos requieren que utilice SSL para la comunicación segura. Otros orígenes de datos lo admiten pero no lo requieren. Asegúrese de que comprende qué información debe proporcionar para comunicarse de forma segura con el origen de datos:

    • Si ha especificado un número de puerto que está configurado para aceptar conexiones SSL, asegúrese de que selecciona El puerto está configurado para aceptar conexiones SSL
    • Si el origen de datos utiliza un certificado autofirmado, debe especificar el contenido del certificado para habilitar una comunicación segura entre Cloud Pak for Data y el origen de datos.
    • Si el origen de datos utiliza certificados encadenados, puede especificar el contenido de varios certificados.

    Algunos servicios pueden utilizar un certificado SSL que se almacena como un secreto. Si está utilizando secretos de una caja fuerte externa, debe tener los permisos adecuados para conectarse a cajas fuertes externas o un administrador debe compartir los secretos adecuados con usted. Para obtener más información, consulte Gestión de secretos y cajas fuertes.

Conexión a orígenes de datos a nivel de servicio

Normalmente, si crea una conexión a nivel de servicio, la conexión sólo está accesible desde el servicio donde se crea.

Servicio Más información
Cognos Dashboards Puede utilizar archivos CSV, hojas de cálculo de Microsoft Excel, activos de datos conectados y activos de Data Virtualization como orígenes de datos para un panel de control. Debe añadir todos estos orígenes de datos a un proyecto antes de poder utilizarlos como orígenes de datos.

Añada orígenes de datos a un panel de instrumentos pulsando el botón Añadir un origen (+) en el panel Orígenes seleccionados .

Para obtener más información, consulte Orígenes de datos soportados para Cognos Dashboards.

DataStage DataStage utiliza conectores en el lienzo de DataStage para interactuar con orígenes de datos remotos. Para conectarse al origen de datos, debe crear un activo de conexión de proyecto para el conector DataStage asociado antes de poder utilizarlo en DataStage.
IBM Knowledge Catalog Puede crear conexiones que se pueden utilizar en el catálogo y conexiones que se pueden utilizar para organizar los datos.

Añada conexiones que se pueden utilizar en un catálogo desde la página Visión general del catálogo. Puede crear nuevas conexiones o seleccionar conexiones a nivel de plataforma existentes.

Para obtener más información, consulte Adición de un activo de conexión a un catálogo.

Cuando publica un activo de datos en un catálogo, la conexión se publica junto con él, a menos que la conexión exista en el catálogo.

Para las conexiones que se pueden utilizar para organizar los datos, puede crear conexiones como se indica a continuación:
  • En la página Conexiones de la plataforma. Puede elegir entre estas conexiones de nivel de plataforma cuando configure una importación de metadatos.
  • Cuando configura una nueva importación de metadatos desde la página Activos de un proyecto.
IBM watsonx.ai

Cuando ajusta un modelo de base desde Tuning Studio, añade ejemplos de pares de entrada y salida de modelo de base como datos de entrenamiento. Puede obtener estos ejemplos de un archivo JSON o JSONL que almacena en un almacén de datos conectado o de datos tabulares almacenados en una base de datos conectada.

Para obtener más información, consulte Formatos de datos para ajustar modelos base.

Puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:
  • La página Conexiones de plataforma
  • La página Activos del proyecto
Data Virtualization Puede crear conexiones que puedan utilizarse para controlar los datos desde las siguientes ubicaciones:
  • La página Conexiones de plataforma
  • La página Orígenes de datos en el servicio Data Virtualization

Para obtener más información, consulte Adición de orígenes de datos (Data Virtualization).

Db2 Big SQL Puede crear conexiones para consultar datos de un almacén de objetos o un clúster de Hadoop remoto. Se conecta a un origen de datos al suministrar una instancia de Db2 Big SQL .

Para obtener más información, consulte Creación de una instancia de servicio para Db2 Big SQL.

Watson Studio Idealmente, debe utilizar los datos que ya existen en un catálogo. Busque los datos que desea en un catálogo y añádalos a un proyecto.

De forma alternativa, puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:

También puede añadir datos desde archivos. Para añadir datos de archivos, vaya a la página Activos del proyecto. La limitación de almacenamiento inicial de activos es de 100 GB en todos los proyectos, espacios y catálogos.

Para obtener más información, consulte Adición de datos a un proyecto.

Data Product Hub

La mayoría de los métodos para crear un producto de datos requieren una conexión con un origen de datos. Puede añadir conexiones para acceder a una amplia selección de orígenes de datos para crear y entregar productos de datos.

Para obtener instrucciones sobre cómo conectarse a un origen de datos remoto en Data Product Hub, consulte Conectores para Data Product Hub.

Para ver una lista de los conectores soportados y los métodos de entrega correspondientes, consulte Métodos de entrega para conectores.