Amazon S3 conexión

Para acceder a tus datos en Amazon S3, crea un recurso de conexión para ellos.

Amazon S3 ( Amazon Simple Storage Service ) es un servicio de Amazon Web Services ( AWS ) que proporciona almacenamiento de objetos a través de una interfaz de servicio web.

Para otros tipos de conexiones S3-compliant, puede utilizar la conexión genérica S3.

Establece una conexión con Amazon S3

Para crear el activo de conexión, necesita estos datos de conexión según su implementación:

Conectividad habitual

  • Cubo : Nombre del cubo que contiene los archivos. Si tus credenciales de AWS tienen permisos para enumerar buckets y acceder a todos los buckets, solo tienes que proporcionar las credenciales. Si sus credenciales no tienen privilegios para enumerar buckets y solo pueden acceder a un bucket concreto, deberá especificar dicho bucket.

  • Región : Región de Amazon Web Services ( AWS ). Si especifica un punto final URL que no sea para la región predeterminada AWS ( us-west-2 ), introduzca un valor para Región.

Seleccione Servidor proxy para acceder al origen de datos Amazon S3 a través de un servidor proxy. Dependiendo de su configuración, un servidor proxy puede proporcionar equilibrio de carga, mayor seguridad y privacidad. La configuración del servidor proxy es independiente de las credenciales de autenticación y de la selección de credenciales personales o compartidas. La configuración del servidor proxy no se puede almacenar en un almacén.

  • Host proxy : El proxy URL. Por ejemplo, https://proxy.example.com.
  • Número de puerto del proxy : El número de puerto para conectarse al servidor proxy. Por ejemplo, 8080 o 8443.
  • Los campos Nombre de usuario del proxy y Contraseña del proxy son opcionales.

Credenciales

Elija sus métodos de autenticación en función de su implementación:

Conectividad habitual

Elija el método de autenticación:

Datos básicos

  • Clave de acceso : La ID de la clave de acceso (nombre de usuario) para autorizar el acceso a AWS.
  • Clave secreta : la contraseña asociada al ID de la clave de acceso para autorizar el acceso a AWS.

Credenciales temporales

  • Clave de acceso : La ID de la clave de acceso (nombre de usuario) para autorizar el acceso a AWS.
  • Clave secreta : la contraseña asociada al ID de la clave de acceso para autorizar el acceso a AWS.
  • Token de sesión : El token de sesión para la credencial temporal.

Credenciales de roles de confianza

  • Clave de acceso : La ID de la clave de acceso (nombre de usuario) para autorizar el acceso a AWS.
  • Clave secreta : la contraseña asociada al ID de la clave de acceso para autorizar el acceso a AWS.
  • ARN del rol : El nombre de recurso de Amazon (ARN) del rol que asume la conexión.
  • Nombre de la sesión de roles : nombre que identifica la sesión para los administradores de S3. Por ejemplo, puede utilizar su nombre de IAM.
  • ID externo : El ID externo de la organización que utilizará la función.
  • Duración en segundos : la duración en segundos de las credenciales de seguridad temporales. Para las credenciales, puede utilizar secretos si hay un almacén configurado para la plataforma y el servicio admite almacenes. Para obtener más información, consulte Uso de secretos de almacenes en conexiones.

Para obtener instrucciones de configuración para el titular de la cuenta de Amazon S3, consulte «Configuración de credenciales temporales o de un ARN de rol para Amazon S3 ».

Cumplimiento de las Normas Federales de Procesamiento de la Información (FIPS)

Esta conexión cumple con la norma FIPS y puede utilizarse en un clúster compatible con FIPS.

Amazon S3 configuración

Consulte la Guía del usuario de « Amazon Simple Storage Service » para conocer los pasos de configuración.

Restricción

Las carpetas no pueden nombrarse con el símbolo de barra inclinada (/) porque este símbolo es un delimitador para la estructura de archivos.

Tipos de archivos soportados

La conexión Amazon S3 admite formatos de archivo estructurados y no estructurados.

La conexión admite los siguientes tipos de archivos estructurados: Avro, CSV, texto delimitado, Excel, JSON, ORC, Parquet, SAS, SAV, SHP y XML.

La conexión admite modos para leer y escribir datos binarios. Estos modos se pueden utilizar para leer y escribir formatos de datos no estructurados, tales como: DOC, DOCX, MD, PDF, PPT, PPTX y TXT.

Formatos de tabla

Además del archivo plano, la conexión de « Amazon S3 » es compatible con los siguientes formatos de tabla de Data Lake: « Delta Lake » e «Iceberg».

Más información

Conexión relacionada : Conexión genérica S3