Acessando dados na AWS através de pontos de acesso por meio de um bloco de notas

No Cloud Pak for Data as a Service, é possível acessar os dados armazenados em depósitos do AWS S3 por meio de pontos de acesso de um bloco de notas.

Execute o bloco de notas em um ambiente no Cloud Pak for Data as a Service. Crie um ponto de acesso ativado pela Internet para se conectar ao bucket do S3.

Conectando-se a dados do AWS S3 por meio de um ponto de acesso ativado para internet

É possível acessar dados em um bucket do AWS S3 por meio de um ponto de acesso ativado para Internet em qualquer região do AWS.

Para acessar os dados do S3 por meio de um ponto de acesso ativado para internet:

  1. Crie um ponto de acesso para o seu bucket do S3. Consulte Criando pontos de acesso.

    Configure a origem da rede para Internet.

  2. Após a criação do ponto de acesso, anote o nome do recurso da Amazon (ARN) para o ponto de acesso. Exemplo: ARN: arn:aws:s3:us-east-1:675068711478:accesspoint/cust-data-bucket-internet-ap.Será necessário inserir o ARN em seu bloco de notas.

Acessando dados do AWS S3 a partir do seu bloco de notas

O fragmento de código de amostra a seguir mostra como acessar dados da AWS por meio de seu bloco de notas usando um ponto de acesso:

import boto3
import pandas as pd

# use an access key and a secret that has access to the bucket
access_key="..."  
secret="..." 

s3_client = boto3.client('s3', aws_access_key_id=access_key, aws_secret_access_key=secret)

#the Amazon resource name (ARN) of the access point
arn = "..." 
# the file you want to retrieve
fileName="customers.csv"

response = s3_client.get_object(Bucket=arn, Key=fileName)
s3FileStream = response["Body"]
#for other file types, change the line below to use the appropriate read_() method from pandas
customerDF = pd.read_csv(s3FileStream)