Gli sviluppatori possono iniziare generando dati di esempio, essenziali per l'addestramento dei modelli di apprendimento automatico (ML). Questo processo prevede il recupero, la pulizia e la preparazione di set di dati del mondo reale per la pre-elaborazione. A volte, gli sviluppatori possono utilizzare Amazon Ground Truth per creare dati di immagini sintetiche etichettati che potenziano o sostituiscono i dati di esempio. Una volta pronti, i dati possono essere caricati su Amazon Simple Storage Service (S3), rendendoli accessibili per l'uso con vari servizi AWS.

Le istanze notebook Amazon SageMaker offrono un ambiente solido in cui gli sviluppatori possono preparare ed elaborare i propri dati per l'addestramento. Accedendo ai dati memorizzati in S3, SageMaker può accelerare il processo di sviluppo del modello utilizzando istanze di apprendimento automatico (ML) completamente gestite per addestrare i modelli, eseguire inferenze ed elaborare grandi set di dati all'interno di Amazon Elastic Cloud Compute(EC2).

SageMaker supporta la codifica collaborativa tramite l'applicazione open source Jupyter Notebook. I data scientist possono importare i propri strumenti o utilizzare istanze di notebook predefinite dotate di driver e librerie essenziali di codice già scritto per i più diffusi framework di deep learning. Queste librerie possono essere costituite da operazioni matematiche, livelli di neural networks e algoritmi di ottimizzazione.

SageMaker offre inoltre flessibilità agli sviluppatori supportando algoritmi personalizzati e confezionati come immagini di contenitori Docker. Si integra con Amazon S3, consentendo ai team di lanciare facilmente i propri progetti di apprendimento automatico. Gli sviluppatori possono fornire i propri algoritmi di addestramento o scegliere tra una serie di algoritmi precostituiti tramite la console di SageMaker. Sono disponibili tutorial e risorse per guidare gli utenti attraverso questi processi.