Cos'è l'AI storage?

Tre persone sedute attorno a un tavolo

AI storage, definito

L'AI storage si riferisce ai sistemi di data storage ottimizzati per i grandi set di dati, l'accesso ai dati ad alta velocità e le intense richieste di calcolo da parte dei workload di intelligenza artificiale (AI) e machine learning (ML).

L'innovazione nell'AI sta accelerando rapidamente e i relativi progetti richiedono un'architettura di storage in grado di accogliere sia crescita in espansione dei dati sia l'offerta di prestazioni, scalabilità e accesso a bassa latenza che richiedono i workload basati sull'AI.

Secondo uno studio di ricerca di Precedence, si stima che il mercato globale dello storage basato sull'AI crescerà da 35,95 miliardi di dollari nel 2025 a circa 255,24 miliardi di dollari entro il 2034. Il tasso di crescita annuale composto stimato (CAGR) è del 24,42%.1 L'Integrazione accelerata dell'AI e machine learning (ML), insieme all'aumento dei casi d'uso dell'AI storage in tutti i settori, sta guidando la crescita del mercato.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Perché è importante l'AI storage?

Le aziende stanno modernizzando la propria infrastruttura di data storage per utilizzare al meglio il potenziale di business offerto dall'AI, dal machine learning e dall'analytics avanzata. Tuttavia, sono sfidati dai dati e dai workload distribuiti in più regioni, dall'aumento del tempo richiesto per l'addestramento dell'AI e dai workload di inferenza. A questi problemi si aggiungono il costo e la scarsità di risorse on-demand come le unità di elaborazione grafica (GPU). 

Secondo uno studio dell'IBM® Institute for Business Value (IBV), il 62% dei dirigenti prevede di utilizzare l'AI nelle proprie organizzazioni entro 3 anni. Tuttavia, solo l'8% ha dichiarato che la propria infrastruttura IT soddisfa tutte le esigenze di AI.

Guardando al futuro, solo il 42% degli intervistati ritiene che questa infrastruttura possa gestire i volumi di dati e le richieste di elaborazione dei modelli AI avanzati. Allo stesso modo, solo il 46% si aspetta che supporti l'inferenza in tempo reale su larga scala.

I workload dell'AI richiedono sistemi in grado di ridurre i colli di bottiglia nel trattamento dei dati, che rallentano l'addestramento dei modelli, il fine-tuning e l'inferenza. Hanno inoltre bisogno di sistemi di storage scalabili per gestire set di dati in continua crescita, in particolare quelli associati all'AI generativa e ai workload dei modelli linguistici di grandi dimensioni (LLM).

Per soddisfare queste esigenze, l'AI storage può integrarsi perfettamente con framework open source e le ML proprietarie (ML) e il deep learning tramite le application programming interface (API). Questa funzionalità accelera l'addestramento degli LLM, lo sviluppo dei modelli e migliora le prestazioni complessive su tutto il sistema AI.

Per saperne di più, consulta: "Infrastruttura per AI: perché lo storage è importante."

AI Academy

Prepararsi all'AI con l'hybrid cloud

Condotto dai migliori leader di pensiero di IBM, il programma di studi è stato progettato per aiutare i dirigenti aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti in AI che possono favorire la crescita.

AI storage e storage tradizionale a confronto

Il data storage tradizionale viene utilizzato per le app aziendali in generale, mentre l'AI storage fornisce la base per addestrare e gestire modelli AI complessi e ad alta intensità di dati in modo efficiente ed economico.

Sebbene lo storage tradizionale gestisca sia dati strutturati che dati non strutturati, è progettato per workload tipici aziendali con schemi prevedibili, non per addestrare modelli su sistemi distribuiti e per eseguire inferenze su larga scala.

L'AI storage si riferisce ai sistemi utilizzati per memorizzare e gestire i dati per addestrare e gestire sistemi di infrastruttura AI, compresi data lake, cloud storage e database. Gestisce enormi volumi di dati non strutturati (ad esempio, immagini, audio, video, dati dei sensori).

Questi tipi di dati richiedono un sistema di storage che offra IOPS (operazioni di input/output operazioni al secondo) elevati e latenza bassissima, specialmente durante l'addestramento e l'inferenza del modello.

In sintesi, la differenza chiave tra lo storage tradizionale e l'AI storage si riduce alle specifiche del workload. Lo storage tradizionale è stato costruito per operazioni coerenti e prevedibili, mentre i workload AI hanno requisiti unici ed impegnativi lungo tutto il ciclo di vita.

Come funziona l'AI storage?

Ogni fase del ciclo di vita del sistema di AI, ovvero data ingestion, addestramento, inferenza e aggiornamenti del modello, ha esigenze di storage uniche, che richiedono petabyte di capacità di storage e memoria ad alta velocità.

L'AI storage utilizza delle pipeline di dati per facilitare il flusso continuo dei dati, dalla raccolta all'elaborazione preliminare fino al consumo del modello. Utilizza object storage scalabili, compresi object storage e file system paralleli, che elaborano i dati in parallelo su più nodi di storage. Questa funzionalità consente alle applicazioni AI di gestire i dati in tempo reale all'elevata velocità richiesta.

Per bilanciare costi e prestazioni, l'AI storage prevede in genere dei livelli di storage. I dati a cui si accede frequentemente (hot tier) sono memorizzati su cache ad alta velocità e memoria flash, mentre i dati meno critici (caldo o freddo) sono conservati su tecnologie di storage economiche e più lente per una retention a lungo termine.

Tecnologie di AI storage fondamentali

  • Storage basato su flash: l'AI storage si basa su solid-state drive (SSD). Questi storage sono dispositivi basati su semiconduttori che tipicamente utilizzano una memoria flash NAND per alte prestazioni, bassa latenza e throughput elevato per elaborare set di dati per addestramento e inferenza.
  • Design single-tier: la maggior parte delle soluzioni di AI storage utilizza un'architettura single-tier, che offre un ambiente consolidato e unificato per i dati a cui si accede di frequente. Questo tipo di architettura supporta lo storage flash o SSD per bassa latenza ed elevate prestazioni di I/O.
  • Memoria a elevata larghezza di banda (HBM): GPU,  CPU, acceleratori e alcuni SSD per data center utilizzano l'HBM per consentire trasferimenti dati ad alte prestazioni con un consumo energetico inferiore rispetto alla memoria dinamica ad accesso casuale (DRAM), un'architettura di memoria più tradizionale.
  • Tecnologia NVMe (non-volatile memory express): l'NVMe, un protocollo progettato per il trasferimento di dati altamente parallelo, svolge un ruolo cruciale nella tecnologia di AI storage. Gli SSD NVMe e lo storage in rete (NVMe-oF) sono dotati della velocità, della programmabilità e della capacità necessarie per supportare una massiccia elaborazione in parallelo nei workload dell'AI. 
  • Repository di dati: l'AI storage utilizza piattaforme e servizi di dati (ad esempio, data lake, warehouse, lakehouse) per creare un ambiente centralizzato per dati grezzi e dati non strutturati. Questo processo elimina i silos e la necessità di spostare i dati tra i sistemi.
  • Tecnologie di riduzione dei dati: le tecniche di deduplica, compressione e tiering dei dati minimizzano l'impronta e i costi di storage di un'organizzazione, mantenendo al contempo l'accesso ad alte prestazioni richiesto per i workload dell'AI.
  • Ambienti scalabili: l'AI storage viene implementato utilizzando modelli di infrastruttura scalabili e ad alte prestazioni, come l'hybrid cloud, on-premises (on-prem), i data center  hyperscale e gli ambienti edge .

 

I benefici dell'AI storage

L'AI storage offre vantaggi fondamentali che ottimizzano i i workflow dell'AI e le prestazioni dell'infrastruttura, tra cui:

  • Prestazioni accelerate dalla GPU: supporta applicazioni e workload accelerati dalla GPU, fornendo la capacità necessaria per l'addestramento e l'inferenza dell'AI.
  • Accesso unificato ai dati: fornisce accesso a file, volumi e oggetti attraverso fonti di dati eterogenee, inclusi storage, cloud e ambienti edge, eliminando la necessità di spostare i dati tra i sistemi.
  • Accessibilità dei dati senza movimento: consente l'accesso ai dati su più piattaforme e località senza spostarli fisicamente, riducendo duplicazioni e costi di rete .
  • Protezione automatizzata dei dati: fornisce dati che utilizzano criteri e metodi di protezione come la crittografia in tutti gli ambienti, garantendo che i set di dati dell'AI siano protetti durante l'intero ciclo di vita.
  • Integrazione cloud ibrida: collega i dati dal data center alle risorse del cloud pubblico, migliorando la collaborazione delle applicazioni e portando maggiore agilità ai workload dell'AI.
  • Gestione semplificata dello storage: offre scalabilità integrata, automazione e operazioni semplificate, riducendo la complessità delle iniziative di AI.
  • Ottimizzazione dei costi: elimina i silos e la duplicazione dei dati, unificando le risorse di calcolo e di storage per ridurre i costi infrastrutturali senza compromettere le prestazioni dell'AI.

Casi d'uso dell'AI storage

L'AI storage svolge un ruolo cruciale nei workflow ad alta intensità di dati di AI, ML e calcolo ad alte prestazioni (HPC). Più avanti vengono illustrati alcuni casi d'uso specifici del settore:

  • Retail
  • Settore sanitario
  • Finanza
  • Intrattenimento
  • Produzione industriale
  • Assicurazioni

Retail

I rivenditori utilizzano l'AI storage per gestire grandi volumi di dati e metadati generati da transazioni di vendita, interazioni con i clienti, social media e dispositivi IoT. Questo processo consente l'ottimizzazione dell'inventario in tempo reale, raccomandazioni personalizzate e previsione della domanda.

Assistenza sanitaria

Nel settore sanitario, l'AI storage accelera la scoperta di farmaci e supporta il supporto decisionale clinico tramite l'AI (ad esempio, NVIDIA BioNeMo, IBM watsonx) gestendo enormi set di dati genomici, file di imaging medico e cartelle cliniche elettroniche.

Finanza

Le banche e altri istituti finanziari si affidano all'AI storage scalabile per gestire enormi quantità di dati provenienti dai volumi delle transazioni. In questo modo, gli algoritmi di machine learning possono identificare schemi e anomalie in milioni di transazioni in tempo reale, supportando il rilevamento delle frodi e servizi bancari personalizzati.

Intrattenimento

I servizi di streaming come Netflix e Amazon utilizzano l'AI data storage su larga scala per elaborare i dati della cronologia delle visualizzazioni, abilitando motori di raccomandazione in tempo reale che offrono contenuti personalizzati.

Produzione industriale

L'AI storage fornisce la gestione dei dati per sensori e macchine nei diversi stabilimenti. Questa infrastruttura consente la manutenzione predittiva, ottimizza la supply chain e automatizza il controllo della qualità in tempo reale.

Assicurazioni

L'AI storage supporta l'elaborazione automatica della sottoscrizione e delle richieste consentendo un accesso rapido a documenti, foto e dati non strutturati. Questo approccio consente ai modelli di elaborazione del linguaggio naturale (NLP) e riconoscimento delle immagini di accelerare la valutazione del rischio e accelerare la liquidazione dei sinistri.

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

Soluzioni correlate
Analytics dei dati e dell'AI 

Usa framework e strumenti open source per applicare l'AI e il machine learning ai dati aziendali più preziosi sui mainframe IBM zSystems.

Esplora IBM Z
Soluzioni per l'infrastruttura AI

IBM fornisce soluzioni per l'infrastruttura AI per accelerare l'impatto su tutta l'azienda con una strategia hybrid by design.

Scopri le soluzioni per l'infrastruttura AI
Consulenza e servizi sull'AI

Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi AI
Prossimi passi

Potenzia i tuoi workload AI con un'infrastruttura ottimizzata per prestazioni, affidabilità e integrazione hybrid cloud, progettata per le reali esigenze aziendali.

Esplora le soluzioni per l'infrastruttura AI Ottieni maggiori informazioni
Note a piè di pagina

1 “AI-Powered Storage Market Size and Forecast 2025 to 2034”, Precedence Research, 15 luglio 2025.