La piattaforma di cloud ibrido IBM si trova di fronte a una sfida complessa: ospitare nuove applicazioni di intelligenza artificiale (AI) insieme a quasi 2.000 workload interni esistenti che comprendono le operazioni di business di IBM.1 Quando si tratta di ospitare applicazioni di AI su una piattaforma di cloud ibrido, è necessario considerare i seguenti requisiti:
- Le applicazioni AI devono essere conformi ai requisiti di proprietà intellettuale (IP) dell'azienda.
- Gli strumenti per gli sviluppatori devono essere semplici e favorire la produttività se utilizzati per creare applicazioni che utilizzano contenuti di AI generativa.
- I dati sensibili devono essere gestiti in modo sicuro durante l'acquisizione e l'utilizzo.
- Gli ambienti di hosting devono essere convenienti in termini di risorse hardware, sviluppo e operazioni.
- Alcuni workload AI devono essere ospitati on-premise e richiedono il supporto per gli stessi ambienti AI su hardware locale.
Inizialmente, l'organizzazione IBM Chief Information Officer (CIO) ospitava un database vettoriale e modelli di AI generativa che utilizzano unità di elaborazione grafica (GPU) ad alto costo. Sebbene questa opzione fosse efficace, non era ottimale. La competizione per le risorse tra i team di sviluppo e produzione durante i picchi di utilizzo ha portato all'acquisizione di GPU aggiuntive, che rimanevano inattive durante le ore non di punta.
Inoltre, questo ambiente complesso richiedeva che il team operativo dedicasse del tempo extra alla gestione dei cluster AI. Ciò comportava la necessità di procurarsi risorse, applicare patch e gestire la resilienza.
1I dati delle applicazioni IBM Hybrid Cloud sono stati ottenuti tramite la dashboard Superset IBM Application Portfolio Management (APM) su ServiceNow il 30 settembre 2024.