Le funzionalità aziendali, essenziali per raggiungere obiettivi strategici e requisiti operativi, sono delineate nel modello di funzionalità dell'architettura di AI generativa. Include sei categorie principali, che mostrano le funzionalità uniche e di supporto necessarie per un'implementazione efficace dell'AI generativa, con una documentazione completa disponibile in altre architetture.
I restanti gruppi di funzionalità supportano le funzionalità dell'AI generativa. Le funzionalità non sono esclusive dell'AI generativa, ma devono essere presenti per supportarla come funzionalità aziendale. Questi gruppi sono:
Gestione dei dati: è un gruppo di funzionalità per memorizzare, gestire e trasformare i dati in moduli che li rendono adatti all'ottimizzazione e all'addestramento di modelli di AI generativa. In questa categoria sono incluse anche le funzionalità di registrare e valutare le risposte dei modelli a scopi di audit e come input per ulteriori ottimizzazioni e affinamenti del modello.
Funzionalità di supporto: è un insieme generico di funzionalità applicative, di integrazione e di operazioni IT necessarie per implementare e gestire con successo soluzioni di AI generativa con un'azienda.
Risorse gen AI: acquisisce le funzionalità hardware e della piattaforma necessarie per sviluppare, adattare, implementare e gestire in modo efficiente ed efficace modelli e soluzioni di AI generativa.
Ogni categoria di funzionalità è composta da uno o più gruppi di funzionalità. Questa sezione mette in evidenza gruppi e funzionalità fondamentali per l'AI generativa.
Hub dei modelli: incapsula le funzionalità necessarie per gestire i modelli importati e i modelli messi a punto o addestrati dall'azienda. Queste capacità permettono alle imprese di gestire i modelli e i set di dati disponibili all'interno dell'impresa e di limitare l'accesso a modelli e set di dati a utenti o gruppi specifici all'interno dell'azienda. L'importazione dei modelli e l'importazioni dei dati sono funzionalità fondamentali per le aziende, per gestire l'assunzione di modelli dal numero crescente di archivi pubblici di modelli, come Hugging Face.
Hosting dei modelli: offre funzionalità per distribuire modelli generali e ottimizzati come servizi abilitati API all'interno di un'impresa, ottimizzando l'utilizzo delle risorse, consentendo raffinamenti e sostituzioni indipendenti e semplificando la governance. La chiave di tutto questo è la gestione dei criteri di accesso al modello, che garantisce che l'accesso al modello sia limitato agli utenti e ai gruppi autorizzati, impedendo l'uso non autorizzato.
Personalizzazione dei modelli: è un insieme di funzionalità che permettono a un'azienda di ottimizzare e addestrare modelli di AI generativa per esigenze specifiche del business. In genere questa funzionalità verrà realizzata utilizzando una piattaforma cloud, poiché il modello pay-as-you-go del cloud è adatto alla natura "intermittente" delle richieste di risorse di ottimizzazione e addestramento.
Governance dei dati e dei modelli: è un insieme critico di funzionalità per un'azienda nell'utilizzo di modelli di AI generativa su larga scala. In particolare, queste funzionalità forniscono alle aziende le intuizioni necessarie per monitorare e gestire i rischi dei modelli, come l'introduzione di distorsioni nelle risposte dei modelli, e per aiutare a soddisfare i requisiti normativi e di conformità per la trasparenza e l'equità del modello.
Monitoraggio dei modelli: è l'analogo operativo della governance dei modelli; laddove la governance dei modelli si occupa della gestione dei modelli e dei rischi a lungo termine, le funzionalità di monitoraggio dei modelli consentono alle aziende di monitorare e gestire le operazioni dei modelli in tempo reale. Il monitoraggio dei modelli comprende diverse funzionalità chiave, tra cui:
Gestione della conformità gen AI: è una categoria di funzionalità che consente di abilitare i controlli necessari per "proteggere l'utilizzo" dell'AI attraverso lo stack di applicazioni e "proteggere le applicazioni" stesse. Rispetta standard etici e linee guida per garantire che i sistemi di AI rispettino i valori e i diritti umani.
Gestione della sicurezza delle applicazioni AI: riguarda l'abilitazione dei controlli necessari per "proteggere l'uso" dell'AI attraverso lo stack applicativo e "proteggere le applicazioni stesse". Rispetta standard etici e linee guida per garantire che i sistemi di AI rispettino i valori e i diritti umani.
Gestione della sicurezza dei modelli AI: questa categoria di funzionalità riguarda l'abilitazione dei controlli necessari per "proteggere il modello" e l'utilizzo dei modelli. Implementare le migliori pratiche per l'addestramento, la validazione e la valutazione dei modelli per migliorare prestazioni e affidabilità.
Gestione della sicurezza dei dati AI: è una categoria di funzionalità che consente controlli per "proteggere i dati". Stabilisce linee guida chiare per la raccolta, l'archiviazione e l'uso dei dati per garantire la qualità dei dati e mitigare le distorsioni. Sebbene la sicurezza dei dati non sia esclusiva della gen AI, ci concentreremo solo sulle aree in cui la gen AI richiede particolare attenzione dal punto di vista dei dati.
Agentic AI: è un gruppo di funzionalità necessarie per creare e implementare applicazioni di agentic AI. Queste includono funzionalità fondamentali come il routing e l'orchestrazione, la gestione degli strumenti e la chiamata agli strumenti.
Messa a punto della gen AI: è un insieme di funzionalità necessarie per "personalizzare" un modello generativo generale in base alle esigenze dell'impresa. I modelli sono formati su un'ampia base di conoscenze e non conoscono il gergo e i processi specifici del settore. Pertanto, la maggior parte delle aziende dovrà ricorrere a funzionalità come ingegneria dei prompt, ottimizzazione dei prompt e messa a punto dei prompt per creare un modello che comprenda i termini e i processi dell'attività aziendale.
Le funzionalità delle applicazioni GenAI consentono alle aziende di sviluppare applicazioni di AI generativa avanzate. Le funzionalità includono la possibilità di generare dinamicamente funzioni per rispondere alle domande degli utenti; memoria conversazionale, che consente alle applicazioni di AI generativa di conservare e fare riferimento alle interazioni precedenti in modo conversazionale; e il routing del modello, che consente alle applicazioni di indirizzare dinamicamente le query a un modello più adatto a rispondere.