Esplora il modello di funzionalità AI generativa di IBM

Informazioni generali

Le funzionalità aziendali, essenziali per raggiungere obiettivi strategici e requisiti operativi, sono delineate nel modello di funzionalità dell'architettura di AI generativa. Include sei categorie principali, che mostrano le funzionalità uniche e di supporto necessarie per un'implementazione efficace dell'AI generativa, con una documentazione completa disponibile in altre architetture.

Le funzionalità aziendali, essenziali per raggiungere obiettivi strategici e requisiti operativi, sono delineate nell'architettura di AI generativa

Le funzionalità aziendali di livello 1, 2 e 3 necessarie per implementare e gestire efficacemente soluzioni di AI generativa.

Funzionalità uniche di gen AI

Operazioni gen AI: sono le capacità necessarie per gestire, distribuire e personalizzare i modelli di AI generativa da utilizzare all'interno di un'azienda. In questa categoria sono incluse funzionalità per addestrare e ottimizzare modelli, gestire il ciclo di vita dei modelli una volta distribuiti e gestire modelli e set di dati disponibili per gli utenti all'interno dell'azienda.

Sviluppo di applicazioni gen AI: apporta le funzionalità necessarie per adattare i foundation model generali per l'uso in soluzioni aziendali e specifiche di dominio e per sviluppare applicazioni di gen AI con caratteristiche complete. Ciò include le funzionalità necessarie per creare e implementare applicazioni di agentic AI e testare e adattare i prompt.

Governance gen AI: è una suite di funzionalità necessarie per monitorare e gestire efficacemente i modelli distribuiti in produzione. Queste includono funzionalità per monitorare le risposte continue, accurate e appropriate dei modelli, funzionalità per salvaguardare i modelli da input inappropriati e/o dannosi e funzionalità di governance per gestire i rischi aziendali e assistere sia per la conformità normativa che per i requisiti di reporting.

Gestione della sicurezza gen AI: si concentra sulle capacità necessarie per proteggere i sistemi AI, garantendone un'implementazione etica e responsabile. Ciò comporta la protezione dell'intero stack AI, proteggendo sia i modelli e il loro utilizzo, sia i dati su cui si basano.

I restanti gruppi di funzionalità supportano le funzionalità dell'AI generativa. Le funzionalità non sono esclusive dell'AI generativa, ma devono essere presenti per supportarla come funzionalità aziendale. Questi gruppi sono:

Gestione dei dati: è un gruppo di funzionalità per memorizzare, gestire e trasformare i dati in moduli che li rendono adatti all'ottimizzazione e all'addestramento di modelli di AI generativa. In questa categoria sono incluse anche le funzionalità di registrare e valutare le risposte dei modelli a scopi di audit e come input per ulteriori ottimizzazioni e affinamenti del modello.
Funzionalità di supporto: è un insieme generico di funzionalità applicative, di integrazione e di operazioni IT necessarie per implementare e gestire con successo soluzioni di AI generativa con un'azienda.
Risorse gen AI: acquisisce le funzionalità hardware e della piattaforma necessarie per sviluppare, adattare, implementare e gestire in modo efficiente ed efficace modelli e soluzioni di AI generativa.

Gruppi e funzionalità

Ogni categoria di funzionalità è composta da uno o più gruppi di funzionalità. Questa sezione mette in evidenza gruppi e funzionalità fondamentali per l'AI generativa.

Hub dei modelli: incapsula le funzionalità necessarie per gestire i modelli importati e i modelli messi a punto o addestrati dall'azienda. Queste capacità permettono alle imprese di gestire i modelli e i set di dati disponibili all'interno dell'impresa e di limitare l'accesso a modelli e set di dati a utenti o gruppi specifici all'interno dell'azienda. L'importazione dei modelli e l'importazioni dei dati sono funzionalità fondamentali per le aziende, per gestire l'assunzione di modelli dal numero crescente di archivi pubblici di modelli, come Hugging Face.

Hosting dei modelli: offre funzionalità per distribuire modelli generali e ottimizzati come servizi abilitati API all'interno di un'impresa, ottimizzando l'utilizzo delle risorse, consentendo raffinamenti e sostituzioni indipendenti e semplificando la governance. La chiave di tutto questo è la gestione dei criteri di accesso al modello, che garantisce che l'accesso al modello sia limitato agli utenti e ai gruppi autorizzati, impedendo l'uso non autorizzato.

Personalizzazione dei modelli: è un insieme di funzionalità che permettono a un'azienda di ottimizzare e addestrare modelli di AI generativa per esigenze specifiche del business. In genere questa funzionalità verrà realizzata utilizzando una piattaforma cloud, poiché il modello pay-as-you-go del cloud è adatto alla natura "intermittente" delle richieste di risorse di ottimizzazione e addestramento.

Governance dei dati e dei modelli: è un insieme critico di funzionalità per un'azienda nell'utilizzo di modelli di AI generativa su larga scala. In particolare, queste funzionalità forniscono alle aziende le intuizioni necessarie per monitorare e gestire i rischi dei modelli, come l'introduzione di distorsioni nelle risposte dei modelli, e per aiutare a soddisfare i requisiti normativi e di conformità per la trasparenza e l'equità del modello.

Monitoraggio dei modelli: è l'analogo operativo della governance dei modelli; laddove la governance dei modelli si occupa della gestione dei modelli e dei rischi a lungo termine, le funzionalità di monitoraggio dei modelli consentono alle aziende di monitorare e gestire le operazioni dei modelli in tempo reale. Il monitoraggio dei modelli comprende diverse funzionalità chiave, tra cui:

Rilevamento delle distorsioni: la capacità di rilevare e segnalare quando le risposte di un modello si discostano dalle risposte stabilite/ideali e iniziano a favorire una serie di risultati rispetto a un'altra.

Rilevamento di odio, abusi e volgarità (HAP): è la capacità di rilevare e filtrare odio, abusi e volgarità sia nei prompt inviati dagli utenti che nelle risposte generate dal modello. Queste sono considerate funzionalità "di base"; le aziende spesso scelgono di estendere l'elenco degli argomenti filtrati per includere argomenti non appropriati al business, come argomenti sessualmente allusivi in un ufficio di prestiti o per soddisfare le norme sociali di un pubblico target.

Monitoraggio e sicurezza dei prompt: è una capacità emergente necessaria per proteggere i modelli distribuiti dagli attacchi, come l'iniezione di prompt, che mirano a corrompere il modello o ad aggirare i controlli del modello stabiliti dall'azienda.

Gestione della conformità gen AI: è una categoria di funzionalità che consente di abilitare i controlli necessari per "proteggere l'utilizzo" dell'AI attraverso lo stack di applicazioni e "proteggere le applicazioni" stesse. Rispetta standard etici e linee guida per garantire che i sistemi di AI rispettino i valori e i diritti umani.

Conformità delle app AI:è la capacità di consentire l'aderenza delle "applicazioni" dell'AI a linee guida, regolamenti e standard stabiliti. Fornisce funzionalità per abilitare controlli come: gestione e conformità della postura delle app AI, conduzione di test affidabili del sistema AI.

Conformità dei modelli AI: è la capacità di consentire la gestione e l'aderenza dei modelli AI a linee guida, normative e standard stabiliti. Abilita controlli chiave come: tracciamento della deriva del modello e gestione e conformità della postura del modello.

Gestione legale e della conformità: garantisce che un'organizzazione rimanga aggiornata con il panorama normativo (monitoraggio regolatorio) e rispetti i requisiti legali, le regole e gli standard che regolano lo sviluppo, la distribuzione, il monitoraggio e l'uso dell'AI (ad esempio, conformità continua e controllo normativo)

Gestione della sicurezza delle applicazioni AI: riguarda l'abilitazione dei controlli necessari per "proteggere l'uso" dell'AI attraverso lo stack applicativo e "proteggere le applicazioni stesse". Rispetta standard etici e linee guida per garantire che i sistemi di AI rispettino i valori e i diritti umani.

Gestione e protezione dai rischi delle applicazioni AI: è la capacità di identificare, valutare e mitigare potenziali rischi e vulnerabilità che potrebbero influire sulla sicurezza, funzionalità o affidabilità di un'applicazione AI, garantendone la capacità di adattarsi, recuperare e continuare a funzionare efficacemente anche di fronte a eventi imprevisti, fallimenti o interruzioni. Inoltre, garantire la robustezza, la sicurezza e l'affidabilità dei sistemi di AI durante tutto il loro ciclo di vita.

Sicurezza e protezione dall'interazione delle applicazioni AI: sono meccanismi per garantire che le interazioni tra sistemi AI e i loro utenti, altri sistemi e l'ambiente avvengano in modo sicuro e protetto (per esempio, manipolazione degli input, limitazione delle query eccessive, prevenzione dei risultati tossici).

Sicurezza delle app AI: è un insieme di capacità e pratiche per garantire il funzionamento sicuro e affidabile dei sistemi AI. Comprende strategie per prevenire conseguenze indesiderate, errori e danni causati dalle applicazioni AI (ad esempio, affidabilità documenti AI, valutazione di equità).

Gestione della sicurezza dei modelli AI: questa categoria di funzionalità riguarda l'abilitazione dei controlli necessari per "proteggere il modello" e l'utilizzo dei modelli. Implementare le migliori pratiche per l'addestramento, la validazione e la valutazione dei modelli per migliorare prestazioni e affidabilità.

Sicurezza e protezione dei prompt: è la capacità di garantire che i prompt di input forniti ai modelli AI siano sicuri, non dannosi e allineati al comportamento previsto del modello e di proteggere il modello da accessi non autorizzati, manomissioni o attacchi. Allo stesso modo, è necessario verificare che le richieste di risposta siano sicure e protette in termini di contenuti che potrebbero inavvertitamente rivelare, come le PII (ad esempio, protezione da iniezione di prompt, prevenzione degli attacchi di inferenza/minimizzazione della risposta alle query, prevenzione dei risultati tossici)

Rilevamento delle minacce dei modelli AI: è la capacità di identificare e mitigare potenziali rischi o vulnerabilità che potrebbero compromettere l'integrità, la sicurezza o le prestazioni dei modelli AI e l'interazione con tali modelli (ad esempio, test di sicurezza del modello, mitigazione delle vulnerabilità del modello)

Gestione dell'accesso ai modelli AI: limita l'accesso ai modelli Gen AI, ai parametri dei modelli, ai dati di addestramento e alle API per prevenire potenziali abusi e vettori di attacco. Questa funzionalità stabilisce i controlli di accesso ai modelli esposti per l'uso aziendale, anche per le applicazioni AI; protegge i registri interni dei modelli e limita l'accesso interno ai modelli di produzione. Tali controlli di accesso dovrebbero includere politiche contestuali che tengano conto di chi, cosa, quando e da dove.

Gestione della sicurezza dei dati AI: è una categoria di funzionalità che consente controlli per "proteggere i dati". Stabilisce linee guida chiare per la raccolta, l'archiviazione e l'uso dei dati per garantire la qualità dei dati e mitigare le distorsioni. Sebbene la sicurezza dei dati non sia esclusiva della gen AI, ci concentreremo solo sulle aree in cui la gen AI richiede particolare attenzione dal punto di vista dei dati.

Privacy e riservatezza dei dati: è la capacità di salvaguardare le informazioni sensibili, garantendo che siano gestite in modo appropriato e rimangano private e accessibili solo a sistemi e utenti autorizzati (ad esempio, protezione della privacy, sicurezza dei dati sensibili, riservatezza dei dati).

Agentic AI: è un gruppo di funzionalità necessarie per creare e implementare applicazioni di agentic AI. Queste includono funzionalità fondamentali come il routing e l'orchestrazione, la gestione degli strumenti e la chiamata agli strumenti.

Messa a punto della gen AI: è un insieme di funzionalità necessarie per "personalizzare" un modello generativo generale in base alle esigenze dell'impresa. I modelli sono formati su un'ampia base di conoscenze e non conoscono il gergo e i processi specifici del settore. Pertanto, la maggior parte delle aziende dovrà ricorrere a funzionalità come ingegneria dei prompt, ottimizzazione dei prompt e messa a punto dei prompt per creare un modello che comprenda i termini e i processi dell'attività aziendale.

Le funzionalità delle applicazioni GenAI consentono alle aziende di sviluppare applicazioni di AI generativa avanzate. Le funzionalità includono la possibilità di generare dinamicamente funzioni per rispondere alle domande degli utenti; memoria conversazionale, che consente alle applicazioni di AI generativa di conservare e fare riferimento alle interazioni precedenti in modo conversazionale; e il routing del modello, che consente alle applicazioni di indirizzare dinamicamente le query a un modello più adatto a rispondere.

Risorse

L'architettura di AI generativa di IBM

L'architettura di AI generativa di IBM è l'architettura generale di AI generativa in IBM IT Architect Assistant (IIAA), uno strumento di sviluppo e gestione dell'architettura. Utilizzando IIAA, gli architetti possono elaborare e personalizzare l'architettura per creare le proprie soluzioni di AI generativa.