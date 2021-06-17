L'attenzione dei settori verso un'AI affidabile è guidata da diverse forze: la posizione di responsabilità sociale delle imprese, le preoccupazioni relative al rischio reputazionale e una serie crescente di normative. Le organizzazioni riconoscono di aver bisogno di un approccio sistematico per garantire che l'AI e il machine learning possano essere affidabili e operativi. Gli aspetti di un'AI affidabile includono equità, robustezza, privacy, spiegabilità e trasparenza. I modelli di casi d'uso includono la conduzione di controlli dello stato di salute delle applicazioni esistenti e la creazione di un framework organizzativo per la governance dell'AI, ma oggi ci concentreremo sull'operativizzazione di nuove applicazioni.
Le organizzazioni hanno bisogno di un approccio sistematico per costruire e mettere in funzione nuove applicazioni di AI in modo affidabile. Questo approccio deve tenere conto del ciclo di vita end-to-end della data science e dell'AI. Il ciclo di vita dell'AI consiste in una sequenza di livelli che riuniscono varie persone e best practice. (Vedi il report di O'Reilly Operationalizing AI per una visione generale.) Le fasi del ciclo di vita includono:
In uno scenario ideale, gli aspetti di un'AI affidabile dovrebbero essere affrontati in ciascuna di queste fasi e non solo alla fine. Abbiamo bisogno di guardrail adeguati in ogni fase, dalla definizione aziendale, all'esplorazione dei dati e alla costruzione dei modelli fino alla validazione, implementazione, monitoraggio e gestione continua. Diamo un'occhiata più da vicino a ciascuna fase e a come vengono affrontati i vari aspetti dell'AI affidabile.
Questa fase guida la priorità dei casi d'uso e lo sviluppo di un piano d'azione legato all'AI. Il team, composto da stakeholder aziendale, data scientist, data owner, responsabile delle operazioni e altri ruoli, si concentra innanzitutto sul caso d'uso aziendale, definendo il valore aziendale e specificando i KPI aziendali. Successivamente affronta il compito tecnico, traducendo l'obiettivo aziendale in specifiche attività di AI da risolvere. Infine, il team sviluppa un piano d'azione strutturato per una soluzione ai compiti tecnici identificati a supporto dell'obiettivo aziendale.
L'applicazione dei principi dell'Enterprise Design Thinking è una best practice per questa fase. Il Design Thinking aiuta a identificare e definire vari aspetti aziendali e tecnici di bias/equità, robustezza, spiegabilità, ecc. nel contesto del caso d'uso. Questa fase aiuta a rispondere a domande come:
È anche importante prendere nota di eventuali dati organizzativi e politiche di AI che il team dovrà seguire durante la costruzione di questi casi d'uso, per evitare sfide dell'ultimo minuto durante la convalida per l'uso in produzione.
Questa fase consente al consumatore di dati di trovare e accedere ai set di dati rilevanti. I team di data science possono "acquistare dati" in un catalogo centrale utilizzando metadati o termini aziendali per la ricerca. Sono in grado di comprendere i dati, compreso il loro proprietario, la loro origine, la relazione con altri set di dati e così via. È importante fornire ai data scientist una visione tecnica della data lineage, così che possano comprendere ogni trasformazione dei dati che potrebbe influenzare il modo in cui creano e utilizzano le caratteristiche.
Sulla base di tale esplorazione, possono richiedere un feed di dati. Una volta approvati, i set di dati possono essere messi a disposizione del team di data science nel loro ambiente di sviluppo della data science.
Se il team deve lavorare con dati personali regolamentati come informazioni di identificazione personale (PII) o informazioni sanitarie protette (PHI), il responsabile dei dati o un fornitore di dati deve assicurarsi che i dati condivisi rispettino le normative attraverso l'anonimizzazione appropriata.
I team di data science esplorano e preparano i dati e creano, addestrano e testano i loro modelli AI/ML durante questa fase. Le attività di questa fase sono meglio intraprese come una serie di sprint agili. È importante che il bias nei dati venga controllato in questa fase, anche prima che inizi qualsiasi lavoro di costruzione del modello. Si tratta di un guardrail interno per l'equità, e tali guardrail possono essere predisposti durante e dopo le fasi di costruzione del modello. La robustezza del modello, la spiegabilità e altri aspetti possono essere considerati e testati in modo simile durante questa fase.
Una volta completati con successo questi test, una pipeline MLOps consente di spostare il modello e gli asset dall'ambiente di sviluppo a un ambiente di validazione pre-produzione.
Questa fase prevede la convalida del modello e la sua implementazione in produzione. Le attività di convalida possono essere svolte da un team diverso da quello che ha costruito il modello, come il team di convalida o di gestione del rischio dell'organizzazione, oppure da un'entità esterna.
Questo team convalida qualità, robustezza, equità, ecc. e genera report di convalida. È importante catturare i risultati della validazione per riferimento e confronto. Si controllano anche le schede dei modelli, le spiegazioni locali e globali e altre metriche.
Se il modello supera la validazione, il team Ops può promuoverlo nell'ambiente di produzione utilizzando una pipeline MLOps. Il modello viene implementato lì per l'invocazione online o in batch.
In questa fase, il team operativo avvia il monitoraggio e la gestione continua del modello AI/ML in produzione. Il team configura i monitor per la raccolta periodica programmata di metriche. Qualità, robustezza ed equità sono monitorate a frequenze dettate dalle esigenze aziendali. Esempi di attività in corso sono il monitoraggio dei dati e della deriva della precisione e la generazione di spiegazioni per transazioni selezionate nonché per il comportamento globale.
Nel caso in cui i monitor rilevino che una soglia è stata superata, l'azienda può scegliere di intervenire con azioni che vanno dagli avvisi alle misure correttive. I passaggi di mitigazione dei pregiudizi o di riaddestramento del modello possono essere configurati per garantire un comportamento affidabile continuo. I modelli possono essere dismessi in base a criteri aziendali o tecnici. Questa fase stabilisce i limiti più estremi per un'AI affidabile.
Queste fasi del ciclo di vita dell'AI si inseriscono in un framework di governance dell'AI per l'azienda. Tale framework consente a più casi d'uso di seguire le fasi del ciclo di vita in modo coerente, indipendentemente dagli strumenti di sviluppo utilizzati. Aiuta ad automatizzare la documentazione durante tutto il ciclo di vita e fornisce una visione coerente ai vari stakeholder.
Mettere in pratica un'AI affidabile richiede di unire persone (competenza), processi (best practice) e piattaforma (tecnologia). IBM® Cloud Pak for Data e IBM® Spectrum Fusion forniscono il framework tecnologico che supporta le varie fasi del ciclo di vita end-to-end dell'AI. Può adattarsi agli ambienti esistenti e integrare gli strumenti esistenti per lo sviluppo e la distribuzione dei modelli. La piattaforma può funzionare su una vasta gamma di opzioni di infrastruttura cloud (IBM, AWS, Azure, GCP, ecc.) e on-premise, offrendo una vera funzionalità di hybrid cloud.
IBM offre una serie di servizi che uniscono educazione, competenze, best practice e tecnologia per aiutare i clienti a iniziare a mettere in pratica un'AI affidabile.