Pubblicato: 27 agosto, 2024
Collaboratori: Dave Bergmann, Cole Stryker

Cos'è l'augmented analytics?

L'augmented analytics è l'integrazione dell'elaborazione del linguaggio naturale (NLP) e di altre funzionalità del machine learning nelle piattaforme di analytics dei dati. Gli strumenti di augmented analytics utilizzano inoltre l'intelligenza artificiale (AI) per automatizzare e semplificare l'analisi dei dati tramite workflow intuitivi e facili da usare.

L'augmented analytics aiuta a democratizzare il processo decisionale basato sui dati attraverso l'automazione o la semplificazione dei processi, tra cui la preparazione dei dati, la selezione dei modelli, la generazione di informazioni e la visualizzazione dei dati. Grazie alle funzionalità di augmented analytics, le attività che un tempo richiedevano l'esperienza tecnica dei data scientist possono essere eseguite sia dagli analisti che dagli utenti business.  

L'AI generativa ha accelerato la proliferazione di piattaforme di augmented analytics e di strumenti self-service. La crescente disponibilità di sofisticati modelli linguistici di grandi dimensioni (LLM) facilita le query in linguaggio naturale e la generazione del linguaggio naturale (NLG), consentendo agli utenti di interrogare dati e interpretare i risultati senza conoscenze tecniche o linguaggi di programmazione specializzati.

Inoltre, gli algoritmi di machine learning possono ottimizzare continuamente le funzionalità di base degli strumenti di augmented analytics per soddisfare meglio le esigenze di utenti o casi d'uso specifici. Ad esempio, una piattaforma di business intelligence (BI) può identificare i pattern nelle richieste degli utenti nel tempo, quindi fornire automaticamente insight fruibili pertinenti a tali modelli in tempo reale su una dashboard di reporting.

Riducendo le barriere tecniche per ottenere insight significativi da dati complessi, l'augmented analytics amplia l'accesso al processo di analisi. In tal modo, le soluzioni di augmented analytics possono migliorare l'alfabetizzazione dei dati a livello aziendale e garantire meglio che le decisioni aziendali chiave di un'intera organizzazione siano radicate in un'analisi ponderata dei dati.

Elementi chiave dell'augmented analytics

Come suggerisce il termine, le soluzioni di augmented analytics sono progettate per potenziare ogni fase del processo di analytics dei dati, dalla preparazione dei dati alla generazione di insight fino all'elaborazione di report chiari e facili da interpretare. Una solida piattaforma di analytics self-service consente a qualsiasi utente di ottenere insight più approfonditi con meno sforzo o competenze tecniche.

Le funzionalità chiave di una soluzione di augmented analytics ideale includono:

  • Gestione dei dati automatizzata
  • Interazioni con il linguaggio naturale
  • Visualizzazione dei dati
  • Insight automatizzati e analisi statistiche

Gestione dei dati automatizzata


Tra i benefici più evidenti dell'augmented analytics c'è la possibilità di ridurre la noia e risparmiare tempo. Con l'aumento della quantità di dati inaugurato dall'era dei big data, è aumentato anche il lavoro necessario per preparare tali dati per l'analisi e consolidare gli insight provenienti da fonti di dati eterogenee.
 

Preparazione dati

Per essere elaborati dagli algoritmi di machine learning, i dati devono essere raccolti da più fonti, organizzati e aggregati, quindi formattati in modo pulito e coerente. Quando si tratta di set di dati tabulari, ad esempio, i campi dati devono essere ordinati in modo coerente per garantire che le rispettive caratteristiche degli incorporamenti vettoriali per ogni punto dati corrispondano a quelle di altri punti dati. Se eseguito manualmente, questo processo può essere molto noioso e laborioso.

Le piattaforme di BI moderne e potenziate dall'AI possono utilizzare il machine learning per automatizzare molte attività di pulizia dei dati tramite:

  • Rilevamento automatico degli attributi dei dati rilevanti. Ad esempio, un algoritmo potrebbe rilevare la presenza di informazioni geografiche (come un codice postale o le coordinate di latitudine e longitudine) o informazioni di contatto (come un indirizzo e-mail o un numero di telefono). Queste funzionalità di dati possono quindi essere inserite all'interno di uno schema di formattazione unificato.

  • Garantire la qualità dei dati e preservare la privacy. Gli algoritmi possono essere addestrati per ponderare, de-enfatizzare o ignorare l'input proveniente da diverse fonti di dati in conformità con la politica di governance dei dati di un'organizzazione. Una piattaforma di augmented analytics può rafforzare ulteriormente le pratiche di governance dei dati, ad esempio eliminando automaticamente i punti dati dalle informazioni di identificazione personale (PII). Questa funzionalità è particolarmente utile in settori come quello sanitario, in cui l'uso di tali informazioni è fortemente regolamentato.

  • Leggere ed estrarre informazioni da un PDF o da fonti di rich text. Questo processo può inoltre comportare la rimozione o la sostituzione di valori null o caratteri speciali, come segni di punteggiatura o simboli non standard, per convertire il testo in un formato leggibile dalla macchina.

  • Indicizzazione e raggruppamento delle informazioni correlate. Ad esempio, un algoritmo potrebbe riconoscere la presenza di punti dati paralleli in origini diverse e suggerire l'aggregazione o rilevare punti dati ridondanti e combinarli automaticamente in un'unica voce. Inoltre, una piattaforma di augmented analytics può integrare un modello in grado di produrre incorporamenti vettoriali efficaci per ciascun documento, per consentire una ricerca e un recupero vettoriali efficienti e una generazione aumentata.

 

Rilevamento dati

Sebbene il lavoro tipicamente associato agli analisti di dati di solito comporti l'interrogazione proattiva dei dati per prendere decisioni specifiche o testare ipotesi specifiche, gran parte del valore offerto da una solida data science deriva dall'esplorazione dei dati in generale alla ricerca di connessioni e insight invisibili o inaspettati.  

Uno strumento di augmented analytics potrebbe, ad esempio, consigliare automaticamente associazioni tra diverse fonti di dati che un utente potrebbe altrimenti aver trascurato o far emergere valori anomali o tendenze anomale per ulteriori analisi. L'applicazione dell'apprendimento non supervisionato, come i modelli di associazione o di clustering, può riconoscere modelli e correlazioni intrinseche che potrebbero informare insight attuabili.

Interazioni con il linguaggio naturale


Una delle barriere all'ingresso più importanti per gli utenti non tecnici interessati all'analytics dei dati è la profondità delle conoscenze tecniche specialistiche richieste per l'analytics dei dati tradizionale. Per molte persone, imparare a programmare o utilizzare il linguaggio di query strutturato (SQL) è estremamente difficile o richiede molto tempo. Comprende infatti l'apprendimento delle tecniche statistiche, della nomenclatura e delle best practice necessarie per interpretare e convalidare efficacemente i risultati.

Il matrimonio tra l'analytics dei dati e l'elaborazione del linguaggio naturale (NLP) è forse il modo più efficace e intuitivo con cui l'augmented analytics amplia l'accesso agli insight basati sui dati. Gli utenti possono interrogare i dati usando un linguaggio semplice e chiaro: "quali prodotti hanno i tassi di ritorno più elevati nei 30 giorni successivi alle festività natalizie? " e ricevere risposte in un linguaggio altrettanto semplice.

Sul lato back-end, un LLM deve interpretare quella query in linguaggio naturale, tradurla in una richiesta strutturata e fare ipotesi per riempire le informazioni mancanti in base alla sua comprensione del contesto della domanda dell'utente. Per elaborare la richiesta, è necessario selezionare uno o più modelli. Il modello deve attingere alla fonte (o alle fonti) di dati più pertinenti alla questione. Infine, l'LLM deve interpretare i risultati matematici e articolarli in modo da centrare i dettagli rilevanti. 

Tuttavia, dal punto di vista dell'utente, sta semplicemente facendo una domanda e ricevendo una risposta.

Visualizzazione dei dati



Le migliori soluzioni di augmented analytics possono non solo offrire solide funzionalità di visualizzazione dei dati, ma anche incorporare le visualizzazioni dei dati nella produzione automatizzata di report per facilitare la condivisione delle informazioni e il processo decisionale collaborativo.

Mentre il linguaggio naturale è spesso un modo molto utile per articolare le informazioni, la visualizzazione è spesso il modo più intuitivo per fare confronti ed evidenziare modelli. Grafici, diagrammi, mappe di calore e altri tipi di visualizzazione dei dati possono essere un modo utile per esplorare i dati e creare collegamenti che non si penserebbe di incorporare esplicitamente in una query.

Storicamente, accettare una richiesta in linguaggio naturale come input e restituire una sofisticata visualizzazione dei dati come output richiederebbe la sofisticata coreografia di più modelli che operano in modo simile a una catena di montaggio. Ma la continua evoluzione degli LLM precedentemente contenenti solo testo in modelli AI multimodali in grado di funzionare senza problemi su diverse modalità di dati ha ulteriormente semplificato la versatilità delle piattaforme di augmented analytics.

Ciò consente un approccio dinamico all'analisi dei dati in cui anche gli utenti non tecnici possono esplorare apertamente connessioni e ipotesi, con risultati, raccomandazioni e insight degni di nota resi prontamente disponibili in dashboard interattive di facile utilizzo.

Insight automatizzati e analisi statistiche



Sebbene la PNL rubi attiri tutta l'attenzione, i recenti risultati del sondaggio Magic Quadrant di Gartner indicano che la funzionalità più richiesta per le piattaforme di analytics e business intelligence (ABI) non è una query in linguaggio naturale, ma gli insight automatizzati. In altre parole, gli utenti business sono più interessati ai risultati che al processo per ottenerli.1

Le migliori soluzioni di augmented analytics alleggeriscono l'onere di decidere esattamente come interrogare i dati per ottenere gli insight, liberando gli utenti business dalla necessità di concentrarsi su come agire in base a tali insight. Oltre alle funzionalità di NLP a livello superficiale, un LLM può fungere da motore decisionale in tempo reale, consentendo a una moderna piattaforma di augmented analytics di adattare l'analisi al contesto specifico della richiesta di un utente in un modo molto più dinamico di quanto sarebbe possibile con semplici regole IF-THEN. 

Ad esempio, il software di augmented analytics può dedurre dalla natura di una richiesta quale tipo di dati verrà esaminato e quale tipo di analisi si desidera ottenere, quindi suggerire in modo intelligente schemi di visualizzazione dei dati ottimali. Le soluzioni di augmented analytics possono anche eseguire analisi su più modelli di forecasting ed evidenziare le previsioni del modello offrendo la massima certezza. Le piattaforme possono quindi offrire insight nel processo di previsione, piuttosto che limitarsi a fornire previsioni.

Gli insight automatizzati consentono anche un'analisi proattiva dei dati, facendo emergere anomalie e tendenze man mano che si presentano invece di aspettare la query giusta per portarle alla luce. Ad esempio, gli strumenti di analytics automatizzata potrebbero identificare un calo inaspettato nelle metriche di coinvolgimento dei clienti, avvisando gli utenti business di alcune carenze dell'esperienza del cliente in modo che possano essere comprese e affrontate.

Analytics predittiva e analytics prescrittiva

Una piattaforma di analytics ottimale dovrebbe essere in grado di fornire diverse chiavi di lettura dell'analisi dei dati, comprendere il passato e prendere decisioni informate sul futuro. Esistono quattro sottoinsiemi chiave di insight analitici, tutti essenziali per il processo decisionale.

  • L'analytics descrittiva riguarda l'analisi oggettiva: cosa è successo o cosa sta succedendo? Ad esempio, nel contesto delle supply chain, l'analytics descrittiva potrebbe esplorare dove vengono spesi i soldi o dove sono presenti delle carenze di inventario.

  • L'analytics diagnostica mira a comprendere il passato, ovvero perché le cose sono accadute. Per esempio, l'analisi del comportamento dei clienti precedente potrebbe essere utilizzata per spiegare perché un'iniziativa di marketing in corso non è all'altezza delle aspettative.

  • L'analytics predittiva mira a prevedere il futuro: la probabilità che qualcosa accada o i risultati attesi per una potenziale linea d'azione. L'analytics predittiva rappresenta in genere il fondamento di un'operazione di business intelligence, che basa le decisioni su una comprensione più approfondita delle probabili conseguenze.

  • L'analytics prescrittiva mira a prevedere le azioni ottimali: cosa dovrebbe accadere o come massimizzare la probabilità di un risultato desiderato. La disciplina della modellazione prescrittiva potenzia sistemi come i motori di raccomandazione, che combinano l'analytics predittiva con una solida logica decisionale per identificare la via ideale da seguire.

Sfide e limiti dell'augmented analytics

Sebbene le piattaforme di augmented analytics offrano una vasta gamma di importanti benefici, non sono una panacea autonoma per tutti i mali aziendali. L'augmented analytics dovrebbe essere vista come uno strumento potente che produce i migliori risultati se utilizzata da dipendenti con un'adeguata alfabetizzazione dei dati e implementata insieme a solide pratiche di governance dei dati.

  • Conoscenza dei dati: sebbene l'augmented analytics riduca notevolmente il lavoro necessario per ricavare insight fruibili dai dati, tali insight sono utili solo se gestiti da dipendenti i cui reparti hanno dato priorità alla conoscenza dei dati. Ad esempio, una piattaforma potrebbe scoprire e far emergere una correlazione degna di nota, ma solo un utente informato può esercitare il giudizio necessario per districare la differenza tra correlazione e causalità.

  • Governance dei dati: la qualità degli insight e dei consigli basati sull'AI si basa direttamente sulla qualità e sull'affidabilità dei set di dati alla base di tale analisi. Per stabilire la fiducia a livello di organizzazione e la fiducia nell'analisi prescrittiva, le organizzazioni devono investire in una solida governance dei dati. Una solida governance dei dati consente una qualità costante dei dati, impone la conformità normativa, consolida in modo pulito le fonti di dati e monitora la deriva dei modelli e altre insidie del machine learning.

Soluzioni IBM correlate
  IBM watsonx BI Assistant

IBM watsonx BI Assistant risponde alle tue domande di business in pochi secondi, guidandoti verso le decisioni di maggior impatto. Scopri cosa è successo e perché, cosa potrebbe succedere e cosa fare per evitarlo. Con spiegazioni chiare e dettagliate della sua logica, watsonx BI Assistant fornisce a ogni utente business gli strumenti per prendere decisioni consapevoli.

Scopri IBM watsonx BI Assistant

IBM® Cognos Analytics

Sblocca tutto il potenziale dei tuoi dati con automazione e insight basati sull'AI. L'assistente AI che usa il linguaggio naturale è sempre disponibile: descrivi semplicemente i dati di cui hai bisogno e lascia che Cognos Analytics crei splendide visualizzazioni dei dati per te.

Esplora IBM Cognos Analytics

IBM Planning Analytics

Prevedi i risultati con previsioni flessibili e basate sull'AI. Analizza scenari what-if su larga scala e granulari in tempo reale. Implementa in base alle tue esigenze: on-premise o su cloud, compreso as a service su AWS. Automatizza e unifica l'integrated business planning in tutta l'organizzazione e trasforma le previsioni basate sull'AI in azioni.

Esplora IBM Planning Analytics
Fai il passo successivo

Crea una strategia di AI per la tua azienda su un'unica piattaforma di dati e AI collaborativa: IBM watsonx. Addestra, convalida, adatta e distribuisci modelli AI per scalare e accelerare l'impatto dell'AI con dati affidabili in tutta l'azienda.

Scopri watsonx Prenota una demo live
Note a piè di pagina

Nota: tutti i link sono esterni a IBM.com

1 "Predicts 2024: How Artificial Intelligence Will Impact Analytics Users," (link esterno a ibm.com) Gartner, 4 gennaio 2024.