La tecnologia di AI vocale è in rapida evoluzione e promette di trasformare le operazioni aziendali, dal servizio clienti alle comunicazioni interne.
Nelle ultime settimane, OpenAI ha lanciato nuovi strumenti per semplificare la creazione di assistenti vocali AI ed ha ampliato la sua Modalità vocale avanzata a un maggior numero di clienti paganti. Microsoft ha aggiornato la sua Copilot AI con funzionalità vocali migliorate e funzionalità di ragionamento, mentre Meta ha introdotto l'AI vocale nelle sue app di messaggistica.
Secondo Chris Hay, ingegnere illustre di IBM, questi progressi "potrebbero cambiare il modo in cui le aziende si rivolgono ai clienti".
Newsletter di settore
Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
Hay prevede un cambiamento radicale nel modo in cui le aziende di tutte le dimensioni si relazionano con i loro clienti e gestiscono le operazioni. A suo parere, la democratizzazione degli strumenti di comunicazione basati su AI potrebbe creare opportunità senza precedenti per le piccole imprese, che potrebbero competere con le aziende più grandi.
"Stiamo entrando nell'era dei contact center AI", afferma Hay. "Ogni negozio a conduzione familiare può avere lo stesso livello di servizio clienti di un'azienda. È incredibile."
Hay afferma che la chiave è lo sviluppo di API in tempo reale che permettano una comunicazione a bassa latenza tra umani e AI. Ciò consente il tipo di scambi interpersonali che le persone si aspettano nelle conversazioni quotidiane.
"Per avere una conversazione in linguaggio naturale, la latenza dei modelli deve essere di circa 200 millisecondi", osserva Hay. "Non voglio aspettare tre secondi... ho bisogno di una risposta in fretta."
La nuova tecnologia di AI vocale sta diventando accessibile agli sviluppatori attraverso le API offerte da aziende come OpenAI. "Esiste un'API per sviluppatori di produzione su larga scala in cui chiunque può semplicemente chiamare l'API e creare autonomamente una determinata funzionalità, con una conoscenza molto limitata dei modelli e dello sviluppo", afferma Hay.
Le implicazioni potrebbero essere di vasta portata. Hay prevede che nei prossimi mesi e anni emergerà una "grande ondata di assistenti virtuali audio", man mano che aziende di tutte le dimensioni adotteranno la tecnologia. Ciò potrebbe portare a un servizio clienti più personalizzato, all'emergere di nuovi settori della comunicazione basata sull'AI e a uno spostamento dei posti di lavoro verso la gestione dell'AI.
Per i consumatori, l'esperienza potrebbe presto diventare indistinguibile dal parlare con un agente umano. Hay indica le recenti dimostrazioni di podcast generati dall'AI attraverso NotebookLM di Google come prova di quanto sia avanzata la tecnologia.
"Se nessuno mi avesse detto che si trattava di AI, sinceramente non ci avrei creduto", afferma riferendosi a una di queste dimostrazioni. "Le voci sono emotive. Ora puoi conversare con l'AI in tempo reale e la situazione migliorerà ulteriormente."
Le principali aziende tecnologiche stanno gareggiando per migliorare la personalità e le funzionalità dei loro assistenti AI. L'approccio di Meta prevede l'introduzione di voci di celebrità per il suo assistente AI su tutte le sue piattaforme di messaggistica. Gli utenti possono scegliere voci generate dall'AI basate su star come Awkwafina e Judi Dench.
Tuttavia, insieme alle promesse arrivano anche potenziali rischi. Hay riconosce che la tecnologia potrebbe rivelarsi una manna per truffatori e imbroglioni se finisse nelle mani sbagliate.
"Entro i prossimi sei mesi vedremo una nuova generazione di truffatori con voci autentiche, simili a quelle dei conduttori di podcast che avete sentito, con inflessione ed emozione nella voce", avverte. "Modelli che servono essenzialmente a spremere soldi dalle persone." Questo potrebbe rendere obsolete le tradizionali bandiere rosse, come accenti insoliti o voci robotiche. "Questo resterà nascosto", dice Hay.
Paragona la situazione a un punto della trama dei romanzi di Harry Potter, in cui i personaggi devono porsi domande personali per verificare l'identità di qualcuno. Nel mondo reale, le persone potrebbero dover adottare tattiche simili.
"Come faccio a sapere che sto parlando con la mia banca?", riflette Hay. "Come faccio a sapere che sto parlando con mia figlia, che mi sta chiedendo soldi? Gli esseri umani dovranno abituarsi a potersi porre queste domande."
Nonostante queste preoccupazioni, Hay rimane ottimista sul potenziale tecnologico. Sottolinea che l'AI potrebbe migliorare in modo significativo l'accessibilità, consentendo alle persone di interagire con le aziende e il governo nella loro lingua madre.
"Pensa a cose come le domande di sussidio, ok? E ti ritrovi con tutti questi documenti confusi. Pensa alla possibilità di chiamare [il tuo fornitore di sussidi] nella tua lingua madre e poi di tradurre documenti molto complessi in un linguaggio più semplice che probabilmente capirai meglio".
La tecnologia vocale AI continua a evolversi e Hay ritiene che stiamo solo scalfendo la superficie delle potenziali applicazioni. Egli immagina un futuro in cui gli assistenti AI saranno perfettamente integrati nei dispositivi indossabili come gli occhiali per la realtà aumentata Orion che Meta ha presentato recentemente.
"Quando questa API in tempo reale sarà nei miei occhiali, potrò comunicare con essa in tempo reale mentre sono in movimento", afferma Hay. "Insieme alla realtà aumentata, questo cambierà le regole del gioco." Sebbene riconosca le sfide etiche, tra cui un recente incidente in cui degli occhiali intelligenti sono riusciti a scoprire istantaneamente l'identità delle persone, Hay rimane ottimista sulle prospettive della tecnologia.
"Bisognerà elaborare un approccio etico, e l'etica è fondamentale", ammette. "Ma sono ottimista."
IBM Granite è la nostra famiglia di modelli AI aperti, efficienti e affidabili, su misura per le aziende e ottimizzati per scalare le applicazioni di AI. Esplora le opzioni di linguaggio, codice, serie temporali e guardrail.
Scopri come l'elaborazione del linguaggio naturale può aiutarti a conversare in modo più naturale con i computer.
Abbiamo intervistato 2.000 organizzazioni in merito alle loro iniziative di AI per scoprire cosa funziona, cosa non funziona e come giocare d'anticipo.
Esplora il sito web di IBM Developer per accedere a blog, articoli, newsletter e per saperne di più sull'AI incorporabile di IBM.
Progetta facilmente assistenti e agenti di AI scalabili, automatizza le attività ripetitive e semplifica i processi complessi con IBM watsonx Orchestrate.
Accelera il valore aziendale dell'intelligenza artificiale con un portfolio potente e flessibile di librerie, servizi e applicazioni.
Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.
Progetta facilmente assistenti e agenti di AI scalabili, automatizza le attività ripetitive e semplifica i processi complessi con IBM watsonx Orchestrate.