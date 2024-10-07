A tecnologia de IA por voz está evoluindo rapidamente, prometendo transformar as operações das empresas, desde o atendimento ao cliente até as comunicações internas.
Nas últimas semanas, a OpenAI lançou novas ferramentas para simplificar a criação de assistentes de voz de IA e expandiu seu Modo de Voz Advanced para mais clientes pagantes. A Microsoft atualizou seu Copilot IA com recursos de voz e funcionalidades de raciocínio aprimorados, enquanto o Meta introduziu IA de voz em seus aplicativos de mensagens.
De acordo com o Engenheiro Distinguido da IBM, Chris Hay, esses avanços "podem mudar a forma como as empresas conversam com os clientes".
Hay prevê uma mudança drástica na forma como empresas de todos os tamanhos se envolvem com seus clientes e gerenciam operações. Ele diz que a democratização das ferramentas de comunicação impulsionadas por IA pode criar oportunidades sem precedentes para pequenas empresas competirem com empresas maiores.
"Estamos entrando na era dos contact centers de IA", diz Hay. "Toda loja familiar pode ter o mesmo nível de atendimento ao cliente que uma empresa. Isso é incrível".
Hay diz que a chave é o desenvolvimento de APIs em tempo real que permitem comunicação de baixa latência entre humanos e IA. Isso permite o tipo de trocas que as pessoas esperam em uma conversa diária.
"Para ter uma conversa de fala em linguagem natural, a latência dos modelos precisa ser de cerca de 200 milissegundos", observa Hay. "Não quero esperar três segundos... Preciso obter uma resposta rapidamente."
Novas tecnologias de IA por voz estão se tornando acessíveis a desenvolvedores por meio de APIs oferecidas por empresas como a OpenAI. "Há uma API de desenvolvedor de produção em escala onde qualquer pessoa pode simplesmente chamar a API e construir essa funcionalidade para si mesmo, com conhecimento de modelo e conhecimento de desenvolvimento muito limitados", diz Hay.
As implicações podem ser abrangentes. Hay prevê uma "onda massiva de assistentes virtuais de áudio" surgindo nos próximos meses e anos, à medida que empresas de todos os tamanhos adotam a tecnologia. Isso pode levar a um atendimento ao cliente mais personalizado, ao surgimento de novos setores de comunicação de IA e a uma mudança nos empregos para o gerenciamento de IA.
Para os consumidores, em breve a experiência poderá ser indistinguível de falar com um agente humano. Hay aponta para demonstrações recentes de podcasts gerados por IA por meio do NotebookLM do Google como evidência de quão longe a tecnologia chegou.
"Se ninguém tivesse me dito que era IA, eu honestamente não teria acreditado", diz ele sobre uma dessas demonstrações. "As vozes são emocionais. Agora você está conversando com a IA em tempo real, e isso vai melhorar.”
As principais empresas de tecnologia estão correndo para aprimorar as personalidades e os recursos de seus assistentes de IA. A abordagem da Meta envolve a introdução de vozes de celebridades para seu assistente de IA em suas plataformas de mensagens. Os usuários podem escolher vozes geradas por IA baseadas em estrelas como Awkwafina e Judi Dench.
No entanto, junto com a promessa, surgem riscos potenciais. Hay reconhece que a tecnologia pode ser um benefício para golpistas e fraudadores se cair nas mãos erradas.
"Você verá uma nova geração de golpistas nos próximos seis meses com vozes autênticas que soam como aqueles apresentadores de podcast que você ouviu, com inflexão e emoção em sua voz", ele avisa. "Essencialmente, são modelos que estão lá para tirar dinheiro das pessoas." Isso pode tornar os indicadores de alerta tradicionais obsoletos, como sotaques incomuns ou vozes que soam robóticas. "Isso ficará oculto", diz Hay.
Ele compara a situação a um ponto da trama nos romances de Harry Potter, onde os personagens devem fazer perguntas pessoais para verificar a identidade de alguém. No mundo real, as pessoas podem precisar adotar táticas semelhantes.
"Como vou saber que estou conversando com meu banco", comenta Hay. “Como vou saber que estou falando com minha filha, que está pedindo dinheiro? Os humanos terão que se acostumar a fazer essas perguntas.”
Apesar dessas preocupações, Hay permanece otimista sobre o potencial da tecnologia. Ele destaca que a IA poderia melhorar significativamente a acessibilidade, permitindo que as pessoas interajam com empresas e Governo em sua língua nativa.
"Pense em coisas como aplicações de benefício, certo? E você recebe todos esses documentos confusos. Pense na capacidade de poder ligar para [seu provedor de benefícios] e ele estiver em seu idioma nativo e, em seguida, ser capaz de traduzir coisas — documentos realmente complexos — para um idioma mais simples que você tenha maior probabilidade de entender."
A tecnologia de voz com IA continua evoluindo, e Hay acredita que estamos apenas arranhando a superfície das possíveis aplicações. Ele vislumbra um futuro no qual os assistentes de IA serão perfeitamente integrados a dispositivos vestíveis, como os óculos de realidade aumentada Orion que a Meta apresentou recentemente.
"Quando essa API em tempo real está nos meus óculos, posso falar com ela em tempo real enquanto estou migrando", diz Hay. “Combinado com a AR, isso será revolucionário.” Embora reconheça os desafios éticos, incluindo um incidente recente no qual óculos inteligentes foram capazes de descobrir instantaneamente as identidades das pessoas, Hay permanece otimista sobre as possíveis clientes da tecnologia.
"A ética precisará ser trabalhada, e a ética é crítico", ele concede. "Mas estou otimista."
