A conferência de Tecnologia de GPU (GTC) da NVIDIA é um dos eventos de tecnologia mais esperados do ano. E o "Super Bowl da IA" deste ano, como é frequentemente apelidado pela mídia, não foi exceção: durante uma semana que começou com a apresentação de duas horas do CEO da NVIDIA, Jensen Huang, a gigante dos chips revelou várias inovações importantes para acompanhar nos próximos meses.
Desde modelos de base de open código aberto até parcerias com Microsoft, GM e IBM, todas as evidências apontam para um tema comum: a NVIDIA já não é apenas uma fabricante de chips. “De uma empresa de hardware, agora ela [também] quer tornar-se uma empresa de software de IA generativa”, afirma o Distinguished Engineer da IBM, Kunal Sawarkar, em uma entrevista ao IBM Think. “A NVIDIA está a entrar em áreas onde os intervenientes tradicionalmente não a viam como concorrência.”
De acordo com o Huang, o setor de IA está em um ponto de inflexão de computação de US$ 1 trilhão com o aumento do raciocínio e da IA agêntica impulsionando a demanda de computação de IA.
Estes são alguns desenvolvimentos que os especialistas da IBM dizem que estarão de olho nos próximos meses.
Dois robôs — um droide adorável e outro humanoide em tamanho real, ligeiramente inquietante — roubaram a cena na palestra de Huang. Mas a história real estava nas inovações que dão vida a esses robôs, segundo Kaoutar El Maghraoui, Principal Research Scientist da IBM, e Nathalie Baracaldo, Master Inventor da IBM, em um episódio recente de Mixture of Experts.
No topo dessas inovações estão: o GR00T N1, o primeiro modelo de base de open código aberto projetado especificamente para robótica, e o Isaac GR00T Blueprint, um framework que torna dramaticamente mais fácil gerar dados sintéticos de movimento para a formação de robôs antes de soltá-los no mundo real.
Embora a hype em torno da robótica não seja novidade, abrir o código dessas novas tecnologias tem o potencial de “democratizar a IA [na robótica]”, afirma El Maghraoui — acelerando de forma significativa o desenvolvimento de robôs humanoides.
A inovação da robótica era há muito tempo prejudicada pela falta dos dados necessários para as simulações. Mas o IBMM GR00T Blueprint "nos permite basicamente criar um ambiente enorme onde podemos testar [esses robôs] e tornar todo o ciclo de desenvolvimento muito mais rápido e seguro", diz Baracaldo.
Surge então a terceira nova ferramenta de IA da NVIDIA para criar simulações em tempo real de robôs: o motor físico Newton, desenvolvido em parceria com o Google DeepMind e a Disney Research. Ao “alinhar os colaboradores certos, a [NVIDIA] está tornando muito difícil para outros alcançarem esse nível”, afirma El Maghraoui.
Por fim, ao considerar o menor computador de IA do mundo — o novo DGX Spark da NVIDIA, também apresentado na GTC — cientistas de dados e entusiastas podem agora usar o GR00T N1 e o Isaac GR00T Blueprint “para ajustar e implementar esses sistemas robóticos” diretamente de casa, diz El Maghraoui.
A gigante dos chips também está lançando uma nova família de modelos de raciocínio projetados para fornecer uma base sólida para a IA agêntica nos negócios. Desenvolvido com base nos modelos Llama, os modelos Llama Nemotron vêm com recursos de raciocínio que permitem a criação de agentes de IA avançados customizados para as necessidades das empresas. Os modelos estão disponíveis em diferentes tamanhos e podem ser otimizados para várias aplicações de negócios.
"Os modelos de raciocínio aberto, software e ferramentas da NVIDIA oferecem aos desenvolvedores e empresas em qualquer lugar os blocos de construção para criar uma força de trabalho de IA agêntica acelerada", disse Huang.
"Esses modelos de raciocínio, juntamente com a stack de infraestrutura, vão gerar interesse nas próximas semanas ou meses, porque a IA agêntica é onde todos estarão focados em 2025”, afirma Sawarkar ao Think.
Com o DeepSeek causando impacto no início deste ano, prometendo modelos de raciocínio baratos e de código aberto, a NVIDIA está apostando por conta própria. Seus modelos estão superando o raciocínio padrão e os benchmarks, de acordo com a empresa. E para fortalecer ainda mais seu lugar na tabela de classificação, a NVIDIA já está trabalhando com os principais players de tecnologia — Microsoft, Accenture, Box e SAP — para integrar esses modelos a aplicações do mundo real.
O armazenamento para IA não é algo chamativo, mas desempenha um papel cada vez mais crítico na aceleração do processamento de dados e dos modelos de IA. O IBM Storage Scale é um armazenamento orientado por software que permite que organizações gerenciem melhor dados não estruturados em ambientes de armazenamento distribuído, como nuvem, data center e até a borda.
"Muitos dados corporativos são não estruturados — trancados dentro de e-mails, PDFs, apresentações, arquivos de áudio e vídeo, e outros formatos opacos — [e] são difíceis de interpretar", diz Vincent Hsu, vice-presidente e CTO da IBM Storage.
"Gerenciar o crescimento exponencial dos dados tem sido um desafio consistente e apenas 1% dos dados corporativos são encontrados em LLMs atualmente", diz Ric Lewis, vice-presidente sênior de infraestrutura da IBM, em entrevista ao Think. "O armazenamento baseado no conteúdo ajuda a trazer mais dados corporativos para os modelos de IA existentes de uma maneira que ainda é controlada e protegida contra cópias deles. Isso pode ajudar a tornar os modelos mais significativos para uma organização e liberar novos insights de dados que podem diferenciá-los. Esses novos recursos são baseados no trabalho realizado na IBM pesquisa e na NVIDIA."
Hsu vê muitos casos de uso para o CAS, como ajudar a garantir que os assistentes de IA tenham as informações contextuais mais recentes, o que pode ajudar a melhorar a precisão e lidar com alucinações. Por fim, com o Storage Scale baseado no conteúdo da IBM combinado com a nova Plataforma de Dados de IA para infraestrutura de IA corporativa, as empresas conseguem extrair mais valor de seus dados corporativos não estruturados, um exemplo de várias parcerias NVIDIA-IBM anunciadas em uma semana movimentada.
