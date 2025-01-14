Um supercomputador que cabe embaixo de uma mesa pode mudar a forma como as empresas lidam com a inteligência artificial.
Na CES 2025 da semana passada, a NVIDIA anunciou o Projeto DIGITS, um supercomputador de IA pessoal com a funcionalidade do novo GB10 Grace Blackwell Superchip da empresa. O sistema, que custa a partir de USD 3.000 e será lançado em maio, consegue executar modelos de IA com até 200 bilhões de parâmetros e oferece um petaflop de desempenho computacional de IA.
"A IA será popular em todas as aplicações e em todos os setores", disse Jensen Huang, fundador e CEO da NVIDIA, em um comunicado de imprensa.. "Com o Projeto DIGITS, o Superchip Grace Blackwell chega a milhões de desenvolvedores". "Colocar um supercomputador com IA nas mesas de cada cientista de dados, pesquisador de IA e estudante os capacita a se envolver e moldar a era da IA."
O dispositivo de desktop vem com 128 GB de memória unificada e até 4 TB de armazenamento, voltado para empresas que precisam de processamento de dados instantâneo sem atrasos na nuvem. Dois sistemas podem ser interligados para lidar com modelos de até 405 bilhões de parâmetros.
"Pense em aplicações industriais, onde, no chão de fábrica, você quer que o poder computacional esteja bem próximo de onde a produção está acontecendo", disse Shobhit Varshney da IBM, vice-presidente da IBM Consulting, em um episódio recente do podcast Mixture of Experts. "Existe muita latência entre chamar um servidor ou uma API na nuvem e receber as respostas."
As operações sensíveis em termos de segurança estão impulsionando a demanda por recursos de processamento locais. Varshney descreveu vários cenários em que isso é essencial. "Você quer ter certeza de que os dados, especialmente se estiverem relacionados a algo sensível, não saiam de suas instalações", disse ele. "O mesmo vale para as aplicações defensivas, onde você está fazendo algo mais tático em campo." Você quer ser capaz de processar todas as imagens provenientes de todos os drones naquele local específico, porque você pode estar em um território onde nem sequer possui conexão com um servidor."
O sistema Project DIGITS é executado no NVIDIA DGX OS, baseado em Linux, e permite que os usuários desenvolvam localmente e depois implementem na nuvem ou em uma infraestrutura de data center. As instalações de fabricação podem implementar “monitoramento em tempo real, manutenção preditiva e otimização de processos alimentados por edge computing", diz Ashok Reddy, CEO da empresa de software KX. As empresas financeiras obtêm ferramentas para "negociação em tempo real, gestão de riscos e insights preditivos a uma velocidade sem precedentes." Enquanto isso, as organizações de saúde poderiam aproveitar a tecnologia para "diagnóstico acelerado, desenvolvimento de imagens e desenvolvimento de medicamentos por meio de análises de dados avançadas de IA", diz Reddy. O sistema processa "grandes volumes de dados estruturados e não estruturados instantaneamente" para "tomada de decisão em tempo real e análise de dados de baixa latência".
O professor de engenharia da Universidade da Pensilvânia Benjamin Lee disse que vê o supercomputador da NVIDIA como parte de uma mudança mais ampla em direção à IA agêntica, onde os sistemas gerenciam trabalhos inteiros em vez de tarefas individuais.
"Uma IA inteligente irá então elaborar estratégias e determinar o conjunto de tarefas necessárias para concluir esse trabalho", diz Lee, acrescentando que essa abordagem "poderia melhorar significativamente a produtividade, permitindo que os humanos solicitem grandes trabalhos a um agente em vez de solicitar tarefas individuais a um modelo".
Varshney observa que a NVIDIA colocou em código aberto a tecnologia obtida com a recente aquisição da Run AI por USD 700 milhões.. "Eles estão tentando garantir que todos os setores migrem para essa era de IA física, IA agêntica e direção autônoma", diz Varshney. "Eles querem ser a espinha dorsal de cada um deles."
Os cortes de preços se propagaram por toda a linha de produtos. "No ano passado, a série 40 dos chips deles custava USD 1.600", diz Varshney. "Eles acabaram de lançar um computador equivalente por US$ 550."
As reduções de preços sugerem avanços técnicos. "O design da GPU está amplamente definido e não está sendo agressivamente otimizado para desempenho, energia e custo", diz Lee. É possível, no entanto, que a NVIDIA tenha atingido esse ponto "muito antes de outros fabricantes de chips, o que lhe permite competir tanto em desempenho quanto em custo", diz Lee.
"Os modelos poderiam ser especializados para tarefas específicas, calculando a mesma resposta com muito menos cálculos e muito menos energia", diz Lee. "Os agentes poderiam então aprender a selecionar o modelo especializado correto para cada tarefa, algo que um humano teria dificuldade em fazer."
Essa tendência em direção à computação especializada representa uma mudança drástica em relação às limitações atuais. "Ficamos limitados a alguns modelos pequenos e bonitinhos executados em dispositivos móveis", diz Varshney. "Eles querem tornar a computação tão acessível e democratizada quanto conectar-se à eletricidade, mas querem ser a superpotência elétrica do mundo inteiro."
