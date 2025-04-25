Benchmarks, custos de inferência, inovação: como a IA está remodelando nossa sociedade? Este ano, o2025 AI Index Report de Stanford adicionou novas áreas de cobertura para refletir o crescente papel da IA em todas as facetas de nossas vidas.
A IBM Think desempacotou algumas tendências importantes no relatório com Vanessa Parli, Diretora de Pesquisa do Institute for Human-Centered Artificial Intelligence de Stanford, e Ash Minhas, Content Manager Técnico da IBM.
Um tema quente, se é que já existiu, benchmarks, se tornou um debate central agora que os recursos de IA estão avançando tão rápido que estão consistentemente superando as ferramentas usadas para medi-los.
"Todos os anos, analisamos o desempenho desses algoritmos em benchmarks, e todos os anos parece que eles estão superando esses benchmarks", diz Vanessa Parli, uma das autoras do relatório, em entrevista à IBM Think. "Da mesma forma, este ano, isso está acontecendo mesmo com os benchmarks mais recentes."
O relatório observou que, em 2023, os pesquisadores introduziram novos benchmarks —MMMU, GPQA e SWE-bench— para testar os limites de sistemas avançados de IA. Apenas um ano depois, o desempenho aumentou drasticamente: as pontuações aumentaram 18,8, 48,9 e 67,3 pontos percentuais no MMMU, GPQA e SWE-bench, respectivamente, de acordo com o relatório.
Isso aumenta a ambiguidade na comunidade de pesquisa sobre o verdadeiro significado — e valor — de um benchmark de LLM. Parli apresenta questões críticas para consideração: "Estamos medindo a coisa certa? Esses benchmarks estão comprometidos? E como a comunidade científica deve avaliar os modelos?"
Pensando no futuro, Ash Minhas também questiona como será o futuro do benchmarking. “Onde isso vai parar?” ele pergunta em uma entrevista à IBM Think. “O Teste de Turing terá que ser constantemente uma meta em movimento? O último exame da humanidade é realmente o último exame?”
Enquanto isso, especialistas alertam para o risco de overfitting, fenômeno no qual um modelo de IA aprende a ter um desempenho excepcionalmente bom em testes de benchmark específicos, mas pode não conseguir generalizar para dados novos e não vistos em aplicações do mundo real. "Estamos apenas treinando o modelo para passar no benchmark?" ele acrescenta. "O MMMU é um bom benchmark, mas será que é porque o modelo sabe como responder ao benchmark?"
Minhas também alerta que o entusiasmo e o ímpeto do progresso podem estar tendo prioridade em relação a preocupações com ética, imparcialidade e viés.
Com os Prêmios Nobel de Física e Química do ano passado sendo concedidos a pesquisadores que trabalham com redes neurais e projeto e previsão de proteínas, é difícil ignorar a importância do papel crescente da IA no campo da saúde. O relatório observa que o número de dispositivos médicos aprovados pela FDA e habilitados para IA cresceu exponencialmente: em 2023, 223 foram aprovados, em comparação com apenas seis em 2015.
"Essa área da IA que aprimora a descoberta científica pode ter muito impacto em nossa sociedade", diz Parli.
De acordo com Minhas, esse crescimento mostra o ritmo acelerado da inovação, mas também levanta questões: "Temos os especialistas certos e as habilidades certas para poder testar esses novos dispositivos e produtos?"
A IA tem sido uma força fundamental por trás de grandes investimentos em 2024. O número de startups de IA generativa recém-financiadas quase triplicou e, após anos de adoção lenta, a adoção pelas empresas acelerou significativamente em 2024, segundo o relatório.
A IA migrou das margens para se tornar a motivação central do valor dos negócios. O investimento corporativo total em IA atingiu US$ 252,3 bilhões em 2024, com o investimento privado aumentando 44,5% e as fusões e aquisições aumentando 12,1% em relação ao ano anterior. Isso se presta a um ecossistema de startups florescente nos EUA, onde o investimento privado em IA atingiu US$ 109,1 bilhões em 2024.
No trabalho, a IA também é um ator importante, e muitos preveem o impacto da IA agêntica nos fluxos de trabalho corporativos
No entanto, as empresas se movem em um ritmo diferente da inovação. "A tecnologia está avançando, mas as pessoas e os processos levam tempo para mudar", diz Minhas.
O impacto da IA no ROI ainda é discutível, ele sugere. "Ainda não há uma boa compreensão do benefício econômico", diz Minhas. "Ninguém concorda sobre o que é o ROI e ninguém realmente sabe."
O relatório destacou que países ao redor do mundo também estão aumentando seus investimentos em infraestrutura e, claro, o lançamento de modelos poderosos da China mostra que os avanços dos EUA não devem ser dados como certos.
"Acho que não podemos dar como certo que os EUA sempre estarão no topo dessas paradas, e precisamos Continuar pensando nesses componentes da IA: computação, talentos, dados", diz Parli. "Devemos continuar a investir se quisermos manter a liderança em inovação que tivemos no passado e garantir que temos os ingredientes certos para fazer isso acontecer."
Ainda assim, o relatório destaca outra tendência interessante, embora não contraditória: países com o maior investimento em IA, como os EUA, estão expressando mais ceticismo em produtos e serviços de IA do que países com um orçamento de tecnologia de IA mais limitado.
De acordo com os números compartilhados no relatório, 80% das pessoas entrevistadas na Indonésia acreditam que os produtos de IA são mais benéficos do que prejudiciais, em comparação com apenas 39% nos EUA.
"Em muitos países, a IA permite o acesso a certos recursos, [como] saúde, por exemplo, e acho que provavelmente seremos mais otimistas em relação à IA e às diferenças culturais", explica Parli. "Também existem diferenças culturais em torno de questões como privacidade, segurança e privacidade de dados."
Finalmente, a IA estará mais presente no espaço físico.
O relatório descobriu que, de 2013 a 2023, o número de robôs industriais instalados globalmente aproximadamente triplicou, com 541.000 instalados em 2023.
"Com algumas das ferramentas de IA, onde você pode falar com o robô em linguagem natural, você pode usar movimento", diz Parli. "Você pode trabalhar muito mais de perto com os robôs, [e] será mais fácil colaborar com eles. Vejo a saúde como uma área em que a robótica irá além."
