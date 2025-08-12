A outra metade dos resultados do estudo é igualmente interessante: os desenvolvedores esperavam que a IA acelerasse seu trabalho em 24% antes de começarem. No entanto, mesmo depois de experimentarem a desaceleração de 19%, eles ainda acreditavam que a IA os havia acelerado em 20%.

Então, o que está por trás dessa lacuna de percepção? Entramos em contato com Nate Rush, do METR, um dos autores do estudo. “Essa é uma ótima pergunta, e uma que nosso trabalho não aborda completamente”, disse Rush ao IBM Think. "Idealmente, os trabalhos futuros explorarão ainda mais como as expectativas dos desenvolvedores sobre a utilidade da IA afetam a forma como eles usam as ferramentas [e] por que essa lacuna de percepção existe."

Além da questão da percepção, o estudo levanta uma série de questões importantes: será que a economia de tempo é a única maneira de medir a produtividade dos desenvolvedores? Como métricas como qualidade do código e impacto da equipe se encaixam no panorama geral?

"Nosso estudo fala apenas de economia de tempo, que é apenas uma medida de um aspecto da produtividade", disse Rush. “Não existe uma “métrica certa”, mas provavelmente uma coleção de métricas informativas sobre o impacto das ferramentas de IA.” Ele acrescentou que, embora este estudo tenha se concentrado no tempo, sua equipe descobriu que o framework SPACE de produtividade do desenvolvedor (SPACE é a abreviação de Satisfação, desempenho, Atividade, Comunicação e Eficiência) é útil para pensar em direções futuras.

Outra pergunta: as versões do modelo (nesse caso, Claude 3.5 e 3.7 Sonnet) poderiam afetar o tempo de desempenho? “Aqui está a realidade”, disse Hay. “Acho que as versões são importantes. O Claude 4 Sonnet é significativamente melhor. O Claude 4 Opus é significativamente melhor. Não estamos falando de um pouco de melhor. Estamos falando de uma melhora significativa.”

De acordo com Quentin Anthony, um dos 16 participantes do estudo, o elemento humano é outra consideração importante. “Gostamos de dizer que os LLMs são ferramentas, mas trate-os como uma varinha mágica”,escreveu ele no X. “Os LLMs são um grande botão atalho da dopamina que pode solucionar seu problema de uma vez. Você continua pressionando o botão que tem 1% de chance de resolver tudo? É muito mais agradável do que a alternativa cansativa, pelo menos para mim." (Anthony acrescentou que as distrações nas redes sociais são outra maneira fácil de causar atrasos.)

Então, à medida que os assistentes de codificação de IA evoluem e melhoram, onde eles terão o impacto mais sustentável de longo prazo no desenvolvimento de software? "Quando eles se tornarem estáveis, confiáveis e úteis, eu acho que os assistentes de código ficarão melhor na camada de QA — testes, garantia de qualidade, acessibilidade", disse Hagerty. “Coisas restritas e baseadas em regras são a melhor aplicação dessas ferramentas.”

Isso porque, segundo ele, escrever código é fundamentalmente diferente de verificá-lo. "Programação em si é uma atividade criativa. Está construindo algo do nada em um ecossistema único. Os assistentes de IA não percebem essa nuance. Mas eles provavelmente podem testar usando um sistema de regras mais gerais e universais."