A ideia da inteligência artificial geral (AGI), uma IA que pode pensar, raciocinar e aprender uma ampla gama de tarefas, da mesma forma que um ser humano, tem sido um tema controverso há muito tempo. Alguns especialistas argumentam que a AGI está distante, enquanto outros acreditam que talvez nunca seja possível. Em uma outra corrente de pensamento, alguns especialistas afirmam que a AGI não é o objetivo certo a ser priorizado. “Não devemos esquecer o poder desses modelos em outros domínios que não são a linguagem”, disse Marina Danilevsky, Senior Research Scientist da IBM, em um episódio do podcast Mixture of Experts. “Se ampliarmos de fato as áreas em que essa tecnologia pode ser usada, podemos ir a lugares muito mais interessantes, muito mais pragmáticos, muito mais práticos, [em vez de] perseguir a AGI.”

Sutton adota uma postura ponderada. Ele estima que haja uma a cada quatro chances de a IA atingir o nível de inteligência humana em cinco anos e 50% de chance em 15 anos. Essa é uma previsão bastante otimista em comparação com muitos de seus colegas, que muitas vezes preveem que a AGI ainda está a várias décadas de distância.

“Ainda são necessários avanços”, reconheceu. “Mas estamos chegando mais perto. A principal lacuna está em como fazer com que os sistemas de IA aprendam com a experiência de uma forma mais natural, em vez de receberem um conjunto de dados rotulados e prontos para uso.”

Como Sutton descreve, um dos maiores desafios é ensinar a IA a entender o planejamento e a abstração a longo prazo – a capacidade de dividir problemas complexos em partes menores e gerenciáveis, como os humanos fazem.

"Se eu disser para você atravessar a rua, você não pensa em cada pequeno movimento muscular. Você pensa no objetivo: atravessar a rua. A IA precisa aprender assim, em um nível mais alto de abstração", explicou Sutton.

Uma de suas principais contribuições para o aprendizado por reforço é o conceito de abstração temporal, que permite à IA aprender em etapas, em vez de ficar presa em microgerenciamento. Isso pode ser crítico para sistemas de IA que precisam raciocinar em horizontes a longo prazo, algo que os modelos atuais enfrentam dificuldades.

Por exemplo, um assistente de IA pode ser capaz de gerar uma resposta adequada para uma única pergunta, mas ter dificuldades em manter uma conversa lógica ao longo de múltiplas interações ou em planejar uma tarefa complexa que se desenrola ao longo do tempo, como fazer reservas de férias que envolvem a coordenação de voos, hotéis e atividades. Sutton acredita que o aprendizado por reforço e melhores algoritmos de raciocínio de longo prazo serão fundamentais para superar essa limitação.