A busca para criar máquinas pensantes semelhantes aos humanos — sistemas de IA que podem raciocinar, adaptar e enfrentar uma ampla gama de desafios — está dominando as manchetes e remodelando as agendas de tecnologia. Mas Ruchir Puri, cientista-chefe da IBM pesquisa, está buscando um tipo diferente de descoberta: uma IA que ganha sua manutenção sendo útil agora, não em uma data hipotética no futuro.
A ideia de uma máquina que pensa como uma pessoa faz parte da cultura tecnológica há mais de meio século. Nos últimos anos, passou das margens das conferências de ciência da computação para o centro das conversas públicas e políticas. A inteligência geral artificial (AGI) se tornou um termo abrangente para as promessas e os perigos da IA moderna.
“Sempre que atingimos um marco, tendemos a expandir ainda mais esse limite”, diz Puri, falando sobre IA em uma entrevista para o IBM Think . "Achávamos que o xadrez era a solução. Então pensamos que era linguagem. Agora é codificação ou raciocínio. Mas a inteligência geral permanece indefinida.”
A expressão "inteligência geral artificial" ganhou força pela primeira vez na década de 2000 como uma forma de distinguir entre sistemas de IA estreitos – aqueles projetados para executar muito bem uma tarefa – e o tipo de inteligência ampla e adaptável observada em humanos. Durante décadas, o objetivo permaneceu à margem, um tópico de pesquisa teórica e ficção científica mais do que a engenharia convencional.
Essa situação começou a mudar com o advento do deep learning na década de 2010 e o surgimento de modelos de base, ou redes neurais em larga escala treinadas em conjuntos de dados amplos. Esses modelos não pensavam em nenhum sentido significativo, mas podiam gerar textos convincentes, identificar padrões e realizar tarefas que antes pareciam estar fora do alcance das máquinas.
Os últimos anos aceleraram esses desenvolvimentos. GPT-4, Claude 3, Gemini e outros modelos agora podem passar em testes padronizados, escrever código, resumir trabalhos de pesquisa e até explicar piadas. Eles ainda são frágeis, muitas vezes erram respostas e não têm qualquer compreensão real. Mas elas confundem a fronteira entre a IA restrita e algo mais flexível — e para alguns pesquisadores, isso parece como uma AGI em estágio inicial. Outros alertam para o fato de que ainda é uma ilusão de competência e que o termo "AGI" continua sendo mais retórico do que técnico.
Em sua forma mais básica, a AGI se refere a uma máquina que pode executar qualquer tarefa intelectual que um ser humano possa – aprender, raciocinar, resolver problemas – com a mesma capacidade de adaptabilidade e generalização. Ao contrário dos sistemas de IA atuais, que são restritos e altamente especializados, a AGI operaria com flexibilidade em uma ampla gama de domínios, sem precisar ser explicitamente programada para cada um deles.
O ano passado registrou uma onda de modelos cada vez mais capazes que apenas alimentaram as expectativas. O CEO da OpenAI, Sam Altman,descreveu a AGI como iminente. Suas declarações públicas — e a direção estratégica da empresa — sugerem um compromisso inequívoco com a construção de máquinas que possam raciocinar com ampla competência. O Google DeepMind e a Anthropic seguiram o exemplo, lançando sistemas otimizados para raciocínio mais geral, memória e uso de ferramentas.
Investidores de alto perfil e laboratórios de pesquisa estão apoiando a visão da AGI, com alguns declarando que ela pode ser alcançada dentro de cinco a dez anos. Os debates políticos também se tornaram populares, à medida que legisladores e observadores levantam preocupações sobre como regulamentar uma tecnologia que, por definição, não tem precedente histórico. Para alguns, o futuro parece tentadoramente próximo; para outros, perigosamente precoce.
A resposta de Puri não é descartar completamente a ambição, mas reformular a pergunta: e se a fronteira real não for construir uma máquina que possa fazer tudo, mas uma que possa fazer bem algumas coisas essenciais?
Puri foi fundamental para a construção dos sistemas que alimentaram as plataformas IBM Watson e watsonx.ai, que estabeleceram benchmarks para o que as máquinas podem realizar. Hoje, ele acredita que o campo precisa de um novo princípio de organização — algo menos mítico e mais prático. Essa ideia, que Puri se refere como inteligência artificial útil (AUI), está começando a influenciar a forma como a IBM e outras instituições de pesquisa enquadram seus esforços.
"Gosto dessa perspectiva de 'vamos tornar a inteligência artificial útil', porque se a tornarmos útil, ninguém fará objeções", ele diz.
Ao contrário da AGI, que implica uma máquina que pode igualar ou exceder a inteligência humana em todos os domínios, a AUI tem um objetivo menor, mas com um retorno potencialmente mais imediato. Não se trata de criar algo que possa escrever sinfonias ou substituir filósofos. Trata-se de construir ferramentas que funcionem de forma confiável em contextos claramente definidos, como copilotos de código, verificadores de conformidade e otimizadores de fluxo de trabalho.
Puri falou comigo de seu escritório no Centro de Pesquisa Thomas J. Watson da IBM em Yorktown Heights, Nova York. O edifício - uma estrutura expansiva e modernista aninhada nas colinas arborizadas a cerca de uma hora ao norte de Manhattan - tem a gravidade silenciosa de um local onde desenvolvimentos científicos ocorrem fora de vista. Os visitantes passam por placas de identificação azuis gravadas com fórmulas matemáticas e quadros brancos marcados com equações sem resolução. Projetado pelo arquiteto modernista Eero Saarinen no início dos anos 1960, o laboratório abriga algumas das inovações mais famosas da IBM. Puri trabalha aqui há décadas.
Com seus longos corredores e vista para a floresta, é o tipo de lugar onde o pensamento de longo alcance parece não apenas possível, mas esperado um cenário adequado à maneira como Puri aborda seu trabalho. Como ele conta, sua mudança para a AUI não é uma mudança significativa, mas uma continuação das questões que ele vem buscando há anos. Há muito tempo ele se volta para sistemas que apresentam valor prático em escala, como ferramentas de IA para desenvolvimento de software, que ele descreve como "surpreendentemente útil", não apenas para especialistas, mas também para iniciantes aprendendo a programar. Esse tipo de ampla acessibilidade, argumenta ele, reflete a real promessa da IA.
E quando os modelos são incorporados em operações do mundo real, diz Puri, os riscos são altos. Nos setores bancário, de transporte e de saúde, por exemplo, pequenos erros podem se agravar rapidamente.
“Acho que o público entendeu errado por todas as demonstrações chamativas”, diz Puri. “ChatGPT, Midjourney, Sora — todos incríveis. Porém, no mundo empresarial, você não pode alucinar um número ou ler errado um regulamento. Tem que estar certo".
Essa preocupação levou a IBM a adotar um modelo híbrido. Em vez de depender apenas de sistemas probabilísticos, eles estão combinando modelos com ferramentas verificadas, como calculadoras, APIs de pesquisa e validadores de dados estruturados, para minimizar os riscos. Essas abordagens não prometem cognição semelhante à humana. Eles buscam a consistência. O objetivo é garantir que os sistemas de IA possam ser confiáveis em ambientes de alto risco, onde a precisão e a auditabilidade são mais importantes do que a criatividade ou o talento para conversação.
"Há casos de uso em que a criatividade é um ativo", diz ele, "e outros em que é um passivo".
Puri faz referência à experiência da IBM em desenvolvimento e automação de software como uma prova de conceito. "Tornou-se surpreendentemente útil", diz ele sobre a IA. "Desde desenvolvedores que acham útil em suas vidas cotidianas até estudantes que estão aprendendo a programar e fazer coisas, encontrando ajuda de agentes de codificação automatizados, ele se tornou útil não apenas para especialistas, mas para todas as pessoas em geral .”
Ele relembrou as dúvidas iniciais de alguns pesquisadores de que o desenvolvimento de software — muitas vezes vista como uma tarefa altamente criativa e complexa — seria difícil para as máquinas resolverem. "pensava-se que era uma tarefa muito, muito difícil", diz ele. Mas graças a LLMs como o ChatGPT e modelos especializados internos, essa suposição não se manteve. “Isso foi surpreendente, não apenas para mim, mas para muitas pessoas.”
A maior implicação, diz Puri, é que, como "toda empresa é uma empresa de software agora", a utilidade da IA na codificação pode se traduzir em uma ampla relevância em todos os setores.
Apesar de todo o ruído em torno da IA — sua promessa, suas armadilhas, sua mitologia — Puri diz que muitas vezes retorna a uma ideia mais tranquila: confiança. Não apenas no sentido ético, mas no mecânico. O sistema consegue fazer o que afirma fazer? Podemos confiar nele, mesmo quando ninguém está olhando?
Ele está se referindo à proliferação de modelos de código aberto como o Llama da Meta, os sistemas de mistura de especialistas (MoE) da Mistral, a linha Granite da própria IBM e a mudança mais ampla em direção à pesquisa transparente e colaborativa. Esses sistemas não foram criados para o show. Elas devem ser testadas, ajustadas e desafiadas. Elas permitem o escrutínio e convidam à modificação.
A IBM, por exemplo, está lançando seus modelos Granite não como mentes de uso geral. Em vez disso, os modelos são ferramentas desenvolvidas tendo em mente clientes corporativos e otimizadas para lidar com tarefas específicas em finanças, logística e outros domínios altamente estruturados. Puri enfatiza seu foco intencional e utilitário direcionado.
"Esses modelos não foram projetados para substituir os humanos", diz ele. “Eles foram projetados para ajudar as pessoas a fazer mais.”
Em vez de imitar a inteligência humana por completo, ele enfatiza que o verdadeiro teste é se a IA produz resultados que importam para as pessoas e instituições — de forma consistente, previsível e em grande escala.
Olhando para o futuro, Puri vê o futuro da IA como algo que será moldado menos por avanços descendentes e mais por progresso amplo e iterativo, impulsionado pela colaboração, experimentação e infraestrutura compartilhada.
Em especial, ele acredita que os avanços mais significativos não virão de laboratórios fechados ou demonstrações secretas, mas sim de comunidades que se desenvolvem abertamente. Como ele diz: "Este é um dos primeiros conjuntos de tecnologias em que a inovação está ocorrendo verdadeiramente de forma aberta."
