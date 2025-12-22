En 2026, es posible que los modelos de IA más inteligentes no sean los más grandes.

Esa es la apuesta que ahora están haciendo los laboratorios, los inversionistas y los investigadores que pasaron el último año viendo cómo se derrumbaban sus suposiciones. Los próximos 12 meses no se definirán por la carrera por construir sistemas más grandes, sino por la lucha por desarrollar otros más inteligentes, modelos que piensan antes de hablar, que hagan más con menos.

“Se puede lograr que un modelo de lenguaje pequeño funcione al mismo nivel, o incluso mejor, que modelos mucho más grandes”, dijo Kush Varshney, IBM Fellow, a IBM Think en una entrevista.

Hace un año, eso habría sonado a herejía. Durante una década, la IA había funcionado según un catecismo categóricamente simple: más datos, más parámetros, más potencia de cálculo, más inteligencia. Los laboratorios competían por anunciar el número de parámetros como los culturistas que se muestran frente a un espejo. Las carreras de entrenamiento consumían los resultados eléctricos de las ciudades pequeñas. Toda la empresa tenía la sensación de una fiebre por la tierra, excepto que el territorio reclamado se medía en teraflops.

Luego llegó enero de 2025. Una empresa llamada DeepSeek, con sede en China, lanzó un modelo que hizo que las acciones de Nvidia cayeran un 17 % en un solo día. La inteligencia algorítmica podría sustituir a la fuerza computacional bruta. No se necesitaba una catedral. Se necesitaba un proyecto técnico mejor.

Los principales laboratorios estadounidenses reaccionaron rápidamente. En cuestión de meses, pasaron de construir sistemas cada vez más grandes a construir sistemas que se detengan y razonen antes de responder. Seyed Emadi, profesor asociado de operaciones en la University of North Carolina Kenan-Flagler, lo expresó sin rodeos cuando habló con IBM Think: “Si tuviera que resumir 2025 en IA, dejamos de hacer modelos más grandes y comenzamos a hacerlos más sabios”.

Ese giro ahora da forma a lo que viene a continuación. El consenso entre los investigadores es sorprendente, casi inquietante. Cuando se le pidió que identificara el desarrollo más significativo del año pasado, Misha Belkin, profesora de machine learning en UC San Diego, señaló “el auge de los modelos de pensamiento y la escala del tiempo de inferencia”, y en una entrevista lo calificó como la base para 2026. Rada Mihalcea, quien dirige el laboratorio de IA de la University of Michigan, ofreció una visión complementaria: “los avances en los sistemas multiagente, así como una comprensión más profunda de las debilidades” definirían el camino a seguir, dijo a IBM Think.

El cambio representa un replanteamiento de lo que significa la inteligencia en el silicio. El enfoque anterior lo trataba como algo que se incorporaba durante el entrenamiento, como el condimento en un guiso. Una vez terminado, el modelo se congeló. El nuevo enfoque trata la inteligencia como algo que puede surgir en el tiempo de ejecución al dar al modelo más tiempo para razonar, lo que se denomina cálculo del tiempo de inferencia.

Las implicaciones aún se están resolviendo. Gabriel Poesia, investigador que estudia razonamiento de IA en la Stanford University, ha observado que los modelos mejoran en “pensar durante períodos más largos y usar herramientas perfectamente durante largos períodos de pensamiento”. La versión en inglés simple: las máquinas aprendieron a pensar antes de hablar.

Los modelos anteriores funcionaban como reflejos: entrada dentro, predicción fuera, sin pausa para pensar. Los nuevos deliberan. Haga una pregunta difícil y el modelo se quedará pensándolo, a veces durante minutos, comprobando su lógica y retrocediendo desde los callejones sin salida. Se parece notablemente al pensamiento. Si es pensamiento, en cualquier sentido significativo, sigue siendo una de las grandes preguntas sin respuesta.