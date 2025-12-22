En 2026, es posible que los modelos de IA más inteligentes no sean los más grandes.

Esa es la apuesta que están haciendo ahora los laboratorios, los inversores y los investigadores que pasaron el último año viendo cómo se derrumbaban sus suposiciones. Los próximos 12 meses no estarán definidos por la carrera por construir sistemas más grandes, sino por la lucha por desarrollar otros más inteligentes, modelos que piensen antes de hablar, que hagan más con menos.

“Se puede lograr que un modelo de lenguaje pequeño funcione al mismo nivel, o incluso mejor, que modelos mucho más grandes”, dijo Kush Varshney, miembro de IBM, a IBM Think en una entrevista.

Hace un año, eso habría sonado a herejía. Durante una década, la IA había funcionado según un catecismo brutalmente simple: más datos, más parámetros, más potencia de cálculo, más inteligencia. Los laboratorios competían para anunciar el recuento de parámetros como culturistas flexionándose en un espejo. Los entrenamientos consumían la producción eléctrica de las ciudades pequeñas. Toda la empresa tenía la sensación de una carrera por la tierra, excepto que el territorio que se reclamaba se medía en teraflops.

Luego llegó enero de 2025. Una empresa llamada DeepSeek, con sede en China, lanzó un modelo que hizo caer las acciones de Nvidia un 17 % en un solo día. La inteligencia algorítmica podría sustituir a la fuerza computacional bruta. No hacía falta una catedral. Necesitaba un mejor plan.

Los principales laboratorios estadounidenses dieron un giro rápido. En cuestión de meses, pasaron de crear sistemas cada vez más grandes a crear sistemas que se detengan y razonen antes de responder. Seyed Emadi, profesor asociado de operaciones en la Universidad de Carolina del Norte Kenan-Flagler, lo expresó sin rodeos cuando habló con IBM Think: “Si tuviera que resumir 2025 en IA, dejamos de hacer modelos más grandes y empezamos a hacerlos más inteligentes”.

Ese cambio ahora determina lo que viene después. El consenso entre los investigadores es sorprendente, casi inquietante. Cuando se le pidió que identificara el desarrollo más significativo del año pasado, Misha Belkin, un profesor de machine learning en UC San Diego, señaló “el auge de los modelos de pensamiento y la escala de tiempo de inferencia”, y en una entrevista lo llamó la base para 2026. Rada Mihalcea, quien dirige el laboratorio de IA en la Universidad de Michigan, ofreció una visión complementaria: “los avances en los sistemas multiagente, así como una comprensión más profunda de... las debilidades” definirían el camino a seguir, le dijo a IBM Think.

El cambio representa un replanteamiento de lo que significa la inteligencia en el Silicon. El antiguo enfoque lo trataba como algo que se horneaba durante el entrenamiento, como el condimento en un guiso. Una vez completado, el modelo se congeló. El nuevo enfoque trata la inteligencia como algo que puede surgir en tiempo de ejecución, dando al modelo más tiempo para razonar, lo que se denomina cálculo del tiempo de inferencia.

Las implicaciones aún se están resolviendo. Gabriel Poesia, investigador que estudia el razonamiento de IA en la Universidad de Stanford, ha observado que los modelos mejoran en “pensar durante períodos de tiempo más largos” y “utilizar herramientas de manera fluida durante largos períodos de pensamiento”. En pocas palabras: las máquinas aprendieron a pensar antes de hablar.

Los modelos antiguos funcionaban como reflejos: entrada, predicción fuera, sin pausa para pensar. Los nuevos deliberan. Haga una pregunta difícil y el modelo se quedará pensándolo, a veces durante minutos, comprobando su lógica y retrocediendo desde los callejones sin salida. Se parece bastante al pensamiento. Si se trata de pensar, en un sentido significativo, sigue siendo una de las grandes preguntas sin respuesta.