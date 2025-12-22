En 2026, es posible que los modelos de IA más inteligentes no sean los más grandes.
Esa es la apuesta que ahora están haciendo los laboratorios, los inversionistas y los investigadores que pasaron el último año viendo cómo se derrumbaban sus suposiciones. Los próximos 12 meses no se definirán por la carrera por construir sistemas más grandes, sino por la lucha por desarrollar otros más inteligentes, modelos que piensan antes de hablar, que hagan más con menos.
“Se puede lograr que un modelo de lenguaje pequeño funcione al mismo nivel, o incluso mejor, que modelos mucho más grandes”, dijo Kush Varshney, IBM Fellow, a IBM Think en una entrevista.
Hace un año, eso habría sonado a herejía. Durante una década, la IA había funcionado según un catecismo categóricamente simple: más datos, más parámetros, más potencia de cálculo, más inteligencia. Los laboratorios competían por anunciar el número de parámetros como los culturistas que se muestran frente a un espejo. Las carreras de entrenamiento consumían los resultados eléctricos de las ciudades pequeñas. Toda la empresa tenía la sensación de una fiebre por la tierra, excepto que el territorio reclamado se medía en teraflops.
Luego llegó enero de 2025. Una empresa llamada DeepSeek, con sede en China, lanzó un modelo que hizo que las acciones de Nvidia cayeran un 17 % en un solo día. La inteligencia algorítmica podría sustituir a la fuerza computacional bruta. No se necesitaba una catedral. Se necesitaba un proyecto técnico mejor.
Los principales laboratorios estadounidenses reaccionaron rápidamente. En cuestión de meses, pasaron de construir sistemas cada vez más grandes a construir sistemas que se detengan y razonen antes de responder. Seyed Emadi, profesor asociado de operaciones en la University of North Carolina Kenan-Flagler, lo expresó sin rodeos cuando habló con IBM Think: “Si tuviera que resumir 2025 en IA, dejamos de hacer modelos más grandes y comenzamos a hacerlos más sabios”.
Ese giro ahora da forma a lo que viene a continuación. El consenso entre los investigadores es sorprendente, casi inquietante. Cuando se le pidió que identificara el desarrollo más significativo del año pasado, Misha Belkin, profesora de machine learning en UC San Diego, señaló “el auge de los modelos de pensamiento y la escala del tiempo de inferencia”, y en una entrevista lo calificó como la base para 2026. Rada Mihalcea, quien dirige el laboratorio de IA de la University of Michigan, ofreció una visión complementaria: “los avances en los sistemas multiagente, así como una comprensión más profunda de las debilidades” definirían el camino a seguir, dijo a IBM Think.
El cambio representa un replanteamiento de lo que significa la inteligencia en el silicio. El enfoque anterior lo trataba como algo que se incorporaba durante el entrenamiento, como el condimento en un guiso. Una vez terminado, el modelo se congeló. El nuevo enfoque trata la inteligencia como algo que puede surgir en el tiempo de ejecución al dar al modelo más tiempo para razonar, lo que se denomina cálculo del tiempo de inferencia.
Las implicaciones aún se están resolviendo. Gabriel Poesia, investigador que estudia razonamiento de IA en la Stanford University, ha observado que los modelos mejoran en “pensar durante períodos más largos y usar herramientas perfectamente durante largos períodos de pensamiento”. La versión en inglés simple: las máquinas aprendieron a pensar antes de hablar.
Los modelos anteriores funcionaban como reflejos: entrada dentro, predicción fuera, sin pausa para pensar. Los nuevos deliberan. Haga una pregunta difícil y el modelo se quedará pensándolo, a veces durante minutos, comprobando su lógica y retrocediendo desde los callejones sin salida. Se parece notablemente al pensamiento. Si es pensamiento, en cualquier sentido significativo, sigue siendo una de las grandes preguntas sin respuesta.
Si los modelos de pensamiento fueron la historia intelectual de 2025, la bomba comercial fue más cruda: la IA de frontera resultó ser mucho más barata de lo que se pensaba. La economía que parecía tan inmutable como la gravedad resultó ser más bien como la moda. Esa revelación cambiará la competencia en 2026.
El lanzamiento de DeepSeek en enero cayó como una bomba. El modelo igualó a los sistemas occidentales utilizando aproximadamente una décima parte de la computación de entrenamiento. “Eso impulsó las cosas”, dijo Varshney. “Ahora hay otro competidor y todos necesitan mejorar su nivel”.
La arquitectura de los modelos ha experimentado sus propios cambios silenciosos. El nuevo patrón de moda, mezcla de expertos, dirige las entradas a subredes especializadas en lugar de activar todos los parámetros para cada consulta. Piense en ello como consultar al especialista adecuado en lugar de pedirle a un médico que lo sepa todo. Andrew Chin, profesor de derecho de la UNC que estudia la política de tecnología, explicó la economía a IBM Think: “Los modelos densos incurren aproximadamente en el mismo costo computacional para cada token”, dijo. “Los sistemas dispersos enrutan los tokens a través de solo un subconjunto de parámetros”. La implicación para las empresas es significativa: “La escala se convierte en algo para gestionar, no simplemente para maximizar”.
La democratización se extiende más allá de la arquitectura hasta el ajuste. Christelle Scharff, profesora de ciencias de la computación de la Pace University, dijo a IBM Think que ha sido testigo de “un claro cambio hacia LoRa y un ajuste ligero, lo que permite adaptar modelos potentes con computación limitada”. Los investigadores con presupuestos modestos ahora pueden personalizar modelos que hace un año estaban fuera de su alcance. Se están abriendo las puertas.
Las ganancias de eficiencia también incluyen el diseño del sistema. Kandyce Brennan, profesora adjunta de la UNC School of Nursing que trabaja en IA en la atención médica, comentó a IBM Think que enfoques como el planificador DisCIPL del MIT(donde “un modelo grande planea y coordina muchos modelos pequeños”) logran resultados con un “costo computacional mucho menor”. La eficiencia también reduce el uso de energía y la carga ambiental.
“Las limitaciones de datos y las preocupaciones energéticas ahora se han convertido en un verdadero desafío, lo que ha impulsado a la investigación en la dirección de modelos más pequeños”. Esas restricciones solo aumentarán.
Resulta que lo que las empresas realmente necesitan no es la capacidad de hacerlo todo, agregó Varshney. Ofreció un ejemplo caprichoso: podríamos pedirle a un modelo que comente sobre los derechos civiles en la luna, y produciría algo fluido. “Pero la mayoría de las tareas empresariales no son eso. “Están más dirigidas”. La teología de la escala está dando paso al pragmatismo de la adecuación al propósito.
Los avances han sido reales. Lo mismo ocurre con los límites. A pesar de su nueva capacidad de deliberación, los modelos de IA siguen siendo capaces de un tipo particular de error: el error confiado, cometido con la serena seguridad de un guía turístico que entró en el museo equivocado.
Poesia identificó los problemas centrales: “Dos desafíos principales siguen siendo la confiabilidad y la creatividad. Incluso tener éxito el 99.9 % de las veces no es suficiente”, dijo. Las matemáticas son implacables. Un sistema que falla una vez en mil intentos fallará mil veces procesando un millón de consultas. En medicina, derecho o finanzas, esas no son probabilidades aceptables.
La creatividad es otra cuestión. “Para tareas abiertas, incluso modelos de diferentes empresas tienden a dar resultados similares”, observó Poesia. Los modelos se han vuelto notablemente buenos para encontrar respuestas correctas. Permanecen extrañamente uniformes cuando se les pide que sean originales.
Los modelos de razonamiento tienen sus propios puntos ciegos. Varshney señaló que "en tareas donde existe la capacidad de verificar pasos intermedios, estos flujos más largos ayudan. Pero hay muchísimas cosas en las que no hay pasos intermedios verificables”.
Un punto de referencia llamado ARC-AGI-2 ilustra la brecha. La prueba presenta problemas que los humanos encuentran fáciles, pero que la IA encuentra extraordinariamente difíciles. “Incluso los modelos de pensamiento de última generación tuvieron una puntuación muy por debajo del rendimiento humano”, señaló Emadi. “Los modelos pueden razonar mejor que antes, pero aún así pueden equivocarse con seguridad”.
La alucinación, que es el término educado del campo para inventar cosas, ha cambiado en la forma en que se manifiesta, pero aún permanece. Mohammad Hossein Jarrahi, profesor de la UNC que estudia la interacción humano-IA, dijo a IBM Think que “las alucinaciones han cambiado de carácter, pero no han desaparecido por completo”. La tendencia a generar información que suene plausible, pero objetivamente incorrecta sigue siendo muy persistente.
Algunos investigadores se preocupan por la trayectoria más amplia. Todd Cherner, quien dirige un programa de tecnología educativa en la University of North Carolina, comentó a IBM Think que “la capacidad creciente de los agentes de IA es provocadora. Creo que el futuro se dirige a la AGI más rápido de lo que la gente se da cuenta. Deberíamos hacer un buen uso de lo que tenemos antes de impulsar realmente la AGI”.
El principio fundacional de la computación todavía se aplica. “Si entra basura, sale basura”, declaró Nathalie Volkheimer, especialista en participación de usuarios de RENCI, a IBM Think. “Nos estamos centrando en la máquina que hace la salchicha, y no en la salchicha en sí. Pero al final comemos lo que hacemos”.
Un avance menos anunciado: la expansión de las ventanas de contexto, la cantidad de información que un modelo puede contener en la memoria de trabajo. “Vemos un contexto de escala de repositorio mucho mejor, hasta alrededor de un millón de tokens”, dijo Jarrahi. Un millón de tokens equivale aproximadamente a varias novelas. Los modelos ahora pueden mantener una comprensión coherente a través de interacciones mucho más largas, lo que es enormemente importante para la revisión de documentos legales, el desarrollo de software y la síntesis de investigaciones.
Las características de citación también mejoraron, con “características de base integradas que pueden señalar pasajes específicos”, agregó Jarrahi. Cuando un modelo puede mostrar su trabajo, los usuarios pueden verificarlo en lugar de aceptarlo sin más. Confiemos, pero verifiquemos. O mejor dicho: no confiemos y definitivamente verifiquemos.
Pero la verificación solo nos llevará hasta cierto punto. Aude Oliva, directora del laboratorio de IA MIT-IBM Watson, dijo a IBM Think que “el futuro de la colaboración entre la IA y los humanos es un diálogo. Un sistema agéntico artificial debe poseer cierto grado de teoría de la mente. Comprender el funcionamiento interno de un sistema de IA forma la base de la confianza”. La teoría de la mente, la capacidad de entender que otros tienen diferentes perspectivas, es fundamental para la interacción humana. Su ausencia en la IA crea una fricción que ninguna cantidad de capacidad puede superar.
Las métricas para el éxito están cambiando en consecuencia. “El campo se dirige inexorablemente hacia modelos juzgados menos por la fluidez bruta y más por la trazabilidad, calibración y robustez interaccional”, señaló Jarrahi. Las métricas de glamour están dando paso a las métricas de confiabilidad. Flash pasó de moda. La previsibilidad está de moda.
“El tema dominante ha sido las capacidades a través de las restricciones”, dijo Chin. “En lugar de tratar la escala como un fin en sí mismo, los esfuerzos principales se centran en hacer que los sistemas funcionen de manera predecible bajo límites reales”. El progreso parece menos un logro y más un problema de ingeniería.
Tres limitaciones determinarán lo que las organizaciones pueden hacer con la IA en 2026, según dijeron varios expertos a IBM Think. La primera es económica, la segunda es física y la tercera es regulatoria.
Comenzamos con el dinero. “La economía de la inferencia actuará cada vez más como un techo rígido”, dijo Chin. “Muchos avances recientes en razonamiento se basan en un uso considerablemente mayor de recursos computacionales por consulta”. Un modelo que tarda minutos en pensar no puede implementarse donde se requieren respuestas en tiempo real a escala, señaló.
Las limitaciones físicas son igual de abrumadoras. “Se prevé que el consumo global de electricidad de los centros de datos se duplique con creces para 2030”, dijo Emadi. “Para muchas organizaciones, la limitación del próximo año no será la disponibilidad de chips, sino los gigavatios para conectarlos”. La industria lleva años obsesionada con los chips. El cuello de botella se está trasladando a las centrales eléctricas.
“Las demandas computacionales, y por lo tanto los costos ambientales, siguen siendo altas, lo que plantea importantes cuestiones éticas sobre la sustentabilidad”. La huella de carbono de la IA se ha vuelto imposible de ignorar.
Luego está la regulación. “Las presiones de gobernanza por diseño darán forma al desarrollo del modelo de manera más directa”, comentó Chin. “Para muchos despliegues, el requisito no es solo alto rendimiento, sino un comportamiento auditable y limitado”. La era de la caja negra podría estar llegando a su fin.
La creciente brecha entre la industria y la academia preocupa a algunos observadores. “Las universidades deben volver a centrarse en la IA fundamental e e invertir en ideas que definirán este campo dentro de 10 a 20 años”. Los modelos más grandes están cada vez más fuera del alcance académico, lo que plantea preguntas incómodas sobre de dónde vendrá la próxima generación de ideas.
Un desarrollo que no se ha informado: el auge de la IA soberana. “En muchos países, la gente ha estado desarrollando sus propios modelos”, dijo Varshney. Esto es importante porque los datos de entrenamiento son más sensibles a las diferencias culturales y acercan el control económico a los hogares, señaló.
Para 2026, Varshney espera una experimentación continua en lugar de avances drásticos. “No todo tiene que ser exactamente un transformador”, dijo. Mihalcea ofreció un pronóstico similar: “una combinación especializada más pequeña de modelos expertos, aprovechando los sistemas multiagente”. Cuando se le preguntó si se avecinaban grandes avances, Varshney se mostró cauteloso. “Siempre hay una oportunidad, otro momento ChatGPT. “Pero no espero eso”. La respuesta honesta es que nadie lo sabe.
Los profesionales ya se están adaptando a este nuevo ámbito. Jayashankar Swaminathan, profesor de operaciones globales de UNC Kenan-Flagler, contó a IBM Think que “los mayores avances están relacionados con las capacidades agénticas autónomas, donde la IA ahora puede realizar múltiples tareas en un orden simple. El segundo se refiere al razonamiento lógico que subyace a la toma de decisiones”.
En la atención médica, la transformación ya está en marcha. Maureen Baker, profesora clínica asociada de la UNC School of Nursing, señaló a IBM Think que “los modelos de IA están avanzando a un ritmo increíble”. Pero distingue entre capacidad y despliegue: “El pensamiento crítico, el razonamiento clínico y el juicio deben permanecer en primer plano”. Su enfoque es pragmático: “Busco victorias fáciles con un riesgo mínimo”.
El ecosistema se está diferenciando. David Sachs, profesor de tecnología de la información de la Pace University, dijo a IBM Think que “parece que están emergiendo dos tipos de modelos: el modelo grande, podemos hacerlo todo, y los más enfocados como Julius o Perplexity”. Al igual que el software evolucionó de aplicaciones monolíticas a herramientas especializadas, la IA se está fragmentando en nichos.
“El uso real de estos sistemas se forma mediante el diseño de flujos de trabajo simbióticos”, dijo Jarrahi. Los humanos aportan juicio, creatividad y responsabilidad. La IA aporta velocidad, coherencia y la capacidad de procesar grandes cantidades de información. Las organizaciones que descubran cómo combinarlos tendrán una ventaja competitiva.
“La IA de frontera se está alejando de una era definida por la escala bruta, hacia una definida por procedimientos, restricciones y compensaciones operativas”. Las tecnologías maduran cuando los ingenieros comienzan a optimizar para los límites del mundo real. Según ese criterio, la IA por fin está madurando.
Pero Varshney está pensando en algo más profundo que la tecnología. “¿Cuáles serán las tareas que se delegarán a los sistemas de IA y cuáles seguirán haciendo los humanos?”, preguntó. “¿Es porque los humanos encuentran sentido al hacer ciertas cosas? ¿Qué significa ser humano, en muchos sentidos?”.
