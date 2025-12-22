En 2026, es posible que los modelos de IA más inteligentes no sean los más grandes.
Esa es la apuesta que están haciendo ahora los laboratorios, los inversores y los investigadores que pasaron el último año viendo cómo se derrumbaban sus suposiciones. Los próximos 12 meses no estarán definidos por la carrera por construir sistemas más grandes, sino por la lucha por desarrollar otros más inteligentes, modelos que piensen antes de hablar, que hagan más con menos.
“Se puede lograr que un modelo de lenguaje pequeño funcione al mismo nivel, o incluso mejor, que modelos mucho más grandes”, dijo Kush Varshney, miembro de IBM, a IBM Think en una entrevista.
Hace un año, eso habría sonado a herejía. Durante una década, la IA había funcionado según un catecismo brutalmente simple: más datos, más parámetros, más potencia de cálculo, más inteligencia. Los laboratorios competían para anunciar el recuento de parámetros como culturistas flexionándose en un espejo. Los entrenamientos consumían la producción eléctrica de las ciudades pequeñas. Toda la empresa tenía la sensación de una carrera por la tierra, excepto que el territorio que se reclamaba se medía en teraflops.
Luego llegó enero de 2025. Una empresa llamada DeepSeek, con sede en China, lanzó un modelo que hizo caer las acciones de Nvidia un 17 % en un solo día. La inteligencia algorítmica podría sustituir a la fuerza computacional bruta. No hacía falta una catedral. Necesitaba un mejor plan.
Los principales laboratorios estadounidenses dieron un giro rápido. En cuestión de meses, pasaron de crear sistemas cada vez más grandes a crear sistemas que se detengan y razonen antes de responder. Seyed Emadi, profesor asociado de operaciones en la Universidad de Carolina del Norte Kenan-Flagler, lo expresó sin rodeos cuando habló con IBM Think: “Si tuviera que resumir 2025 en IA, dejamos de hacer modelos más grandes y empezamos a hacerlos más inteligentes”.
Ese cambio ahora determina lo que viene después. El consenso entre los investigadores es sorprendente, casi inquietante. Cuando se le pidió que identificara el desarrollo más significativo del año pasado, Misha Belkin, un profesor de machine learning en UC San Diego, señaló “el auge de los modelos de pensamiento y la escala de tiempo de inferencia”, y en una entrevista lo llamó la base para 2026. Rada Mihalcea, quien dirige el laboratorio de IA en la Universidad de Michigan, ofreció una visión complementaria: “los avances en los sistemas multiagente, así como una comprensión más profunda de... las debilidades” definirían el camino a seguir, le dijo a IBM Think.
El cambio representa un replanteamiento de lo que significa la inteligencia en el Silicon. El antiguo enfoque lo trataba como algo que se horneaba durante el entrenamiento, como el condimento en un guiso. Una vez completado, el modelo se congeló. El nuevo enfoque trata la inteligencia como algo que puede surgir en tiempo de ejecución, dando al modelo más tiempo para razonar, lo que se denomina cálculo del tiempo de inferencia.
Las implicaciones aún se están resolviendo. Gabriel Poesia, investigador que estudia el razonamiento de IA en la Universidad de Stanford, ha observado que los modelos mejoran en “pensar durante períodos de tiempo más largos” y “utilizar herramientas de manera fluida durante largos períodos de pensamiento”. En pocas palabras: las máquinas aprendieron a pensar antes de hablar.
Los modelos antiguos funcionaban como reflejos: entrada, predicción fuera, sin pausa para pensar. Los nuevos deliberan. Haga una pregunta difícil y el modelo se quedará pensándolo, a veces durante minutos, comprobando su lógica y retrocediendo desde los callejones sin salida. Se parece bastante al pensamiento. Si se trata de pensar, en un sentido significativo, sigue siendo una de las grandes preguntas sin respuesta.
Si los modelos de pensamiento fueron la historia intelectual de 2025, la bomba comercial fue más cruda: la IA de vanguardia resultó ser mucho más barata de lo que se pensaba. La economía que había parecido tan inmutable como la gravedad resultó ser más bien una moda. Esa revelación remodelará la competencia en 2026.
El lanzamiento de DeepSeek en enero cayó como una bomba. El modelo coincidió con los sistemas occidentales utilizando aproximadamente una décima parte del cálculo de entrenamiento. “Eso aceleró las cosas”, dijo Varshney. “Ahora hay otro competidor y todos necesitan mejorar su juego”.
La arquitectura modelo ha sufrido sus propios cambios silenciosos. El nuevo patrón más popular, la mezcla de expertos, dirige las entradas a subredes especializadas en lugar de activar todos los parámetros de cada consulta. Piense en ello como consultar al especialista adecuado en lugar de pedirle a un médico que lo sepa todo. Andrew Chin, un profesor de derecho en la UNC que estudia la tecnología, explicó los aspectos económicos a IBM Think: “Los modelos densos incurren aproximadamente en el mismo coste computacional para cada token”, dijo. “Los sistemas dispersos enrutan tokens a través de solo un subconjunto de parámetros”. La implicación para las empresas es significativa: “La escala se convierte en algo para gestionar, no simplemente para maximizar”.
La democratización se extiende más allá de la arquitectura hasta el fine-tuning. Christelle Scharff, profesora de informática en la Universidad de Pace, dijo a IBM Think que ha sido testigo de “un claro cambio hacia LoRA y el fine-tuning ligero, que permite adaptar modelos potentes con computación limitada”. Los investigadores con presupuestos modestos ahora pueden personalizar modelos que hace un año habrían estado fuera de su alcance. Las puertas se abren.
Las ganancias de eficiencia también incluyen el diseño del sistema. Kandyce Brennan, profesora asistente en la facultad de enfermería de la UNC que trabaja en IA en el sector sanitario, dijo a IBM Think que enfoques como el planificador DisCIPL del MIT, donde “un modelo grande planifica y coordina... muchos modelos pequeños”, logran resultados con “mucho menor coste computacional”. La eficiencia también reduce el uso de energía y la carga ambiental.
“Las limitaciones de datos y las preocupaciones energéticas se han convertido ahora en un verdadero desafío”, dijo Mihalcea, “lo que ha impulsado la investigación hacia modelos más pequeños”. Esas limitaciones no harán más que endurecerse.
Resulta que lo que las empresas realmente necesitan no es la capacidad de hacerlo todo, dijo Varshney. Ofreció un ejemplo caprichoso: podría pedir a un modelo que comentara sobre los derechos civiles en la luna, y produciría algo fluido. “Pero la mayoría de las tareas empresariales no son eso”, dijo. “Son más específicas”. La teología de la escala está cediendo el paso al pragmatismo de la adecuación a su propósito.
Los avances han sido reales. También los límites. A pesar de su nueva capacidad de deliberación, los modelos de IA siguen siendo capaces de cometer un tipo concreto de error: el error seguro, pronunciado con la serena seguridad de un guía turístico que se ha equivocado de museo.
Poesia identificó los problemas principales: “Dos retos principales siguen siendo la fiabilidad y la creatividad. Incluso tener éxito el 99,9 % de las veces no es suficiente”, dijo. Las matemáticas son implacables. Un sistema que fracasa una vez cada mil intentos fallará mil veces al procesar un millón de consultas. En medicina, derecho o finanzas, esas probabilidades no son aceptables.
La creatividad es otra cuestión. “Para las tareas abiertas... incluso los modelos de diferentes empresas tienden a dar resultados similares”, observó Poesia. Los modelos se han vuelto notablemente buenos a la hora de encontrar las respuestas correctas. Permanecen extrañamente uniformes cuando se les pide que sean originales.
Los modelos de razonamiento tienen sus propios puntos ciegos. Varshney señaló que “en las tareas en las que existe la posibilidad de verificar los pasos intermedios... estos flujos más largos ayudan. Pero hay muchísimas cosas en las que no hay pasos intermedios verificables”.
Un punto de referencia llamado ARC-AGI-2 ilustra la brecha. La prueba presenta problemas que los humanos ven fáciles, pero que la IA encuentra extraordinariamente difíciles. “Incluso los modelos de pensamiento de última generación obtienen una puntuación muy por debajo del rendimiento humano”, dijo Emadi. “Los modelos pueden razonar mejor que antes, pero aún así pueden equivocarse con total seguridad”.
La alucinación, que es el término educado que se utiliza en este campo para referirse a inventarse cosas, ha cambiado en cuanto a su forma de manifestarse, pero sigue existiendo. Mohammad Hossein Jarrahi, profesor de la UNC que estudia la interacción entre humanos e IA, dijo a IBM Think que “las alucinaciones han cambiado de carácter, pero no han desaparecido por completo”. La tendencia a generar información que suene plausible pero objetivamente incorrecta sigue siendo obstinadamente persistente.
Algunos investigadores se preocupan por la trayectoria más amplia. Todd Cherner, quien dirige un programa de tecnología educativa en la Universidad de Carolina del Norte, dijo a IBM Think que “la capacidad creciente de los agentes de IA es provocadora. Creo que el futuro se encamina hacia la AGI más rápido de lo que la gente cree. Deberíamos aprovechar bien lo que tenemos antes de insistir de verdad en la AGI“.
El principio fundamental de la informática sigue vigente. “Basura dentro, basura fuera”, dijo Nathalie Volkheimer, especialista en compromiso de los usuarios de RENCI, a IBM Think. “Nos centramos en la máquina que hace la salchicha, y no en la salchicha en sí. Pero al final comemos lo que hacemos”.
Boletín del sector
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
Un avance menos anunciado: la expansión de las ventanas de contexto, la cantidad de información que un modelo puede contener en la memoria de trabajo. “Vemos un contexto mucho mejor a escala de repositorio, hasta alrededor de un millón de tokens”, dijo Jarrahi. Un millón de tokens es aproximadamente varias novelas. Los modelos ahora pueden mantener una comprensión coherente a través de interacciones mucho más largas, lo que es enormemente importante para la revisión de documentos legales, el desarrollo de software y la síntesis de la investigación, dijo.
Las características de citación han mejorado también, con “características de base integradas que pueden señalar a pasajes específicos”, agregó Jarrahi. Cuando un modelo puede mostrar su trabajo, los usuarios pueden verificarlo en lugar de aceptarlo. Confíe, pero verifique. O más bien: no confíe y verifique.
Pero la verificación solo le lleva hasta cierto punto. Aude Oliva, director del laboratorio de IA del MIT-IBM Watson, dijo a IBM Think que “el futuro de la colaboración humano-IA es un diálogo. Un sistema agéntico artificial debe poseer algún grado de teoría de la mente. Comprender el funcionamiento interno de un sistema de IA... constituye la base de la confianza”. La teoría de la mente, la capacidad de entender que los demás tienen perspectivas diferentes, es fundamental para la interacción humana. Su ausencia en la IA crea fricciones que ninguna capacidad puede superar.
Las métricas del éxito están cambiando en consecuencia. “El campo se dirige inexorablemente hacia modelos juzgados menos por la fluidez bruta y más por la trazabilidad, la calibración y la robustez interaccional”, dijo Jarrahi. Las métricas de glamour están dando paso a las métricas de fiabilidad. Lo instantáneo está pasando de moda. Lo predecible está en auge.
“El tema dominante ha sido las capacidades a través de las restricciones”, dijo Chin. “En lugar de tratar la escala como un fin en sí mismo, los esfuerzos líderes se centran en hacer que los sistemas funcionen de forma predecible bajo límites reales”. El progreso se parece menos a un lanzamiento a la luna y más a un problema de ingeniería.
Tres limitaciones determinarán lo que las organizaciones pueden hacer con la IA en 2026, según afirman varios expertos a IBM Think. El primero es económico, el segundo es físico y el tercero es regulatorio.
Empiece por el dinero. “La economía de la inferencia actuará cada vez más como un techo rígido”, dijo Chin. “Muchos avances recientes en el razonamiento se basan en un cálculo materialmente mayor por consulta”. Un modelo que tarda minutos en pensar no puede implementarse donde se requieren respuestas en tiempo real a escala, señaló.
Las limitaciones físicas son igual de abrumadoras. “Se prevé que el consumo mundial de electricidad en los centros de datos se duplique con creces en 2030”, dijo Emadi. “La limitación del próximo año para muchas organizaciones no será la disponibilidad de chips, sino los gigavatios a los que conectarlos”. La industria lleva años obsesionada con los chips. El cuello de botella se está trasladando a las centrales eléctricas.
“Las demandas computacionales y, por lo tanto, los costEs ambientales, siguen siendo altos”, agregó Brennan, “lo que plantea importantes cuestiones éticas sobre la sostenibilidad”. La huella de carbono de la IA se ha convertido en algo imposible de ignorar.
Luego está la regulación. “Las presiones del diseño del gobierno influirán más directamente en el desarrollo de modelos”, dijo Chin. “Para muchas implementaciones, el requisito no es solo un alto rendimiento, sino también un comportamiento auditable y limitado”. La era de la caja negra podría estar llegando a su fin.
La creciente brecha entre la industria y el mundo académico preocupa a algunos observadores. “Las universidades deben volver a centrarse en la IA fundamental”, afirmó Scharff, “e invertir en ideas que definirán este campo dentro de 10 a 20 años”. Los modelos más grandes están cada vez más fuera del alcance académico, lo que plantea preguntas incómodas sobre de dónde vendrá la próxima generación de ideas.
Un acontecimiento que no se ha denunciado: el auge de la IA soberana. “En muchos países, la gente ha estado desarrollando sus propios modelos”, dijo Varshney. Son importantes porque los datos de formación responden mejor a las diferencias culturales y trasladan el control económico más cerca de casa, señaló.
Para 2026, Varshney espera una experimentación continuada más que avances espectaculares. “No todo tiene que ser exactamente un transformador”, dijo. Mihalcea ofreció una previsión similar: “una combinación más reducida y especializada de modelos expertos, aprovechando los sistemas multiagente”. Cuando se le preguntó si se avecinan grandes avances, Varshney se mostró cauteloso. “Siempre hay una posibilidad... otro momento ChatGPT”, dijo. “Pero no creo”. La respuesta honesta es que nadie lo sabe.
Los profesionales ya se están adaptando a este nuevo panorama. Jayashankar Swaminathan, profesor de operaciones globales en UNC Kenan-Flagler, dijo a IBM Think que “los mayores avances están en torno a... la capacidad de agencia autónoma, donde la IA ahora puede realizar múltiples tareas en un orden simple. El segundo se relaciona con razonar la lógica detrás de la toma de decisiones”.
En la sanidad, la transformación ya está en marcha. Maureen Baker, profesora clínica asociada de la facultad de enfermería de la UNC, dijo a IBM Think que “los modelos de IA avanzan a un ritmo increíble”. Pero distinguió la capacidad de la implementación: “El pensamiento crítico, el razonamiento clínico y el juicio deben permanecer a la vanguardia”. Su enfoque es pragmático: “Busco victorias fáciles con un riesgo mínimo”.
El ecosistema se está diferenciando. David Sachs, profesor de tecnología de la información en la Universidad de Pace, dijo a IBM Think que “parece que están surgiendo dos tipos de modelos: los grandes, que pueden hacer de todo, y los más especializados, como Julius o Perplexity”. Al igual que el software evolucionó de aplicaciones monolíticas a herramientas especializadas, la IA se está fragmentando en nichos.
“El uso real de estos sistemas... se forma... mediante el diseño de flujos de trabajo simbióticos”, dijo Jarrahi. Los humanos aportan juicio, creatividad y responsabilidad. La IA aporta velocidad, coherencia y la capacidad de procesar grandes cantidades de información. Las organizaciones que descubran cómo combinarlas tendrán una ventaja competitiva.
“La IA fronteriza se está alejando de una era definida por la escala bruta”, dijo Chin, “hacia una definida por procedimientos, restricciones y compensaciones operativas”. Las tecnologías maduran cuando los ingenieros comienzan a optimizar para los límites del mundo real. En ese sentido, la IA finalmente está creciendo.
Pero Varshney está pensando en algo más profundo que la tecnología. “¿Cuáles serán las tareas que se delegarán a los sistemas de IA y cuáles seguirán realizando los humanos?”, preguntó. “¿Es porque los seres humanos encuentran sentido... al hacer ciertas cosas? ¿Qué significa ser humano, en muchos sentidos?”
IBM Granite es nuestra familia de modelos de IA abiertos, eficaces y de confianza, adaptados a la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de idioma, código, series de tiempo y salvaguardas.
Las empresas reconocen que no pueden ampliar la IA generativa con modelos fundacionales en los que no puedan confiar. Descargue el extracto para saber por qué IBM, con sus emblemáticos "modelos Granite", ha sido nombrada "Strong Performer".
Aprenda a impulsar continuamente a los equipos para que mejoren el rendimiento de los modelos y superen a la competencia utilizando las últimas técnicas e infraestructuras de IA.
Explore el valor de los modelos fundacionales de nivel empresarial que proporcionan confianza, rendimiento y beneficios rentables a todos los sectores.
Aprenda a incorporar la IA generativa, el machine learning y los modelos fundacionales en sus operaciones empresariales para mejorar el rendimiento.
Vea una demostración de la comparación de los modelos de IBM con otros modelos en múltiples casos de uso.
Explore la biblioteca de modelos fundacionales de IBM en la cartera de watsonx para escalar la IA generativa para su negocio con confianza.
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.
Explore la biblioteca de modelos fundacionales de IBM en la cartera de IBM watsonx para escalar la IA generativa para su negocio con confianza.