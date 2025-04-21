La búsqueda para crear máquinas de pensamiento similares a los humanos (sistemas de IA que puedan razonar, adaptarse y abordar una amplia gama de desafíos) está dominando los titulares y reconfigurando las agendas tecnológicas. Pero Ruchir Puri, científico jefe de IBM Research, está impulsando un tipo diferente de avance: la IA que se gana el sustento siendo útil ahora, no en una fecha hipotética en el futuro.
La idea de una máquina que piensa como una persona ha sido parte de la cultura tecnológica durante más de medio siglo. En los últimos años, ha pasado de ser un tema marginal en las conferencias de ciencia de la computación a ocupar un lugar central en el debate público y político. La inteligencia artificial general (AGI) se convirtió en un cale de sastre tanto para la promesa como el peligro de la IA moderna.
“Cada vez que alcanzamos un hito, tendemos a ampliar ese límite”, dice Puri, hablando de IA en una entrevista con IBM® Think. “Pensábamos que el ajedrez era lo mejor. Luego pensamos que era el lenguaje. Ahora es la programación o el razonamiento. Pero la inteligencia general sigue sin definirse”.
La frase "inteligencia artificial general" ganó fuerza por primera vez en la década de 2000 como una forma de distinguir entre los sistemas de IA estrechos (aquellos diseñados para realizar muy bien una tarea) y el tipo de inteligencia amplia y adaptable que se ve en los humanos. Durante décadas, el objetivo permaneció al margen, un tema de investigación teórica y ciencia ficción más que la ingeniería convencional.
Esto comenzó a cambiar con la llegada del aprendizaje profundo en la década de 2010 y la aparición de modelos fundacionales, o redes neuronales a gran escala entrenadas con amplios conjuntos de datos. Estos modelos no pensaban en ningún sentido significativo, pero podían generar texto convincente, identificar patrones y realizar tareas que antes parecían estar fuera del alcance de las máquinas.
Los últimos años han acelerado esos desarrollos. GPT-4, Claude 3, Gemini y otros modelos ahora pueden pasar pruebas estandarizadas, escribir código, resumir trabajos de investigación e incluso explicar chistes. Todavía son frágiles, a menudo obtienen respuestas incorrectas y carecen de una comprensión real. Pero desdibujan el boundary entre la IA estrecha y algo más flexible, y para algunos investigadores, esto se siente como una AGI en etapa inicial. Otros advierten que sigue siendo una ilusión de competencia, y que el término "AGI" sigue siendo más retórico que técnico.
En su forma más básica, la AGI se refiere a una máquina que puede realizar cualquier tarea intelectual que un ser humano pueda (aprender, razonar, resolver problemas) con la misma adaptabilidad y capacidad de generalización. A diferencia de los sistemas de IA actuales, que son estrechos y altamente especializados, la AGI operaría con flexibilidad en una amplia gama de dominios, sin necesidad de programarse explícitamente para cada uno.
El año pasado se vio una ola de modelos cada vez más capaces que solo han alimentado las expectativas. El director ejecutivo (CEO) de OpenAI, Sam Altman, describió la AGI como inminente. Sus declaraciones públicas —y la dirección estratégica de la compañía— sugieren un compromiso inequívoco con la construcción de máquinas capaces de razonar con amplia competencia. Google DeepMind y Anthropic han seguido su ejemplo, lanzando sistemas optimizados para un razonamiento más general, memoria y uso de herramientas.
Inversores de alto perfil y laboratorios de investigación respaldan la visión de la AGI, y algunos afirman que será posible en un plazo de cinco a diez años. Los debates políticos también han entrado en la corriente principal, ya que los legisladores y los organismos de control plantean preocupaciones sobre cómo regular una tecnología que, por definición, no tiene precedentes históricos. Para algunos, el futuro parece tentadoramente cercano; para otros, peligrosamente prematuro.
La respuesta de Puri no es descartar la ambición por completo, sino replantear la pregunta: ¿y si la verdadera frontera no es construir una máquina que pueda hacer todo, sino una que pueda hacer bien algunas cosas esenciales?
Puri fue fundamental en la construcción de los sistemas que impulsaban las plataformas IBM watsonx y watsonx.ai , que establecieron referentes para lo que las máquinas podían lograr. Hoy en día, cree que el campo necesita un nuevo principio organizador, algo menos mítico y más práctico. Esa idea, a la que Puri se refiere como inteligencia artificial útil (AUI), está empezando a influir en la forma en que IBM y otras instituciones de investigación enmarcan sus esfuerzos.
“Me gusta esta perspectiva de ‘Hagamos que la inteligencia artificial sea útil’, porque si la hacemos útil, nadie se opondrá a ella”, afirma.
A diferencia de la AGI, que implica una máquina que puede igualar o superar la inteligencia humana en todos los dominios, la AUI apunta a un nivel más bajo, pero con un beneficio potencialmente más inmediato. No se trata de crear algo que pueda escribir sinfonías o reemplazar a los filósofos. Se trata de construir herramientas que funcionen de forma fiable en contextos claramente definidos, como copilotos de código, verificadores de cumplimiento y optimizadores del flujo de trabajo.
Puri me habló desde su oficina en el Centro de Investigación Thomas J. Watson de IBM en Yorktown Heights, Nueva York. El edificio, una estructura expansiva y modernista ubicada en las colinas boscosas a una hora al norte de Manhattan, tiene la gravedad tranquila de un lugar donde los desarrollos científicos ocurren fuera de la vista. Los visitantes pasan placas de identificación azules grabadas con fórmulas matemáticas y pizarras blancas marcadas con ecuaciones semiresueltas. Diseñado por el arquitecto modernista Eero Saarinen a principios de la década de 1960, el laboratorio ha sido el hogar de algunos de los avances más famosos de IBM. Puri ha trabajado aquí durante décadas.
Con sus largos pasillos y vistas al bosque, es el tipo de lugar donde el pensamiento a largo plazo se siente no solo posible, sino esperado, un entorno muy adecuado para la forma en que Puri aborda su trabajo. Como él lo dice, su cambio hacia la AUI no es tanto un giro como una continuación de las preguntas que ha estado persiguiendo durante años. Durante mucho tiempo ha gravitado hacia sistemas que muestran valor práctico a escala, como las herramientas de IA para el desarrollo de software, que describe como “sorprendentemente útiles”, no solo para expertos, sino también para principiantes que aprenden a codificar. Ese tipo de accesibilidad generalizada, argumenta, refleja la verdadera promesa de la IA.
Y cuando los modelos están integrados en las operaciones del mundo real, dice Puri, hay mucho en juego. En la banca, el transporte y la atención médica, por ejemplo, los pequeños errores pueden desencadenarse rápidamente.
“Creo que el público se equivocó de todas las demostraciones llamativas”, dice Puri. “ChatGPT, Midjourney, Sora, todo increíble. Pero en el mundo empresarial, no se puede alucinar un número o malinterpretar una regulación. Tiene que ser correcto”.
Esa preocupación ha llevado a IBM a adoptar un modelo híbrido. En lugar de depender únicamente de sistemas probabilísticos, están emparejando modelos con herramientas verificadas, como calculadoras, API de búsqueda y validadores de datos estructurados para minimizar los riesgos. Estos enfoques no prometen una cognición similar a la humana. Su objetivo es la coherencia. El objetivo es garantizar que los sistemas de IA sean confiables en entornos de alto riesgo, donde la precisión y la auditabilidad son más importantes que la creatividad o el talento conversacional.
“Hay casos de uso donde la creatividad es un activo”, dice, “y otros donde es un pasivo”.
Puri hace referencia a la experiencia de IBM en desarrollo y automatización de software como prueba de concepto. "Se ha vuelto sorprendentemente útil", dice sobre la IA. "Desde los desarrolladores que lo encuentran útil en su vida cotidiana, hasta los estudiantes que están aprendiendo a programar y hacer cosas, y también encontrando ayuda de agentes de programación automatizados, se ha vuelto útil no solo para los expertos, sino para las personas en general. .”
Recordó las dudas iniciales de algunos investigadores de que el desarrollo de software, a menudo visto como una tarea altamente creativa y compleja, sería difícil de abordar para las máquinas. “Se pensaba que era una tarea muy, muy dura”, dice. Pero gracias a LLM como ChatGPT y modelos especializados internos, esa suposición no se cumplió. "Eso fue sorprendente, no solo para mí, sino para muchas personas".
La mayor implicación, dice Puri, es que dado que “cada empresa es ahora una empresa de software”, la utilidad de la IA en la programación podría traducirse en una amplia relevancia en todas las industrias.
A pesar de todo el ruido que rodea a la IA —su promesa, sus obstáculos, su mitología— Puri dice que a menudo vuelve a una idea más tranquila: la confianza. No solo en el sentido ético, sino también en el mecánico. ¿El sistema puede hacer lo que dice hacer? ¿Se puede confiar en él, incluso cuando nadie lo está observando?
Se refiere a la proliferación de modelos de código abierto —Llama de Meta, los sistemas de mezcla de expertos (MoE) de Mistral, la línea Granite de IBM— y al cambio general hacia una investigación transparente y colaborativa. Estos sistemas no están diseñados para el espectáculo. Están destinados a ser probados, ajustados y desafiados. Permiten el escrutinio e invitan a la modificación.
IBM, por ejemplo, está presentando sus modelos Granite no como mentes de propósito general. En cambio, los modelos son herramientas, desarrolladas pensando en los clientes empresariales y optimizadas para manejar tareas específicas en finanzas, logística y otros dominios altamente estructurados. Puri enfatiza su enfoque intencional y su empresa de servicios públicos dirigida.
"Estos modelos no están diseñados para reemplazar a los humanos", dice. "Están diseñados para ayudar a las personas a hacer más".
En lugar de imitar la inteligencia humana al por mayor, enfatiza, la verdadera prueba es si la IA entrega resultados que importan a las personas y las instituciones, de manera consistente, predecible y a gran escala.
De cara al futuro, Puri ve el futuro de la IA como algo que se moldeará menos por avances de arriba hacia abajo y más por un progreso amplio e iterativo, impulsado por la colaboración, la experimentación y la infraestructura compartida.
En particular, cree que los avances más significativos no provendrán de laboratorios sellados o demostraciones secretas, sino de comunidades que construyen al aire libre. Como él mismo dice: "Este es uno de los primeros conjuntos de tecnologías donde la innovación se lleva a cabo realmente de forma abierta".
