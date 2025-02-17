El gato de su casa puede ser más inteligente que ChatGPT. Si bien la inteligencia artificial ahora puede escribir poesía y aprobar los exámenes de la facultad de derecho, todavía no puede igualar las habilidades básicas de razonamiento que permiten a su atigrado navegar por los alféizares de las ventanas y atacar a sus presas.
Esa brecha; entre el dominio de la IA sobre el conocimiento humano y su incapacidad para igualar la comprensión que un animal tiene del mundo físico; ha surgido como un desafío crucial en la búsqueda de máquinas más inteligentes. El científico jefe de IA de Meta, Yann LeCun, puso el tema en el candelero la semana pasada en una cumbre sobre la seguridad de la IA en París, argumentando que los "modelos del mundo"; sistemas de IA que forman representaciones internas de la estructura, la dinámica y las relaciones causales; podrían ser clave para el avance de la inteligencia artificial.
Sin embargo, algunos de los principales investigadores se preguntan si este enfoque es tan innovador como parece.
“La IA ha estado utilizando modelos mundiales desde la década de 1950, y varios subcampos de la IA dependen completamente de modelos mundiales”, Stuart J. Russell, profesor de Informática en la Universidad de California en Berkeley, dijo a IBM Think. "Es tan novedoso e ingenioso como sugerir que las matemáticas podrían ser útiles para la física".
El debate pone de relieve una persecución cada vez más intensa para alcanzar la inteligencia artificial general (AGI), o sistemas de IA que puedan igualar o superar el aprendizaje y el razonamiento a nivel humano en prácticamente cualquier dominio. A diferencia de los sistemas de IA especializados actuales, que sobresalen en tareas limitadas como el ajedrez o el procesamiento del lenguaje, la AGI necesitaría comprender el mundo de manera más fundamental, combinando habilidades de razonamiento, comprensión física y adaptabilidad.
Las principales empresas tecnológicas han adoptado diferentes enfoques para este desafío. OpenAI, a través de su serie GPT, se ha centrado en ampliar los modelos de lenguaje para lograr un razonamiento cada vez más sofisticado. Google DeepMind, junto con sistemas como AlphaFold y AlphaGo, se ha centrado en dominiosespecíficos mientras trabaja hacia capacidades más generales. Mientras tanto, Meta ha hecho hincapié en la importancia de aprender de la interacción con el mundo real en lugar de solo del texto.
"Ni hablar de intentar reproducir la inteligencia humana", dijo LeCun en la cumbre. “Ni siquiera podemos reproducir la inteligencia de los gatos o de las ratas. Cualquier gato doméstico puede planificar acciones muy complejas".
En los últimos años, los sistemas de IA han aumentado rápidamente sus puntuaciones en los puntos de referencia de dominios específicos. Pero LeCun señala lo que los investigadores llaman la paradoja de Moravec.: la observación de que las habilidades que los humanos encuentran fáciles a menudo resultan más difíciles de dominar para las máquinas.
"Hay cosas que damos por sentado porque los humanos y los animales pueden hacerlo, y pensamos que no son complicadas; cuando en realidad lo son mucho", dijo LeCun. "Y las cosas que creemos que son exclusivamente humanas, como manipular y generar lenguaje, jugar al ajedrez, jugar al go... resultan ser relativamente fáciles".
Esta paradoja; que la IA es excelente en tareas que consideramos exigentes desde el punto de vista intelectual, mientras que tiene dificultades con habilidades físicas y perceptivas aparentemente básicas; suscita el escepticismo de algunos expertos.
"El proceso de pasar de una secuencia de imágenes retinianas a, por ejemplo, las ecuaciones de Maxwell para el electromagnetismo es algo que la raza humana tardó decenas de miles de años em lograr y requirió un proceso acumulativo de formación de conceptos y matematización", dice Russell. “No he visto nada parecido a esto en los sistemas de deep learning actuales”.
Para ilustrar las limitaciones actuales, LeCun señaló una comparación llamativa: los LLM modernos entrenan con billones de tokens, una cantidad de texto que a un humano le llevaría medio millón de años leer. Sin embargo, un niño de cuatro años, despierto durante solo unas 16.000 horas, procesa una cantidad comparable de datos solo a través de la percepción visual.
"Un niño de cuatro años ha visto tantos datos como el LLM más grande en forma de percepción visual y para los niños ciegos, es el tacto", dijo LeCun. "Eso te dice varias cosas. Nunca alcanzaremos la inteligencia humana solo entrenando con texto”.
Esta observación ha empujado a los investigadores a explorar nuevos enfoques. En Meta, el equipo de LeCun incluso se ha alejado por completo del término "inteligencia general artificial", prefiriendo "inteligencia artificial avanzada" (AMI). "La razón es que la inteligencia humana está bastante especializada, por lo que llamarla AGI es un nombre inapropiado", dijo LeCun.
LeCun piensa que necesitamos replantearnos completamente cómo evolucionará la IA. En lugar de intentar copiar el cerebro humano, quiere cambiar la forma en que la IA aprende sobre el mundo y le da sentido. Argumenta que la IA necesita construir su propia imagen mental de la realidad tomando información a través de sus "sentidos", como aprender cómo se comportan los objetos físicos con solo mirar videos. Estos sistemas de IA tendrían que recordar las cosas de forma coherente y saber cómo planificar sus acciones paso a paso para hacer las cosas.
Los informáticos difieren sobre cómo los sistemas de IA podrían desarrollar su propia comprensión del mundo. El Profesor Emérito de la Universidad de Washington Pedro Domingos ve el progreso como posible pero no inmediato. "Es totalmente realista construir IA que desarrollen sus propios modelos mundiales", dijo a IBM Think, "pero aún no sabemos cómo y se necesita más investigación".
Las capacidades actuales de la IA no alcanzan el razonamiento a nivel humano, especialmente en el manejo de tareas complejas. Como dice Russell: "Desde la década de 1960, hemos comprendido que el uso de modelos mundiales simples y uniformes conduce a problemas de razonamiento y planificación completamente intratables. (Imagínese intentar planificar unas vacaciones calculando de antemano la secuencia exacta de los 800 millones de activaciones musculares que serán necesarios).” Los humanos, señala, procesan la información de manera diferente: "La principal herramienta que los humanos utilizan para superar esto es la jerarquía: operamos con muchos modelos en muchos niveles de abstracción, desde grandes acciones de alto nivel... hasta pequeñas acciones de bajo nivel, como mover un dedo para escribir la siguiente letra 'i' en este correo electrónico".
