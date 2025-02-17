Tu gato de casa podría ser más inteligente que ChatGPT. Si bien la inteligencia artificial ahora puede escribir poesía y aprobar los exámenes de la facultad de derecho, todavía no puede igualar las habilidades básicas de razonamiento que permiten a tu atigrado navegar por las repisas de las ventanas y abaltarse sobre sus presas.
Esa brecha, entre el dominio del conocimiento humano por parte de la IA y su incapacidad para igualar la comprensión del mundo físico que tienen los animales, se ha convertido en un reto crucial en la búsqueda de máquinas más inteligentes. El científico jefe de inteligencia artificial de Meta, Yann LeCun, puso el tema en el foco de atención la semana pasada en una cumbre sobre seguridad de la IA en París, argumentando que los “modelos mundiales” (sistemas de IA que forman representaciones internas de estructura, dinámica y relaciones causales) podrían ser clave para el avance de la inteligencia artificial.
Sin embargo, algunos investigadores líderes cuestionan si este enfoque es tan innovador como podría parecer.
“La IA estuvo empleando modelos mundiales desde la década de 1950, y varios subcampos de la IA dependen completamente de modelos mundiales”, Stuart J. Russell, profesor de Ciencias de la Computación en la Universidad de California en Berkeley, dijo a IBM Think. "Es tan novedoso e ingenioso como sugerir que las matemáticas podrían ser útiles para la física".
El debate destaca una persecución cada vez más intensa para lograr inteligencia artificial general (AGI), o sistemas de IA que puedan igualar o superar el aprendizaje y el razonamiento a nivel humano en prácticamente cualquier dominio. A diferencia de los sistemas de IA especializados actuales, que se destacan en tareas limitadas como el ajedrez o el procesamiento del lenguaje, la AGI necesitaría comprender el mundo de manera más fundamental, combinando habilidades de razonamiento, comprensión física y adaptabilidad.
Las principales empresas tecnológicas han adoptado diferentes enfoques para este desafío. OpenAI, a través de su serial GPT, se centró en ampliar los modelos de lenguaje para lograr un razonamiento cada vez más sofisticado. Google DeepMind, con sistemas como AlphaFold y AlphaGo, se ha centrado en ámbitos específicos mientras trabaja para desarrollar capacidades más generales. Mientras tanto, Meta ha destacado la importancia de aprender de la interacción en el mundo real, en lugar de solo del texto.
“No importa intentar reproducir la inteligencia humana”, dijo LeCun en la cumbre. “Ni siquiera podemos reproducir la inteligencia de los gatos o la inteligencia de las ratas. Cualquier gato doméstico puede planificar acciones muy complejas”.
En los últimos años, los sistemas de IA han aumentado rápidamente sus puntuaciones en puntos de referencia en ámbitos específicos. Pero LeCun señala lo que los investigadores llaman la paradoja de Moravec.:la observación de que las habilidades que los humanos encuentran fáciles a menudo resultan más difíciles de dominar para las máquinas.
"Las cosas que damos por sentado porque los humanos y los animales pueden hacerlo, Think que no es complicado—en realidad es muy complicado", dijo LeCun. "Y las cosas que pensamos que son exclusivamente humanas, como manipular y generar lenguaje, jugar al ajedrez, jugar al go... resultan ser relativamente fáciles".
Esta paradoja, que la IA sobresale en tareas que consideramos intelectualmente exigentes mientras lucha con habilidades físicas y perceptivas aparentemente básicas, genera escepticismo en algunos expertos.
"El proceso de pasar de una secuencia de imágenes retinianas a, por ejemplo, las ecuaciones de Maxwell para el electromagnetismo tomó a la raza humana decenas de miles de años y requirió un proceso acumulativo de formación de conceptos y matematización", dice Russell. "No he visto nada parecido a esto en los sistemas actuales de aprendizaje profundo".
Para ilustrar las limitaciones actuales, LeCun señaló una comparación llamativa: los LLM modernos capacitan con billones de tokens, una cantidad de texto que a un humano le llevaría medio millón de años leer. Sin embargo, un niño de cuatro años, despierto durante solo unas 16 000 horas, procesa una cantidad comparable de datos solo a través de la percepción visual.
"Un niño de cuatro años ha visto tantos datos como el LLM más grande en forma de percepción visual, y para los niños ciegos, es el tacto", dijo LeCun. “Eso te dice varias cosas. Nunca vamos a llegar a la inteligencia a nivel humano simplemente entrenando en texto”.
Esta observación ha llevado a los investigadores a explorar nuevos enfoques. En Meta, el equipo de LeCun se movió completamente lejos del término "inteligencia general artificial", prefiriendo "inteligencia artificial avanzada" (AMI). "La razón es que la inteligencia humana es bastante especializada, por lo que llamarla AGI es un nombre inapropiado", dijo LeCun.
LeCun cree que debemos repensar completamente cómo evolucionará la IA. En lugar de intentar copiar el cerebro humano, quiere cambiar la forma en que la IA aprende y da sentido al mundo. Sostiene que la IA necesita construir su propia imagen mental de la realidad tomando información a través de sus “sentidos”, como aprender cómo se comportan los objetos físicos con solo ver videos. Estos sistemas de IA necesitarían recordar las cosas de manera consistente y saber cómo planificar sus acciones paso a paso para hacer las cosas.
Los informáticos difieren sobre cómo los sistemas de IA podrían desarrollar su propia comprensión del mundo. Profesor Emérito de la Universidad de Washington Pedro Domingos Ve el progreso como posible pero no inmediato. "Es completamente realista construir IA que desarrollen sus propios modelos mundiales", dijo a IBM Think, "pero aún no sabemos cómo, y se necesita más investigación".
Las capacidades actuales de la IA no alcanzan el nivel de razonamiento humano, especialmente en el manejo de tareas complejas. Como dice Russell: “Desde la década de 1960, hemos entendido que el uso de modelos mundiales simples y uniformes conduce a problemas de razonamiento y planificación completamente intratables. (Imagínese tratar de planificar unas vacaciones calculando de antemano la secuencia exacta de 800 millones de activaciones musculares que se necesitarán)”. Los humanos, señala, procesan la información de manera diferente: "La principal herramienta que utilizan los humanos para superar esto es la jerarquía: operamos con muchos modelos en muchos niveles de abstracción, desde grandes acciones de alto nivel... hasta pequeñas, acciones de bajo nivel, como mover un dedo para escribir la siguiente letra 'i' en este correo electrónico".
