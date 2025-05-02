En una mañana gris de Oxford (Inglaterra), Christopher Summerfield está sentado en su oficina del Departamento de Psicología Experimental, con el manuscrito de un libro apilado cuidadosamente en un extremo de su escritorio. Había sido una temporada ajetreada. Entre su investigación sobre la cognición humana, colaboraciones con laboratorios de IA y un calendario completo de clases, Summerfield había encontrado tiempo para escribir These Strange New Minds: How AI Learned to Talk and What It Means ("Estas extrañas mentes nuevas: cómo la IA aprendió a hablar y qué significa eso".
El nuevo libro es, en parte, historia, en parte, manifiesto y, en parte, reflexión sobre una cuestión que lleva mucho tiempo inquietando a tecnólogos y filósofos: cuando las máquinas parecen pensar, ¿qué está sucediendo realmente?
El libro de Summerfield llega en un momento crucial. Los avances en IA, desde el lanzamiento de modelos multimodales como GPT-4 hasta avances inspirados en el cerebro como el chip NorthPole de IBM, están remodelando la forma en que los científicos, los responsables políticos y el público entienden la inteligencia artificial. A medida que los sistemas de IA se vuelven más capaces, su estado cognitivo (si son realmente capaces de razonar, planificar y pensar) se ha convertido en uno de los debates más urgentes y polémicos de nuestro tiempo. En These Strange New Minds, Summerfield argumenta que para comprender el futuro de la IA, primero es necesario comprender la naturaleza del razonamiento humano y reconocer tanto los paralelismos como las diferencias entre las mentes biológicas y artificiales.
Summerfield, profesora de neurociencia cognitiva en la Universidad de Oxford, dirige el laboratorio de procesamiento de información humana (HIP), un grupo de investigación que estudia cómo los humanos y los sistemas artificiales aprenden, categorizan la información y toman decisiones. Su trabajo combina experimentos de comportamiento, modelado computacional y análisis de datos neuronales, a menudo explorando las similitudes entre la función cerebral y el machine learning. Su investigación se sitúa en la intersección de la ciencia cognitiva, la IA y las ciencias sociales, campos que convergen cada vez más a medida que los modelos de IA se vuelven más complejos.
El Departamento de Psicología Experimental, ubicado actualmente en un conjunto de edificios desgastados por el paso del tiempo en las afueras del Área Científica de Oxford, parece un espacio en transición: las pizarras blancas están repletas de diagramas y el olor a madera vieja convive incómodamente con el de los nuevos cables eléctricos. Pronto, Summerfield y sus colegas se trasladarán al Life and Mind Building, un reluciente complejo de piedra clara y cristal en el que se están construyendo salas de electroencefalografía, laboratorios del sueño y salas de seguimiento ocular, con fachadas limpias y modernas. Sin embargo, aunque la universidad está renovando su infraestructura, el ambiente dentro del edificio sigue siendo el mismo: serio, pausado e impregnado de la tranquila intensidad de las personas que dedican su vida a tratar de comprender cómo se forma la mente, ya sea humana o de otro tipo.
Fuera de su laboratorio, Summerfield imparte un curso llamado "Cómo construir un cerebro desde cero", que se basa en la psicología, la neurociencia y la IA para examinar los principios subyacentes del aprendizaje y la inferencia. Es conocido por enfatizar la claridad y la accesibilidad, rasgos que se han vuelto cada vez más importantes a medida que los debates sobre IA van más allá de los círculos técnicos y entran en un debate público más amplio.
Durante nuestra entrevista, Summerfield parece relajado pero concentrado. Su pelo se recoge en mechones rebeldes, enmarcando un rostro abierto y animado cuando discute ideas. Lleva un sencillo suéter oscuro y unas gafas con montura metálica, lo que le da la apariencia de alguien más preocupado por resolver problemas que por cultivar una imagen pulida. Detrás de él, una pizarra blanca repleta de flechas, ecuaciones y diagramas capta la luz de la mañana.
"Hay una tendencia a enmarcar la IA de estas formas totalmente opuestas", dice. "Por un lado, los optimistas creen que muy pronto tendremos tecnologías más inteligentes que los humanos. Por otro lado, los escépticos ven la IA como una exageración, como una herramienta más de las corporaciones para controlarnos".
Los acontecimientos recientes le han dado perspectivas y material con el que trabajar. Modelos como GPT-4, Claude y Granite de IBM han demostrado capacidades de razonamiento más amplias, yendo más allá de sistemas anteriores que simplemente predecían la siguiente palabra en una secuencia. Los investigadores también están desarrollando marcos multiagente en los que varios sistemas de IA colaboran o compiten para resolver tareas, un enfoque que algunos ven como un paso hacia comportamientos emergentes más complejos.
Mientras tanto, empresas como IBM persiguen diseños inspirados en el cerebro. El chip NorthPole, por ejemplo, está diseñado para imitar aspectos de las redes neuronales biológicas, haciendo hincapié en la eficiencia energética y el procesamiento paralelo sobre la potencia computacional bruta. Para Summerfield, estos esfuerzos reflejan una creciente toma de conciencia de que la ampliación de los métodos convencionales de IA puede no ser suficiente y que nuevos modelos de inteligencia, extraídos de la biología, podrían señalar el camino a seguir.
Preguntamos a Summerfield si los modelos de lenguaje de gran tamaño (LLM) como ChatGPT pueden razonar, y él responde sin dudar: sí, dentro de ciertos límites.
"En un ámbito limitado, los sistemas de IA actuales razonan mejor que los humanos", afirma.
"Esto no es una sorpresa", añade. Las máquinas han superado el rendimiento humano en tareas de razonamiento especializadas durante décadas, comenzando, no con sistemas de juego de ajedrez como Deep Blue de IBM, sino desde 1956, cuando el programa Logic Theorist logró demostrar teoremas matemáticos que sus creadores no habían previsto.
Los LLM actuales no solo recuperan datos, sino que generan código, redactan ensayos y proponen soluciones a problemas complejos. La nueva frontera, conocida como IA multimodal, amplía aún más esta capacidad al permitir que los sistemas procesen imágenes, texto, audio y vídeo simultáneamente, un desarrollo que los investigadores esperan que se aproxime a formas de razonamiento más holísticas.
"Los modelos son mejores que la mayoría de las personas en la mayoría de las tareas cognitivas", dice Summerfield. Pero se apresura a añadir que siguen existiendo importantes limitaciones. Los modelos suelen tener dificultades con tareas que requieren una comprensión social más profunda, como la capacidad de navegar por las emociones, inferir intenciones o captar los matices tácitos que caracterizan la interacción humana.
"La interacción social es esencial para nuestra supervivencia", explica. "Los modelos no están entrenados en ese mundo. Les faltan algunas de las motivaciones y señales emocionales que hacen que el razonamiento social humano sea tan sofisticado”.
Estudios recientes han intentado comprobar si los sistemas de IA podrían desarrollar una "teoría de la mente"—la capacidad de atribuir estados mentales a otros. Algunos modelos experimentales muestran indicios de esta capacidad en entornos controlados, pero los investigadores coinciden en general en que la IA sigue muy rezagada respecto a los modelos mentales complejos e intuitivos que los humanos implementan a diario.
Summerfield señala que, si bien los sistemas actuales pueden simular aspectos del razonamiento lógico de manera impresionante, no entienden realmente lo que están haciendo. Les falta arraigarse en una experiencia vivida del mundo, una limitación fundamental que ninguna cantidad de sugerencias ingeniosas puede borrar por completo.
Y la naturaleza de estas diferencias se vuelve aún más clara cuando consideramos otro ingrediente esencial del pensamiento humano: la memoria.
Si la motivación da dirección a nuestros pensamientos, la memoria les da continuidad. Y en este aspecto también hay diferencias notables entre las máquinas y las mentes biológicas.
Los humanos poseen múltiples sistemas de memoria. La memoria a corto plazo se basa en la actividad eléctrica dinámica del cerebro, que permite a las personas retener y manipular información durante breves periodos. La memoria a largo plazo, por el contrario, implica cambios físicos en las conexiones neuronales, un proceso lento y adaptativo que permite a los individuos retener conocimientos, experiencias y habilidades a lo largo de años e incluso décadas.
En la ciencia cognitiva, los investigadores distinguen entre memoria episódica (recuerdos de eventos personales), memoria semántica (hechos y conceptos generales) y memoria procedimental (habilidades como andar en bicicleta). Los recuerdos emocionales, profundamente codificados por estructuras cerebrales como la amígdala, dan forma al comportamiento y a la toma de decisiones a lo largo de la vida.
En comparación, los modelos de IA actuales gestionan la memoria de forma muy diferente. Los LLM operan dentro de una ventana de contexto fija: retienen la información temporalmente durante la interacción, pero la descartan después. Cuando finaliza una conversación, la memoria del sistema se reinicia.
"Cuando interactúas con un modelo de lenguaje", dice Summerfield, "no hay una historia personal continua. No puede recordar quién es ni de qué habló a menos que esa información se transmita de forma explícita".
Esta limitación no es solo un inconveniente. En los humanos, la memoria permite la creación de una identidad personal, profundiza las relaciones y permite el desarrollo de la confianza, los matices y el significado compartido a lo largo del tiempo. Los sistemas de IA, al carecer de esto, siguen siendo fundamentalmente transaccionales: excelentes en la búsqueda de patrones en el momento, pero incapaces de construir un contexto duradero.
Algunos investigadores están intentando dotar a los sistemas de IA de memoria a largo plazo. Proyectos como la memoria de OpenAI para Chat-GPT permiten a los modelos recordar interacciones pasadas entre sesiones. Anthropic ha dicho que diseñó sus modelos Claude centrándose en la coherencia contextual en tramos más largos de diálogo. Sin embargo, estos enfoques son tempranos y plantean importantes preocupaciones técnicas y éticas en torno a la privacidad del usuario, la seguridad de los datos y los riesgos de manipulación.
Incluso si los desarrolladores pueden superar los obstáculos técnicos, la brecha filosófica sigue siendo profunda. La memoria humana no es sólo una base de datos de hechos; es maleable, emocional y subjetiva. Evoluciona con nuevas experiencias y adquiere nuevos significados.
"En los humanos, la memoria no es solo almacenamiento", señaló Summerfield. “Es una interpretación. “Es la reescritura continua del pasado a través de la lente del presente”.
Sin eso, argumentó, la IA siempre carecerá de un elemento central de lo que significa ser verdaderamente inteligente y genuinamente humano.
A pesar de las limitaciones actuales de los sistemas artificiales, Summerfield cree que el intento de construir máquinas pensantes ya está remodelando la forma en que los científicos entienden la inteligencia natural.
"De alguna manera, la IA actúa como una prueba de existencia", dice. "Si ciertas estrategias computacionales funcionan para las máquinas, sugiere que también podrían estar en juego en los sistemas biológicos".
Uno de los avances más sorprendentes ha sido el descubrimiento de que las arquitecturas de redes neuronales relativamente simples pueden producir comportamientos complejos cuando se amplían a gran escala, algo que antes se suponía que requería diseños mucho más sofisticados. Los modelos de transformadores, la base de sistemas como ChatGPT, Granite y Claude, han demostrado que el reconocimiento y la generalización de patrones a gran escala pueden surgir solo del entrenamiento estadístico.
Este éxito está empujando a los científicos cognitivos a revisar teorías antiguas sobre cómo los humanos aprenden, razonan y generalizan. En particular, desafía la idea de que la inteligencia debe estar codificada con intrincadas reglas simbólicas. En cambio, sugiere que gran parte del razonamiento humano puede surgir de mecanismos simples que operan sobre grandes cantidades de datos y experiencia.
Los modelos de IA modernos pueden inferir soluciones a problemas desconocidos, completar analogías y, bajo las condiciones adecuadas, incluso involucrarse en formas de metacognición: razonar sobre su razonamiento. Los desarrolladores no programaron explícitamente estas capacidades; surgieron espontáneamente del proceso de entrenamiento, reflejando algunos aspectos de la flexibilidad cognitiva humana.
Sin embargo, Summerfield se apresura a advertir contra las comparaciones fáciles. Aunque los cerebros y la IA pueden parecerse entre sí en un nivel abstracto, los sistemas subyacentes siguen siendo fundamentalmente diferentes. El cerebro humano, dice, evolucionó bajo presiones que incrustaron las emociones, las motivaciones y los sesgos en lo profundo del tejido cognitivo, características ausentes en gran medida en los sistemas de las máquinas.
"Hay similitudes sorprendentes a nivel algorítmico", dijo, "pero el sustrato, el medio en el que se instancia la inteligencia, es completamente diferente".
El pensamiento humano no es puramente lógico ni desapasionado. Está teñido por la emoción, guiado por el contexto social y moldeado por la necesidad de sobrevivir y reproducirse. Estas capas de complejidad dan lugar a comportamientos que los modelos de IA, a pesar de su brillantez estadística, no pueden replicar por completo.
Aun así, argumenta Summerfield, el proceso de construcción y estudio de la IA está ayudando a los investigadores a perfeccionar su comprensión de lo que es la inteligencia: no una única capacidad, sino un fenómeno emergente que surge de muchas capacidades entrelazadas.
"Estamos aprendiendo tanto sobre nosotros mismos", dice, "como sobre las máquinas".
Si los esfuerzos por incorporar la memoria a la IA ponen de relieve las diferencias entre las máquinas y las mentes, la cuestión de la conciencia lleva el contraste aún más lejos.
La idea de que un sistema artificial puede llegar a ser consciente, de que puede tener experiencias subjetivas, una autopercepción o una vida mental interior, ha sido durante mucho tiempo uno de los debates más controvertidos de la ciencia cognitiva y la filosofía.
Summerfield aborda el tema con su característica precisión. Es escéptico, no porque vea la conciencia como algo exclusivamente mágico, sino porque la evidencia simplemente no apoya la idea de que los sistemas de IA actuales, por capaces que sean, posean algo que se parezca a una conciencia subjetiva.
"Cuando un modelo lingüístico dice 'Soy consciente'", explica, "está repitiendo patrones que ha aprendido de datos humanos. No hay ninguna razón para creer que esas palabras reflejan una realidad interna".
Los LLM como GPT-4 están entrenados para predecir el siguiente texto más plausible, no para generar experiencias introspectivas. Cuando se les pregunta por sus estados internos, pueden producir respuestas coherentes, pero la coherencia no es un indicador fiable de la consciencia.
Algunos investigadores han propuesto pruebas de comportamiento para la conciencia de las máquinas, examinando la complejidad, adaptabilidad y coherencia de las respuestas de la IA. Pero sin acceso a la experiencia, tales evaluaciones siguen siendo especulativas.
"Ya nos cuesta bastante evaluar la conciencia en animales no humanos", señala Summerfield. "Inferirla en sistemas sintéticos, construidos sobre sustratos completamente diferentes, es un problema aún más difícil".
En los sistemas biológicos, la conciencia parece surgir de la compleja interacción de miles de millones de neuronas, fuertemente entrelazadas con las emociones, las sensaciones corporales y un historial de experiencias encarnadas. Por el contrario, los modelos de IA actuales funcionan realizando transformaciones matemáticas de los datos de entrada, sin base sensorial ni contexto emocional.
Summerfield ofrece una analogía sencilla: "Se puede simular el comportamiento de un huracán en un ordenador". "Pero la simulación no es húmeda ni ventosa. Es una abstracción".
Del mismo modo, una IA puede simular los patrones externos de una conversación e, incluso, los autoinformes de la conciencia sin experimentar nada internamente. Sin sensación, encarnación ni impulso intrínseco, los modelos de IA siguen siendo poderosos pero vacíos. Son imitadores brillantes, más que mentes independientes.
Por ahora, Summerfield cree que lo más seguro y productivo es considerar los sistemas de IA como herramientas complejas, no como seres nacientes. Tratarlas de otro modo corre el riesgo de confundir imitación con comprensión, y distrae de la urgente labor de monitorizar su impacto en el mundo real.
A medida que nuestra conversación se desplaza hacia el futuro, Summerfield aborda un tema que ha surgido en silencio en todas nuestras discusiones: el gobierno.
"Estos sistemas son potentes", dice. "Y su desarrollo está impulsado en gran medida por incentivos comerciales."
Summerfield abraza la innovación tecnológica. Ve un potencial increíble en la IA para revolucionar áreas como la medicina, la educación y la investigación científica. Sin embargo, le preocupa que si no establecemos medidas de seguridad cuidadosas, los peligros puedan acabar superando a las ventajas.
"Necesitamos estructuras que garanticen que estas herramientas se desarrollen y utilicen de forma responsable", afirma. "Eso incluye barreras técnicas, pero también mecanismos legales, éticos y democráticos."
Están empezando a surgir algunos marcos de gobierno. La Ley de IA de la Unión Europea propone un enfoque basado en el riesgo, regulando las aplicaciones en función del daño potencial que puedan causar. En Estados Unidos, el proyecto de ley de derechos de la inteligencia artificial (Blueprint for an AI Bill of Rights) establece los principios para proteger a los ciudadanos de la discriminación y la explotación algorítmica. Mientras tanto, las organizaciones de investigación y los grupos de defensa están publicando buenas prácticas para un desarrollo y una implementación responsables.
Aún así, dice Summerfield, queda mucho por hacer. Afirma que muchos sistemas de IA de vanguardia se entrenan con conjuntos de datos masivos, sin el consentimiento explícito de los usuarios. Su funcionamiento interno es opaco, incluso para sus creadores, y su implementación a menudo carece de transparencia y responsabilidad significativas.
"No se trata solo de correcciones técnicas", dice. "Se trata de opciones sociales".
Opciones, quiere decir, sobre quién se beneficia de los avances de la IA: ¿quién asume los riesgos? ¿Quién controla las herramientas que cada vez más moldean nuestras economías, nuestros ecosistemas de información e incluso nuestras relaciones íntimas?
En última instancia, Summerfield ve la IA no como una inteligencia alienígena distante, sino como un reflejo de nosotros mismos, un espejo imperfecto que nos muestra tanto nuestras capacidades como nuestros puntos ciegos. Comprender lo que vemos en ese espejo, sostiene, será uno de los retos definitorios de los próximos años. Y, como deja claro These Strange New Minds , el trabajo de comprensión acaba de comenzar.
