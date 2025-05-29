La mentalidad de escalar primero en OpenAI no fue simplemente una conclusión técnica. Fue el resultado de un sistema de creencias coherente, aunque poco ortodoxo, compartido por su liderazgo, señala Hao. Dijo que Ilya Sutskever, el científico jefe de OpenAI, era un absolutista del aprendizaje profundo. Creía que una red neuronal lo suficientemente grande, si se alimentaba con suficientes datos, eventualmente desarrollaría una inteligencia humana. Por otro lado, Sam Altman, CEO de OpenAI, se acercó a la inteligencia artificial como emprendedor y vio el escalamiento exponencial como el camino más rápido hacia el dominio. Greg Brockman, presidente de OpenAI, fue la mente de ingeniería enfocada en hacer que esa escala sucediera.

La arquitectura que permitió esta doctrina fue el transformador, un tipo de red neuronal introducida por primera vez en 2017. Los transformadores destacan en el modelado de secuencias de datos, como el texto, porque pueden rastrear las relaciones entre palabras a lo largo de grandes distancias en una oración. Y lo que es más importante, se pueden ampliar de manera eficiente. Agregar más capas y más parámetros mejora el rendimiento.

El equipo de investigación de OpenAI se dio cuenta de que si entrenaban transformadores en un conjunto de datos lo suficientemente masivo con suficiente Power, podrían eludir la necesidad de características artesanales, razonamiento simbólico o diseño modular. La inteligencia, en su opinión, surgiría de los datos.

Para entrenar modelos como GPT-4, OpenAI necesitaba no solo ideas, sino también infraestructura. Los modelos de lenguaje de este tamaño requieren clústers de decenas de miles de unidades de procesamiento de gráficos. Diseñadas inicialmente para representar imágenes tridimensionales, las GPU demostraron ser excepcionalmente útiles para las multiplicaciones de matrices en el corazón de las redes neuronales Pero unirlos para que actuaran como un sistema unificado requería una orquestación personalizada de software y hardware.

Los ingenieros de OpenAI desarrollaron técnicas para dividir los modelos en fragmentos, que podrían distribuirse en varios chips y entrenarse en paralelo. Crearon protocolos de puntos de control para preservar las ejecuciones de entrenamiento parciales, reduciendo el riesgo de fallas catastróficas. Crearon protocolos de comunicación personalizados para sincronizar las actualizaciones entre máquinas. Estos no fueron avances glamorosos, pero fueron esenciales.

"Nadie había entrenado antes con 10 000 chips", dice Hao. "Tenían que resolverlo en tiempo real".

Estos avances permitieron ampliar los modelos de forma más rápida y eficiente que la competencia. Pero también contribuyeron a un nuevo tipo de secreto. OpenAI dejó de publicar muchos de los detalles detrás de sus avances. Divulgar demasiado, argumentó la empresa, sería regalar una ventaja competitiva.

Para 2024, la mayoría de las principales empresas tecnológicas se habían puesto al día. IBM, Google, Meta, Amazon, Anthropic y los nuevos participantes, como Mistral, han producido grandes modelos de lenguaje utilizando arquitecturas transformadoras y técnicas de entrenamiento similares. Muchos utilizaron el aprendizaje por refuerzo con retroalimentación humana, un método en el que los humanos califican la calidad de los resultados de un modelo, lo que permite ajustar el modelo para alinearse mejor con las preferencias humanas.

Para quienes no estaban dentro de todo esto, las diferencias entre estos sistemas se hicieron más difíciles de discernir. Los desarrolladores de aplicaciones comenzaron a diseñar interfaces que pudieran funcionar con cualquier modelo en segundo plano, lo que les permitía cambiar de proveedor según fuera necesario. El precio, la latencia y el tiempo de actividad se volvieron más importantes que las diferencias marginales en inteligencia.

"Todos están tratando de ser independientes del modelo ahora", dice Hao. "OpenAI ya no tiene el monopolio de los buenos modelos".

Dado que la escala ya no era un diferenciador, las empresas comenzaron a invertir en un paradigma diferente: la agencia. En inteligencia artificial, la agencia se refiere a la capacidad de un sistema para tomar la iniciativa, persistir en el tiempo y actuar para alcanzar sus objetivos. En lugar de reaccionar ante una instrucción, un agente planifica acciones, supervisa los resultados y ajusta su comportamiento.

Esto requería nuevas capacidades. Los modelos tenían que mantener la memoria en todas las sesiones, integrarse con herramientas de terceros y tomar decisiones sin instrucciones explícitas. El objetivo era mover de un chatbot pasivo a un colaborador activo.

OpenAI se inspiró durante mucho tiempo en la película "Her", en la que un usuario se enamora de un asistente de IA que se adapta perfectamente a sus necesidades. Crear un sistema de este tipo significaba desarrollar no solo inteligencia, sino también presencia. Hao señaló que los equipos internos de OpenAI han perseguido este sueño en todos los dominios de productos e investigación.

“No se puede construir ese tipo de asistente sin darle al modelo memoria, persistencia y autonomía”, dice.

Pero para que los agentes fueran realmente eficaces, OpenAI necesitaba algo más que algoritmos. Necesitaba nuevos tipos de datos y nuevas formas de recopilarlos. Internet, que antes era una fuente abundante de datos de entrenamiento, se saturó de contenido sintético. Muchos de los documentos que ahora están disponibles en línea fueron generados por modelos anteriores.

Esto crea un ciclo de retroalimentación en el que la capacitación en línea se vuelve cada vez menos valiosa. Para romper el ciclo, las empresas están recurriendo a una recopilación de datos más íntima. Hao informó que OpenAI está explorando dispositivos personalizados que podrían capturar el comportamiento del usuario en tiempo real, desde interacciones móviles hasta conversaciones de voz y contexto ambiental.

"Hay demasiado contenido generado por IA en línea", dice Hao. “Si quieres datos de alta calidad, tienes que obtenerlos directamente de las personas”.

La creciente avalancha de contenido generado por IA, dice Hao, plantea preguntas difíciles sobre el consentimiento, la vigilancia y el control. ¿Pueden las personas realmente elegir que no se recopilen sus datos? ¿Y qué opinan sobre los modelos entrenados con sus palabras, imágenes o comportamiento?

Para Hao, la respuesta no radica en el tecnooptimismo o la fatalidad, sino en la transparencia. Ella no suscribe las ideologías dominantes en la IA, a lo que ella llama los "boomers", que creen que la inteligencia artificial salvará a la humanidad, o los "doomers", que temen que nos destruya.

“Estoy en el campo de la responsabilidad”, dice ella. “Estos sistemas reflejan el poder institucional. Necesitamos saber cómo se hacen y quién obtiene beneficio”.

Las empresas deben explicar cómo se prueban sus modelos, qué datos utilizan y cómo dan sentido a los resultados, dice Hao. Deben realizar un seguimiento de los errores y compartir sus hallazgos para que otros puedan observarlos más de cerca.

Sin este tipo de apertura, advierte Hao, la IA corre el riesgo de convertirse en una caja negra patentada, poderosa, pero que no rinde cuentas.