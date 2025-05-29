La mentalidad de escalar primero en OpenAI no fue simplemente una conclusión técnica. Fue el resultado de un sistema de creencias coherente, aunque poco ortodoxo, compartido por sus líderes, señala Hao. Dijo que Ilya Sutskever, el científico jefe de OpenAI, era un absolutista del deep learning. Creía que una red neuronal suficientemente grande, si se alimentaba con suficientes datos, acabaría desarrollando una inteligencia similar a la humana. Por otro lado, Sam Altman, CEO de OpenAI, se acercó a la inteligencia artificial como empresario, viendo el escalado exponencial como el camino más rápido hacia el dominio. Greg Brockman, el presidente de OpenAI, era la mente ingeniera que se centraba en lograr esa escalabilidad.

La arquitectura que permitió esta doctrina fue el transformador, un tipo de red neuronal introducida por primera vez en 2017. Los transformadores destacan en el modelado de secuencias de datos, como el texto, porque pueden rastrear las relaciones entre palabras a lo largo de largas distancias en una frase. Lo que es más importante, se pueden ampliar de manera eficiente. Agregar más capas y más parámetros mejora el rendimiento.

El equipo de investigación de OpenAI se dio cuenta de que si entrenaban transformadores en un conjunto de datos lo suficientemente masivo con suficiente potencia computacional, podrían evitar la necesidad de características artesanales, razonamiento simbólico o diseño modular. La inteligencia, en su opinión, surgiría de los datos.

Para entrenar modelos como GPT-4, OpenAI no solo necesitaba ideas, sino también infraestructura. Los modelos de lenguaje de este tamaño requieren clústeres de decenas de miles de unidades de procesamiento gráfico. Diseñadas inicialmente para renderizar imágenes tridimensionales, las GPU demostraron ser excepcionalmente útiles para las multiplicaciones de matrices en el corazón de las redes neuronales. Pero unirlos para que actuaran como un sistema unificado requería una orquestación personalizada de software y hardware.

Los ingenieros de OpenAI desarrollaron técnicas para dividir los modelos en fragmentos, que podían distribuirse en varios chips y entrenarse en paralelo. Crearon protocolos de puntos de control para preservar las ejecuciones de entrenamiento parciales, reduciendo el riesgo de fallo catastrófico. Construyeron protocolos de comunicación personalizados para sincronizar las actualizaciones entre las máquinas. No se trataba de avances glamurosos, pero eran esenciales.

“Nadie había entrenado antes con 10 000 chips”, afirma Hao. "Tuvieron que resolverlo en tiempo real".

Estos avances permitieron ampliar los modelos con mayor rapidez y eficiencia que la competencia. Pero también contribuyeron a un nuevo tipo de secretismo. OpenAI dejó de publicar muchos de los detalles detrás de sus avances. Revelar demasiado, argumentó la empresa, sería regalar una ventaja competitiva.

Para 2024, la mayoría de las grandes empresas tecnológicas ya se habían puesto al día. IBM, Google, Meta, Amazon, Anthropic y los nuevos participantes, como Mistral, han producido modelos de lenguaje de gran tamaño utilizando arquitecturas de transformadores y técnicas de entrenamiento similares. Muchos utilizaron el aprendizaje reforzado con feedback, un método en el que los humanos valoran la calidad de los outputs de un modelo, lo que permite ajustar el modelo para que se alinee mejor con las preferencias humanas.

Para los forasteros, las diferencias entre estos sistemas se hicieron más difíciles de discernir. Los desarrolladores de aplicaciones comenzaron a diseñar interfaces que podían funcionar con cualquier modelo en segundo plano, lo que les permitía cambiar de proveedor según fuera necesario. El precio, la latencia y el tiempo de actividad pasaron a ser más importantes que las diferencias marginales de inteligencia.

"Todo el mundo está tratando de ser independiente del modelo ahora", dice Hao. "OpenAI ya no tiene el monopolio de los buenos modelos".

Como la escala ya no era un elemento diferenciador, las empresas empezaron a invertir en un paradigma diferente: la agencia. En inteligencia artificial, la agencia se refiere a la capacidad de un sistema para tomar la iniciativa, persistir en el tiempo y actuar en pos de sus objetivos. En lugar de reaccionar a una instrucción, un agente planifica acciones, monitoriza los resultados y ajusta su comportamiento.

Esto requería nuevas capacidades. Los modelos tenían que mantener la memoria a lo largo de las sesiones, integrarse con herramientas de terceros y tomar decisiones sin instrucciones explícitas. El objetivo era pasar de un chatbot pasivo a un colaborador activo.

OpenAI se había inspirado durante mucho tiempo en la película "Her", en la que un usuario se enamora de un asistente de IA que se adapta de manera fluida a sus necesidades. Crear un sistema de este tipo significaba desarrollar no solo la inteligencia, sino también la presencia. Hao señaló que los equipos internos de OpenAI han perseguido este sueño en todos los dominios de productos e investigación.

"No se puede crear ese tipo de asistente sin dotar al modelo de memoria, persistencia y autonomía", afirma.

Pero para que los agentes fueran realmente eficaces, OpenAI necesitaba algo más que algoritmos. Necesitaba nuevos tipos de datos y nuevas formas de recopilarlos. Internet, que antes era una fuente abundante de datos de entrenamiento, se ha saturado de contenido sintético. Muchos de los documentos que ahora están disponibles en línea fueron generados por modelos anteriores.

Esto crea un bucle de feedback en el que la formación en línea se vuelve cada vez menos valiosa. Para romper el ciclo, las empresas están recurriendo a una recopilación de datos más íntima. Hao informó de que OpenAI está explorando dispositivos personalizados que podrían capturar el comportamiento del usuario en tiempo real, desde las interacciones móviles hasta las conversaciones de voz y el contexto ambiental.

"Hay demasiado contenido generado por IA en línea", dice Hao. "Si quiere datos de alta calidad, tiene que obtenerlos directamente de las personas".

La creciente avalancha de contenidos generados por la IA, afirma Hao, plantea cuestiones difíciles sobre el consentimiento, la vigilancia y el control. ¿Pueden las personas realmente elegir que no se recopilen sus datos? ¿Y qué tendrán que decir sobre los modelos entrenados con sus palabras, imágenes o comportamiento?

Para Hao, la respuesta no reside en el optimismo tecnológico ni en el catastrofismo, sino en la transparencia. No suscribe las ideologías dominantes en la IA, lo que ella llama los "boomers", que creen que la inteligencia artificial salvará a la humanidad, o los "doomers" que temen que nos destruya.

"Estoy en el bando de la responsabilidad", dice. "Estos sistemas reflejan el poder institucional. Necesitamos saber cómo se hacen y quién se beneficia”.

Las empresas deben explicar cómo se prueban sus modelos, qué datos utilizan y cómo dan sentido a los resultados, afirma Hao. Deben realizar un seguimiento de los errores y compartir sus hallazgos para que otros puedan examinarlos más de cerca.

Sin este tipo de apertura, advierte Hao, la IA corre el riesgo de convertirse en una caja negra patentada: poderosa, pero irresponsable.