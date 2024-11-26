Hace dos años, OpenAI, una startup de San Francisco fundada como organización sin fines de lucro en 2015 por Sam Altman, Greg Brockman, Elon Musk, Ilya Sutskever, Wojciech Zaremba y John Schulman, abrió su chatbot de IA para pruebas. El lanzamiento despertó entusiasmo, preguntas e incluso algunos experimentos (¿recuerda este episodio de The Daily?). Avancemos rápidamente hasta noviembre de 2024, y ChatGPT ahora tiene más de 200 millones de usuarios activos semanales, mientras que OpenAI continúa expandiéndose a través de asociaciones con gigantes tecnológicos como Microsoft y Apple.
Entonces, ¿cómo cambió el lanzamiento de ChatGPT el escenario de la IA? Hablamos con expertos de IBM sobre cómo la IA ha evolucionado en los últimos dos años y continúa transformándose.
La inteligencia artificial se remonta a décadas. En los años cincuenta, por ejemplo, IBM ya estaba entrenando algunas de las primeras redes neuronales, usando damas y backgammon para entrenar máquinas que superaran a los grandes maestros. Pero el lanzamiento de ChatGPT, con su interfaz de lenguaje natural simple y de uso gratuito, marcó un importante punto de inflexión.
"Lo diferente de ChatGPT es que realmente brindó a los consumidores una gran experiencia y permitió que personas sin conocimientos técnicos usaran la IA para cosas increíbles", dice Chris Hay, ingeniero distinguido de IBM.
El efecto ha sido poner una tecnología poderosa, que antes solo era accesible en su mayoría para las empresas más ricas, en manos de cualquier persona con una computadora y una conexión a Internet. Mientras tanto, el movimiento de OpenAI obligó a otras empresas a lanzar sus propias herramientas poderosas, impulsando el surgimiento de una nueva clase de programadores y emprendedores centrados en la innovación de IA en todo el mundo.
"El escenario económico global cambia fundamentalmente cuando la IA se vuelve tan accesible como la electricidad", dice Shobhit Varshney, vicepresidente y socio sénior de IBM Consulting. Una señal de este cambio, dice Varshney, es la cantidad sin precedentes de programadores que se unen a GitHub de todo el mundo, con Python, un lenguaje de programación utilizado principalmente para IA y machine learning, convirtiéndose en el lenguaje más popular en la plataforma.
“Ahora la gente puede aprovechar estas herramientas sin necesidad de millones de dólares de inversión”, afirma. “Pronto veremos unicornios unipersonales”.
Chris Hay dice que su momento revelador con ChatGPT llegó apenas unas semanas después del lanzamiento del chatbot cuando intentaba trabajar en su propio lenguaje de programación. Rápidamente se encontró pidiendo feedback a GPT.
“Fue entonces cuando pensé: '¡Santo cielo! Estoy teniendo una conversación adecuada aquí sobre el diseño de mi lenguaje de programación. ¡Tengo un colaborador!'”
Dos años después, el 92 % de los líderes empresariales encuestados por IBM Institute for Business Value afirma que integrarán la IA en sus flujos de trabajo para 2025. Ya ha habido un impulso para integrar la IA en los servicios y productos orientados al consumidor, como Apple Intelligence, Adobe y Meta AI.
“Ahora, todo lo que tocamos es IA generativa”, dice Hay.
Los LLM comenzaron con texto. Pero desde entonces, la industria ha comenzado a avanzar hacia modelos multimodales, que pueden integrar y procesar múltiples tipos de datos, incluidas imágenes, audio, video, texto o código.
Los modelos ahora pueden interactuar con varios tipos de datos más allá de la palabra escrita y procesarlos, lo que está abriendo un mundo completamente nuevo de aplicaciones para la IA, como el descubrimiento de medicamentos y el seguimiento del clima.
"No tiene que ser solo texto o código, por lo que ha habido un gran auge de las diferentes modalidades que los modelos de IA pueden entender, representar y luego crear", dice Varshney.
Los humanos combinan todos sus sentidos para tomar una decisión, y ahí es donde se dirige la IA, dice.
Uno de los principales desarrollos de este año ha sido la aparición de los llamados “modelos de razonamiento”. Estos modelos, como la serie o1 de OpenAI, aplican el razonamiento en cadena de pensamiento , lo que significa que pueden reflejar el razonamiento humano y utilizar deducciones lógicas para resolver problemas complejos.
“Lo que estamos viendo ahora es que los modelos están empezando a pensar más y a encontrar una respuesta”, dice Hay. “Aún no es razonamiento humano, y 'razonamiento' es un término muy usado, pero al menos es capaz de reflexionar sobre lo que hace y llegar a una respuesta de mayor calidad invirtiendo más tiempo”.
El GPT-3 original contaba con 175 000 millones de parámetros. Hoy en día, los modelos más pequeños, algunos con tan solo 2000 millones de parámetros, están superando a los mejores modelos de hace 18 meses.
“Los modelos son cada vez más pequeños, y cada vez son más capaces porque están siendo mejor entrenados”, dice Hay. “Ese es el camino que quiero ver: cuanto más grande es un modelo, más lento es. Quiero modelos que se ejecuten en mi propio dispositivo”.
¿Está la IA llegando a su límite? La pregunta siempre está al acecho, y una historia reciente de Reuters que citaba a un cofundador de OpenAI sobre el entrenamiento previo y el escalado de la IA provocó muchos comentarios públicos sobre los retrasos en el entrenamiento de nuevos modelos de lenguaje para utilizar formas más humanas de "pensar".
Pero Varshney cree que evaluar la IA en términos de habilidades humanas es un error.
"La IA no debe juzgarse por los niveles de inteligencia humana, porque los humanos son buenos en algunas cosas y pésimos en otras", dice. “No queremos que la IA replique a los humanos; queremos que la IA sea realmente buena en lo que hace”.
Como ejemplo, señala la historia de un electrodoméstico común. "No esperábamos que un lavavajillas se pusiera de pie y comenzara a lavar los platos como lo hace un humano", dice. Cree que necesitamos mejores formas de evaluar en qué es realmente buena la IA.
Lejos de chocar contra una pared, Hay cree que la IA todavía tiene mucho espacio para crecer, gracias en gran parte a los datos sintéticos. "Vamos a necesitar menos datos para entrenar modelos, y los modelos se centrarán en diferentes tipos de cambios arquitectónicos", afirma. “Habrá avances y el hardware mejorará. Así que no creo que haya un muro”.
OpenAI sigue siendo visto como líder en la carrera por la innovación y el despliegue de IA. Varshney cree que OpenAI todavía no tiene un competidor serio, dos años después del lanzamiento de ChatGPT. Hay está de acuerdo, en gran parte porque considera que OpenAI sigue ofreciendo la mejor experiencia de usuario para los consumidores.
"Sigo usando ChatGPT, porque es una mejor experiencia para el consumidor", dice. Aun así, reconoce que el campo se mueve rápidamente. Varios exlíderes y científicos de OpenAI han fundado nuevas empresas, como Anthropic y Safe Superintelligence Inc., y el mercado continúa inundado de nuevas funcionalidades y características.
“¿Quién ganará la carrera? Espero que nadie”, dice Hay. "En un mundo en el que [solo] una empresa gana la carrera y todos perdemos, mientras que [cuando] hay una competencia sana, todos tenemos acceso a grandes innovaciones de IA".