Ninguna tecnología en la historia de la humanidad ha despertado tanto interés en tan poco tiempo como la IA generativa (IA gen). Muchas empresas tecnológicas líderes están invirtiendo miles de millones de dólares en el entrenamiento de modelos de lenguaje de gran tamaño (LLM). Pero, ¿puede esta tecnología justificar la inversión? ¿Podrá estar a la altura de las expectativas?
En la primavera de 2023, bastante tiempo en el espacio de la inteligencia artificial (IA), Goldman Sachs publicó un informe en el que estimaba que la aparición de la IA generativa podría impulsar el PIB mundial en un 7 % anual, lo que representaría más de 7 billones de dólares adicionales. cada año.
¿Cómo podría la IA generativa lograr esto? Las aplicaciones de esta tecnología son numerosas, pero generalmente pueden describirse como la mejora de la eficiencia de la comunicación entre humanos y máquinas. Esta mejora conducirá a la Automatización de tareas de bajo nivel y al aumento de las habilidades humanas, lo que permitirá a los trabajadores lograr más con mayor aptitud.
Debido a la amplia gama de aplicaciones y la complejidad de la IA generativa, muchos informes de los medios podrían llevar a los lectores a creer que la tecnología es una cura casi mágica. De hecho, esta perspectiva caracterizó gran parte de la cobertura en torno a la IA generativa a medida que el lanzamiento de ChatGPT y otras herramientas incorporaron la tecnología en 2022, y algunos analistas predijeron que estábamos al borde de una revolución que remodelaría el futuro del trabajo.
Ni siquiera dos años después, el entusiasmo mediático por la IA generativa se enfrió ligeramente. En junio, Goldman Sachs publicó otro informe con una evaluación más mesurada, en el que se cuestionaba si los beneficios de la IA generativa podían justificar la inversión de un billón de dólares en su desarrollo. El Financial Times, entre otros medios, publicó un artículo de opinión con una visión igualmente escéptica. El equipo del boletín Think de IBM resumió y respondió a algunas de estas incertidumbres en una publicación anterior.
Las fluctuaciones posteriores del mercado de valores llevaron a varios analistas a proclamar que la "burbuja de la IA" estaba a punto de estallar y que podría seguir una corrección del mercado en la escala del colapso de las puntocom de los años 90.
El escepticismo mediático sobre la IA generativa se puede desglosar en 4 crisis distintas a las que se enfrentan los desarrolladores:
Estos son obstáculos serios, pero muchos siguen siendo optimistas de que resolver el último problema (casos de uso) ayudará a resolver los otros 3. La buena noticia es que ya están identificando y trabajando en casos de uso significativos.
“La IA generativa está teniendo un impacto marcado y medible en nosotros y en nuestros clientes, cambiando fundamentalmente la forma en que trabajamos”, dice Chris Hay, ingeniero distinguido de IBM. "Esto se aplica a todas las industrias y disciplinas, desde la transformación de los procesos de RR. HH. y la Transformación en marketing a través del contenido de marca hasta los centros de contacto o el desarrollo de software". Hay cree que nos encontramos en la fase correctiva que suele seguir a un periodo de entusiasmo desenfrenado, y tal vez el reciente pesimismo de los medios de comunicación pueda considerarse un intento de equilibrar declaraciones anteriores que, en retrospectiva, parecen exageradas.
“No me gustaría ser ese analista”, dice Hay, refiriéndose a uno de los pronósticos recientes más sombríos sobre el futuro de la IA. "No me gustaría ser la persona que dice: 'La IA no va a hacer nada útil en los próximos 10 años', porque se te citará por el resto de tu vida".
Tales declaraciones pueden resultar tan miopes como las afirmaciones de que el Internet temprano no equivaldría a mucho o la suposición de 1943 del fundador de IBM, Thomas Watson, de que el mundo no necesitaría más de 5 computadoras. Hay sostiene que parte del problema es que los medios suelen confundir la IA generativa con una aplicación más limitada de chatbots impulsados por LLM como ChatGPT, que en realidad podrían no estar preparados para resolver todos los problemas que enfrentan las empresas.
Si empezamos a encontrar cuellos de botella en el suministro, ya sea en datos, computación o energía, Hay cree que los ingenieros serán creativos para resolver estos impedimentos.
“Cuando tienes una abundancia de algo, lo consumes”, dice Hay. “Si tienes cientos de miles de GPU, las vas a usar. Pero cuando tienes limitaciones, te vuelves más creativo”.
Por ejemplo, datos sintéticos representan una forma prometedora de dirección la crisis de datos. Estos datos se crean algorítmicamente para imitar las características de los datos del mundo real y pueden servir como alternativa o complemento a estos. Si bien los ingenieros de **machine learning** deben tener cuidado con el uso excesivo de datos sintéticos, un enfoque híbrido podría ayudar a superar la escasez de datos del mundo real a corto plazo. Por ejemplo, los modelos recientes de Microsoft PHI-3.5 o los modelos Hugging Face SMOL se entrenaron con cantidades sustanciales de datos sintéticos, lo que resultó en modelos pequeños altamente capaces.
Los LLM actuales necesitan energía, pero hay pocas razones para creer que los transformadores actuales son la arquitectura final. Los modelos basados en SSM, como Mistral Codestral Mamba, Jamba 1.5 o Falcon Mamba 1.5, están ganando popularidad debido a sus mayores capacidades de longitud de contexto. Las arquitecturas híbridas que utilizan varios tipos de modelos también están ganando terreno. Más allá de la arquitectura, los ingenieros están encontrando valor en otros métodos, como la cuantificación, los chips diseñados específicamente para la inferencia y el ajuste fino, una técnica de aprendizaje profundo que implica adaptar un modelo preentrenado para casos de uso específicos.
“Me encantaría ver más de una comunidad en torno al ajuste fino en la industria, en lugar de la precapacitación”, dice Hay. “El preentrenamiento es la parte más cara del proceso. El ajuste fino es mucho más barato y potencialmente puede obtener mucho más valor de él.
Hay sugiere que en el futuro podríamos tener más GPUs de las que sabemos qué hacer porque nuestras técnicas se volvieron mucho más eficientes. Recientemente experimentó con convertir una computadora portátil personal en una máquina capaz de entrenar modelos. Al reconstruir canales de datos más eficientes y experimentar con el procesamiento por lotes, está encontrando formas de trabajar dentro de las limitaciones. Naturalmente, podía hacer todo esto en una costosa GPU H100 Tensor Core, pero una mentalidad de escasez le permitió encontrar formas más eficientes de lograr los resultados deseados. La necesidad era la madre de la invención.
Los modelos son cada vez más pequeños y potentes.
“Si observa los modelos más pequeños de hoy, están entrenados con más tokens que los modelos más grandes del año pasado”, dice Hay. “La gente está metiendo más tokens en modelos más pequeños, y esos modelos son cada vez más eficientes y rápidos.”
“Cuando pensamos en aplicaciones de IA para resolver problemas empresariales reales, nos encontramos con que estos modelos especializados son cada vez más importantes”, afirma Brent Smolinksi, director global de tecnología, datos y estrategia de IA de IBM. Estos incluyen los llamados modelos de lenguaje pequeño y modelos no generativos, como los modelos de pronóstico, que requieren un conjunto de datos más estrecho. En este contexto, la calidad de los datos a menudo supera la cantidad. Además, estos modelos especiales consumen menos energía y son más fáciles de controlar.
“Se está haciendo mucha investigación para desarrollar algoritmos computacionalmente más eficientes”, agrega Smolinksi. Los modelos más eficientes dirección las cuatro crisis propuestas: consumen menos datos, energía y computación, y al ser más rápidos, abren nuevos casos de uso.
"Los LLM son geniales porque tienen una interfaz conversacional muy natural, y cuantos más datos se introducen, más natural se siente la conversación", dice Smolinksi. “Pero estos LLM están, en el contexto de dominios o problemas estrechos, sujetos a alucinaciones, lo cual es un problema real. Por lo tanto, nuestros clientes a menudo optan por modelos de lenguaje pequeños, y si la interfaz no es perfectamente natural, está bien porque para ciertos problemas, no es necesario”.
La IA generativa puede que no sea la panacea, pero es una herramienta poderosa en nuestro arsenal. Considere el flujo de trabajo de agentes, que se refiere a un enfoque de varios pasos para usar LLM y agentes de IA para realizar tareas. Estos agentes actúan con cierto grado de independencia y capacidad de toma de decisiones, interactuando con datos, sistemas y, a veces, personas, para completar las tareas asignadas. Los agentes especializados pueden diseñarse para manejar tareas específicas o áreas de especialización, aportando conocimientos profundos y experiencia de los que podrían carecer los LLM. Estos agentes pueden recurrir a datos más especializados o integrar algoritmos y modelos específicos del dominio.
Imagine una empresa de telecomunicaciones donde un flujo de trabajo de agentes orquestado por un LLM gestiona de manera eficiente la atención al cliente. Cuando un cliente envía una solicitud, el LLM procesa la consulta, categoriza el problema y activa agentes específicos para manejar diversas tareas. Por ejemplo, un agente recupera los detalles de la cuenta del cliente y verifica la información proporcionada, mientras que otro diagnostica el problema, como realizar verificaciones en la red o examinar las discrepancias de facturación.
Cuando se identifica el problema, un tercer agente formula una solución, ya sea reiniciando el equipamiento, ofreciendo un reembolso o programando una visita técnica. Luego, el LLM ayuda a un agente de comunicación a generar una respuesta personalizada para el cliente, lo que ayuda a garantizar que el mensaje sea claro y coherente con la voz de la marca de la empresa. Después de resolver el problema, se inicia un ciclo de retroalimentación, donde un agente recopila feedback del cliente para determinar la satisfacción. Si el cliente no está satisfecho, el LLM revisa el feedback y puede desencadenar otras acciones de seguimiento, como una llamada de un agente humano.
Los LLM, aunque son versátiles, pueden tener dificultades con tareas que requieren una profunda experiencia en el dominio o conocimientos especializados, especialmente cuando estas tareas quedan fuera de los datos de entrenamiento del LLM. También son lentos y no son adecuados para tomar decisiones en tiempo real en entornos dinámicos. Por el contrario, los agentes pueden operar de forma autónoma y proactiva, en tiempo real, mediante el uso de algoritmos de toma de decisiones más simples.
Los agentes, a diferencia de los LLM grandes y monolíticos, también pueden diseñarse para aprender de su entorno y adaptarse a él. Pueden utilizar el aprendizaje por refuerzo o los bucles de retroalimentación para mejorar el rendimiento a lo largo del tiempo, ajustando las estrategias en función del éxito o fracaso de las tareas anteriores. Los flujos de trabajo de Agentic por sí mismos generan nuevos datos, que luego se pueden utilizar para una mayor capacitación.
Este escenario destaca cómo un LLM es una parte útil para resolver un problema empresarial, pero no la solución completa. Esta es una buena noticia porque el LLM suele ser la pieza más costosa de la cadena de valor.
Smolinksi argumenta que las personas suelen llegar a extremos cuando se entusiasman con las nuevas tecnologías. Podríamos pensar que una nueva tecnología transformará el mundo y, cuando no lo haga, podríamos volvernos demasiado pesimistas.
"Creo que la respuesta está en algún punto intermedio", dice, argumentando que la IA debe ser parte de una estrategia más amplia para resolver problemas comerciales. “Por lo general, nunca es IA por sí sola, e incluso si lo es, está utilizando posiblemente múltiples tipos de modelos de IA que se aplican en conjunto para resolver un problema. Pero hay que empezar por el problema. Si existe una aplicación de IA que podría tener un impacto significativo en su capacidad de toma de decisiones y que, a su vez, provocaría un impacto financiero significativo, concéntrese en esas áreas y luego averigüe cómo aplicar el conjunto adecuado de tecnologías e IA. Aproveche el kit de herramientas completo, no solo los LLM, sino toda la gama de herramientas disponibles”.
En cuanto a la llamada “crisis de casos de uso”, Hay confía en que surgirán casos de uso aún más convincentes que justifiquen el costo de estos modelos.
“Si espera hasta que la tecnología sea perfecta y solo ingrese al mercado una vez que todo esté normalizado, esa es una buena manera de ser disruptivo”, dice. “No estoy seguro de que me arriesgaría.”