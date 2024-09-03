Ninguna tecnología en la historia de la humanidad ha despertado tanto interés en tan poco tiempo como la IA generativa. Muchas empresas tecnológicas líderes están invirtiendo miles de millones de dólares en el entrenamiento de modelos de lenguaje de gran tamaño (LLM). Pero, ¿puede esta tecnología justificar la inversión? ¿Podrá estar a la altura del hype?
En la primavera de 2023, hace bastante tiempo en el ámbito de la inteligencia artificial (IA), Goldman Sachs publicó un informe en el que estimaba que la aparición de la IA generativa podría impulsar el PIB mundial en un 7 % anual, lo que supondría más de 7 billones de dólares adicionales cada año.
¿Cómo podría la IA generativa lograr esto? Las aplicaciones de esta tecnología son numerosas, pero en general pueden describirse como una mejora de la eficiencia de la comunicación entre humanos y máquinas. Esta mejora conducirá a la automatización de tareas de bajo nivel y al aumento de las capacidades humanas, lo que permitirá a los trabajadores realizar más tareas con mayor competencia.
Debido a las amplias aplicaciones y la complejidad de la IA generativa, muchos informes de los medios de comunicación podrían llevar a los lectores a creer que esta tecnología es una panacea casi mágica. De hecho, esta perspectiva caracterizó gran parte de la cobertura sobre la IA generativa cuando el lanzamiento de ChatGPT y otras herramientas popularizaron la tecnología en 2022, y algunos analistas predijeron que estábamos al borde de una revolución que remodelaría el futuro del trabajo.
Ni siquiera dos años después, el entusiasmo de los medios de comunicación por la IA generativa se ha enfriado un poco. En junio, Goldman Sachs publicó otro informe con una evaluación más mesurada, en el que se cuestionaba si los beneficios de la IA generativa podían justificar la inversión de un billón de dólares en su desarrollo. El Financial Times, entre otros medios, publicó un artículo de opinión con una visión igualmente escéptica. El equipo del boletín IBM® Think resumió y respondió a algunas de estas incertidumbres en una publicación anterior.
Las posteriores fluctuaciones del mercado bursátil llevaron a varios analistas a proclamar que la “burbuja de la IA” estaba a punto de estallar y que podría producirse una corrección del mercado a la escala del colapso de las puntocom de los años 90.
El escepticismo de los medios de comunicación en torno a la IA generativa puede dividirse a grandes rasgos en cuatro crisis distintas a las que se enfrentan los desarrolladores:
Se trata de obstáculos importantes, pero muchos siguen siendo optimistas y creen que resolver el último problema (los casos de uso) ayudará a resolver los otros tres. La buena noticia es que ya están identificando y trabajando en casos de uso significativos.
“La IA generativa está teniendo un impacto notable y cuantificable en nosotros y en nuestros clientes, cambiando radicalmente nuestra forma de trabajar”, afirma Chris Hay, ingeniero distinguido de IBM. “Esto se aplica a todos los sectores y disciplinas, desde la transformación de los procesos de RR. HH. y las transformaciones de marketing a través de contenidos de marca hasta los centros de contacto o el desarrollo de software”. Hay cree que nos encontramos en la fase correctiva que suele seguir a un periodo de entusiasmo desenfrenado, y tal vez el reciente pesimismo de los medios de comunicación pueda considerarse un intento de equilibrar declaraciones anteriores que, en retrospectiva, parecen exageradas.
“No me gustaría ser ese analista, afirma Hay, refiriéndose a uno de los pronósticos más pesimistas sobre el futuro de la IA. “No me gustaría ser la persona que dice: 'La IA no va a hacer nada útil en los próximos 10 años', porque le van a citar por eso durante el resto de su vida”.
Tales declaraciones podrían resultar tan miopes como las afirmaciones de que los inicios de internet no llegarían a nada o la suposición del fundador de IBM, Thomas Watson, en 1943, de que el mundo no necesitaría más de cinco ordenadores. Hay sostiene que parte del problema es que los medios de comunicación suelen confundir la IA generativa con una aplicación más limitada de los chatbots basados en LLM, como ChatGPT, que de hecho podrían no estar equipados para resolver todos los problemas a los que se enfrentan las empresas.
Si empezamos a encontrarnos con cuellos de botella en el suministro, ya sea de datos, computación o energía, Hay cree que los ingenieros serán creativos para resolver estos impedimentos.
“Cuando se tiene algo en abundancia, se consume”, afirma Hay. “Si se tienen cientos de miles de GPU sin usar, se van a utilizar. Pero cuando se tienen limitaciones, uno se vuelve más creativo”.
Por ejemplo, los datos sintéticos representan una forma prometedora de abordar la crisis de datos. Estos datos se crean algorítmicamente para imitar las características de los datos del mundo real y pueden servir como alternativa o complemento a estos. Aunque los ingenieros de machine learning deben tener cuidado con el uso excesivo de datos sintéticos, un enfoque híbrido podría ayudar a superar la escasez de datos del mundo real a corto plazo. Por ejemplo, los recientes modelos PHI-3.5 de Microsoft o SMOL de Hugging Face se han entrenado con cantidades sustanciales de datos sintéticos, lo que ha dado como resultado modelos pequeños de gran capacidad.
Los LLM actuales consumen mucha energía, pero hay pocos motivos para creer que los transformadores actuales sean la arquitectura definitiva. Los modelos basados en SSM, como Mistral Codestral Mamba, Jamba 1.5 o Falcon Mamba 1.5, están ganando popularidad debido a su mayor capacidad de longitud de contexto. Las arquitecturas híbridas que utilizan varios tipos de modelos también están ganando terreno. Más allá de la arquitectura, los ingenieros están encontrando valor en otros métodos, como la cuantización, los chips diseñados específicamente para la inferencia y el ajuste fino, una técnica de deep learning que consiste en adaptar un modelo preentrenado para casos de uso específicos.
“Me encantaría ver más comunidad en torno al ajuste fino en el sector, en lugar del preentrenamiento”, afirma Hay. “El preentrenamiento es la parte más cara del proceso. El ajuste fino es mucho más barato y puede obtener mucho más valor de él”.
Hay sugiere que, en el futuro, es posible que tengamos más GPU de las que sabemos qué hacer con ellas, ya que nuestras técnicas se han vuelto mucho más eficientes. Recientemente, ha experimentado con la conversión de un ordenador portátil personal en una máquina capaz de entrenar modelos. Al reconstruir pipelines de datos más eficientes y jugar con el procesamiento por lotes, está descubriendo formas de trabajar dentro de las limitaciones. Naturalmente, podría hacer todo esto en una costosa GPU H100 Tensor Core, pero su mentalidad de escasez le ha permitido encontrar formas más eficientes de lograr los resultados deseados. La necesidad fue la madre de la invención.
Los modelos son cada vez más pequeños y potentes.
“Si nos fijamos en los modelos más pequeños de hoy en día, están entrenados con más tokens que los modelos más grandes del año pasado”, afirma Hay. “Se están introduciendo más tokens en modelos más pequeños, y esos modelos son cada vez más eficientes y rápidos”.
“Cuando pensamos en aplicaciones de IA para resolver problemas empresariales reales, lo que encontramos es que estos modelos especializados son cada vez más importantes”, afirma Brent Smolinksi, director global de Tecnología, Datos y Estrategia de IA de IBM. Entre ellos se incluyen los denominados modelos de lenguaje pequeños y los modelos no generativos, como los modelos de previsión, que requieren un conjunto de datos más reducido. En este contexto, la calidad de los datos suele pesar más que la cantidad. Además, estos modelos especializados consumen menos energía y son más fáciles de controlar.
“Se está investigando mucho para desarrollar algoritmos más eficientes desde el punto de vista computacional”, añade Smolinksi. Los modelos más eficientes abordan las cuatro crisis propuestas: consumen menos datos, energía y recursos computacionales, y al ser más rápidos, abren nuevos casos de uso.
“Los LLM son fantásticos porque tienen una interfaz conversacional muy natural, y cuantos más datos se introducen, más natural resulta la conversación”, afirma Smolinksi. “Pero estos LLM, en el contexto de dominios o problemas específicos, están sujetos a alucinaciones, lo cual es un verdadero problema. Por eso, nuestros clientes suelen optar por modelos de lenguaje pequeños, y si la interfaz no es perfectamente natural, no pasa nada, porque para ciertos problemas no es necesario que lo sea”.
La IA generativa puede que no sea la panacea, pero es una herramienta muy potente. Consideremos el flujo de trabajo agéntico, que se refiere a un enfoque de varios pasos para utilizar LLM y agentes de IA para realizar tareas. Estos agentes actúan con un grado de independencia y capacidad de toma de decisiones, interactuando con datos, sistemas y, a veces, personas, para completar las tareas que se les asignan. Se pueden diseñar agentes especializados para manejar tareas específicas o áreas de especialización, aportando un profundo conocimiento y experiencia de los que los LLM pueden carecer. Estos agentes pueden recurrir a datos más especializados o integrar algoritmos y modelos específicos del dominio.
Imaginemos una empresa de telecomunicaciones en la que un flujo de trabajo agéntico orquestado por un LLM gestiona de forma eficiente las consultas de atención al cliente. Cuando un cliente envía una solicitud, el LLM procesa la consulta, clasifica el problema y activa a agentes específicos para que se encarguen de diversas tareas. Por ejemplo, un agente recupera los datos de la cuenta del cliente y verifica la información proporcionada, mientras que otro diagnostica el problema, por ejemplo, realizando comprobaciones en la red o examinando las discrepancias en la facturación.
Cuando se identifica el problema, un tercer agente formula una solución, ya sea restablecer el equipo, ofrecer un reembolso o programar la visita de un técnico. A continuación, el LLM ayuda a un agente de comunicación a generar una respuesta personalizada para el cliente, lo que contribuye a garantizar que el mensaje sea claro y coherente con la voz de la marca de la empresa. Una vez resuelto el problema, se inicia un ciclo de feedback, en el que un agente recopila los comentarios de los clientes para determinar su satisfacción. Si el cliente no está satisfecho, el LLM revisa el feedback y puede desencadenar otras acciones de seguimiento, como una llamada de un agente humano.
Los LLM, aunque son versátiles, pueden tener dificultades con tareas que requieren una profunda experiencia en el ámbito o conocimientos especializados, especialmente cuando estas tareas quedan fuera de los datos de entrenamiento del LLM. También son lentos y no son adecuados para tomar decisiones en tiempo real en entornos dinámicos. Por el contrario, los agentes pueden operar de forma autónoma y proactiva, en tiempo real, utilizando algoritmos de toma de decisiones más sencillos.
Los agentes, a diferencia de los LLM grandes y monolíticos, también pueden diseñarse para aprender de su entorno y adaptarse a él. Pueden utilizar el aprendizaje por refuerzo o los bucles de feedback para mejorar su rendimiento a lo largo del tiempo, ajustando sus estrategias en función del éxito o el fracaso de tareas anteriores. Los propios flujos de trabajo agénticos generan nuevos datos, que luego pueden utilizarse para seguir entrenándose.
Este escenario pone de relieve que un LLM es una parte útil para resolver un problema empresarial, pero no la solución completa. Esto es una buena noticia, ya que el LLM suele ser la pieza más costosa de la cadena de valor.
Smolinksi sostiene que las personas suelen caer en extremos cuando se entusiasman con las nuevas tecnologías. Podemos pensar que una nueva tecnología transformará el mundo y, cuando no lo hace, podemos volvernos excesivamente pesimistas.
“Creo que la respuesta está en algún punto intermedio”, afirma, argumentando que la IA debe formar parte de una estrategia más amplia para resolver los problemas empresariales. “Por lo general, nunca se trata solo de IA, e incluso si lo fuera, se utilizan posiblemente varios tipos de modelos de IA que se aplican conjuntamente para resolver un problema. Pero hay que empezar por el problema. Si existe una aplicación de IA que podría tener un impacto significativo en su capacidad de toma de decisiones y que, a su vez, tendría un impacto financiero significativo, céntrese en esas áreas y luego averigüe cómo aplicar el conjunto adecuado de tecnologías e IA. Aproveche todo el kit de herramientas, no solo los LLM, sino toda la gama de herramientas disponibles”.
En cuanto a la denominada “crisis de casos de uso”, Hay confía en que surgirán casos de uso aún más convincentes que justifiquen el coste de estos modelos.
“Si espera a que la tecnología sea perfecta y solo entra en el mercado una vez que todo se haya normalizado, es una buena forma de quedarse fuera”, afirma. “No estoy seguro de si me arriesgaría”.