Ya no se puede decir que la IA generativa esté en una fase experimental. Está integrada en las hojas de ruta, las estrategias y los modelos operativos de las empresas en diversas industrias. Los líderes empresariales entienden que los modelos generativos y los flujos de trabajo que facilitan son inevitables, pero ahora el enfoque ha pasado de las capacidades a la presión para demostrar el retorno de la inversión (ROI), mantener bajos los costos de infraestructura y crear marcos de gobernanza sólidos y escalables.
Las organizaciones que ganen producirán soluciones que pueden no ser las más llamativas, pero sí las más responsables y sostenibles.
A principios de este año, el arquitecto jefe de IBM, Gabe Goodhart, declaró la mercantilización de los modelos.
“Podemos elegir el modelo que se adapte a su caso de uso y ponernos en marcha. El modelo en sí no va a ser el principal diferenciador”, dijo, enfatizando un nuevo enfoque en la orquestación. Tiene todos los modelos que necesita: modelos pequeños especializados y modelos grandes para todo uso. Ahora, ¿cómo puede hacer que funcionen juntos de manera eficiente e inteligente?
Estos son nueve de los desafíos más críticos de la IA generativa que enfrentan las organizaciones en la actualidad.
La observabilidad de la IA permite a las organizaciones monitorear el comportamiento de los modelos de inteligencia artificial generativa. No se trata de una práctica sencilla, ya que los resultados de los modelos de IA generativa son probabilísticos. A diferencia de la programación tradicional, los modelos de lenguaje grandes (LLM) que definen la IA generativa no siguen reglas establecidas, sino que llegan a decisiones a través de la experiencia de entrenamiento con cantidades masivas de datos y luego utilizan ese entrenamiento para hacer predicciones sobre nuevos datos. Su inteligencia surge de la optimización, la detección de patrones y las distribuciones de probabilidad a través de redes neuronales complejas.
Sin embargo, las herramientas de observabilidad pueden ayudar a proporcionar insight sobre cómo los modelos y los agentes están llegando a sus resultados. Las técnicas de observabilidad de la IA implican el seguimiento del uso de tokens, los cambios en los patrones de respuesta, las variaciones en la calidad de los resultados y la generación de registros de interacción que describen la toma de decisiones de los agentes.
Las tendencias de observabilidad incluyen plataformas de observabilidad más inteligentes, que usan la observabilidad como parte de una estrategia global de gestión de costos y la adopción de estándares abiertos de observabilidad.
Algunas organizaciones siguen teniendo dificultades para pasar de las fases piloto a la producción a gran escala, lo que puede resultar especialmente complicado cuando los beneficios de las iniciativas de implementación de la IA son difíciles de cuantificar. En este último punto, existen mejores prácticas para abordar la medición de la productividad de la IA generativa en una empresa.
Sin embargo, también puede ser beneficioso pensar más allá del ROI. El director ejecutivo (CEO) de Nvideo, Jensen Huang, expuso este argumento en enero.
“Cuando los hijos dicen que quieren probar algo, debemos decir que sí. Nunca hacemos preguntas en casa como '¿Cuál es el retorno de la inversión aquí?'”.
Este enfoque exploratorio requerirá una fuerte aceptación de los stakeholders en toda la organización, pero puede ser necesario a largo plazo para proporcionar un valor comercial duradero.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Los modelos grandes requieren clústeres de GPU costosos e infraestructura especializada. Están ávidos de energía, hasta el punto en que los hiperescaladores están influyendo en las políticas energéticas nacionales y la planificación a largo plazo. Los costos de capacitación están disminuyendo, pero la inferencia a escala sigue siendo costosa.
Las organizaciones pueden contener los costos mediante el uso de múltiples modelos para diferentes tareas. Los modelos fronterizos no siempre son necesarios para tareas que pueden no implicar un razonamiento complejo. A menudo, un modelo pequeño y de peso abierto es suficiente para tareas como la clasificación y la extracción de información. Otro enfoque podría consistir en usar la RAG en lugar de ajustar un modelo, lo cual es comparativamente costoso.
Los diseñadores de sistemas de IA pueden fomentar instrucciones más cortas, entradas estructuradas, almacenamiento en caché de consultas repetidas y una fragmentación más inteligente.
Probablemente, el enfoque más fácil para contener los costos en las tecnologías de IA sea simplemente elegir los mejores casos de uso más repetibles para automatizar flujos de trabajo y tareas de alta frecuencia con oportunidades de claro ahorro de tiempo, sin intentar “aplicar la IA a todo”. Las estrategias de IA no necesitan aspirar a la automatización completa, ya que dichos sistemas pueden ser más costosos y arriesgados que las soluciones de IA que involucran la intervención humana.
El rendimiento de la IA generativa depende en gran medida de datos limpios y estructurados. La limpieza de datos elimina incongruencias, duplicados y errores presentes en los datos de entrenamiento. Aunque los modelos pueden procesar datos no estructurados (como texto sin formato e imágenes), los datos estructurados resultan útiles para minimizar las alucinaciones. En general, los datos patentados de alta calidad se convertirán en un diferenciador mucho mayor a medida que los modelos se acerquen a la mercantilización.
La infracción de derechos de autor, la privacidad de datos y otros problemas de obtención de datos exigen un enfoque reflexivo de la calidad de los datos que variará según la organización y el caso de uso.
La gobernanza de la IA se refiere a los procesos, estándares y medidas de protección que ayudan a garantizar que los sistemas y herramientas de IA sean seguros y éticos. La gobernanza está destinada a identificar y reducir posibles daños, como los sesgos algorítmicos y las consecuencias no deseadas de las decisiones automatizadas. La gobernanza forma parte de un enfoque global de IA responsable, que fomenta principios más amplios como la confianza, la equidad, la robustez, la transparencia y la privacidad.
Debido a lo complejos y fragmentados que pueden ser los entornos de datos empresariales, la gobernanza sigue siendo un desafío, pero es crítico superarlo.
A medida que las regiones de todo el mundo desarrollan sus propios marcos regulatorios para la IA (como la Ley de IA de la UE), las organizaciones deben ser conscientes de la evolución de las obligaciones de cumplimiento.
Cuando los resultados del modelo de lenguaje grande (LLM) parecen inexactos o sin sentido, puede ser una alucinación. Los modelos más nuevos y aquellos que pueden recuperar datos con generación aumentada por recuperación (RAG, por sus siglas en inglés) son mucho menos propensos a las alucinaciones que los modelos anteriores, pero el riesgo persiste, y dada la forma en que funcionan actualmente los algoritmos de machine learning y el procesamiento de lenguaje natural (PLN), no hay razones para creer que las alucinaciones pronto se erradicarán por completo.
Los sistemas generativos predicen la siguiente palabra más probable dado el contexto. No verifican los hechos de forma inherente y llenan los vacíos con conjeturas plausibles. Los modelos no optimizan la verdad tal como la conocemos, sino la plausibilidad lingüística. Para complicar aún más las cosas, las alucinaciones suelen presentarse con lo que a los usuarios humanos les parece una total seguridad.
Por lo tanto, las empresas deben pensar no solo en cómo minimizarán las alucinaciones, sino explorar las consideraciones éticas involucradas en manejarlas cuando ocurren, especialmente en un contexto orientado al cliente.
La automatización tradicional reemplazó principalmente las tareas manuales repetitivas. La adopción de la IA generativa puede automatizar el trabajo creativo, lo que da como resultado la remodelación de los roles. Los empleados deberán aprender a diseñar instrucciones, supervisar sistemas generativos, editar resultados generados por IA y verificar resultados. Deberán recibir capacitación para enfrentar con éxito los desafíos éticos que plantea el uso de la IA generativa.
“Workslop” se refiere al contenido generado por IA de baja calidad que puede parecer pulido a primera vista, pero que carece de la sustancia y el matiz de la experiencia humana. Las organizaciones deberán volver a capacitar a los empleados para que puedan aprovechar los beneficios potenciales de la IA mientras comprenden sus limitaciones, y producir el mejor trabajo posible permitiendo que la IA sobresalga donde es más capaz, al tiempo que proporciona inteligencia humana según sea necesario.
La nueva tecnología a menudo introduce una nueva superficie de ataque, y la IA generativa no es una excepción, sobre todo cuando se conecta a herramientas, datos y agentes autónomos. Entre las amenazas se encuentra la inyección de instrucciones, que consiste en utilizar entradas maliciosas para hacer que los sistemas de IA actúen de forma contraria a su comportamiento previsto. Esta técnica se puede utilizar para engañar a un chatbot para que filtre datos privados confidenciales o haga que un agente elimine algo importante en una base de datos. La seguridad de los datos deberá evolucionar para enfrentar este desafío.
Los agentes de IA, en particular, plantean un gran desafío en materia de gestión de riesgos, ya que pueden acceder a archivos, navegar por Internet, llamar a las API, ejecutar código y controlar software. Uno puede imaginar cómo un sistema de IA agéntica totalmente integrado podría salir mal, especialmente cuando una instrucción maliciosa e ingeniosa como “haz el trabajo, pase lo que pase” podría ser interpretada por un agente como “siéntete libre de eludir las salvaguardas”. Además, no es necesario que una instrucción tan peligrosa sea intencionalmente maliciosa.
Los sistemas de IA son potentes, pero pueden ser frágiles, y las prácticas de seguridad de la IA están evolucionando rápidamente para enfrentar el desafío.
Todavía hay mucho espacio para avances en el desarrollo de modelos, pero es inevitable que los modelos fundacionales se muevan hacia la mercantilización, lo que significa que dejarán de ser un diferenciador principal. Si prácticamente todas las organizaciones tienen acceso a modelos similares, entonces los chatbots y otras herramientas impulsadas por IA comienzan a tener el mismo aspecto.
Esta tendencia desplazará el valor de la capa del modelo hacia los factores diferenciadores únicos y la adaptabilidad, que constituirán la nueva vanguardia. Las organizaciones que puedan aportar más y mejores conjuntos de datos propietarios, junto con integraciones de flujo de trabajo más inteligentes, mejor infraestructura, experiencias del cliente más intuitivas y marcos de gobernanza y cumplimiento más sólidos, agregarán el mayor valor.
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.