Las capacidades empresariales, esenciales para alcanzar los objetivos estratégicos y los requisitos operativos, se describen en el modelo de capacidades de la arquitectura de IA generativa. Incluye seis categorías principales, que muestran las capacidades únicas y de apoyo necesarias para una implementación eficaz de la IA generativa, con documentación completa disponible en otras arquitecturas.
Los grupos de capacidades restantes son capacidades de apoyo para la IA generativa. Las capacidades no son exclusivas de la IA generativa, pero deben estar presentes para respaldarla como una capacidad empresarial. Estos grupos son:
La gestión de datos es un conjunto de capacidades para almacenar, gestionar y transformar datos en formatos adecuados para el ajuste y el entrenamiento de modelos de IA generativa. También se incluyen en esta categoría las capacidades para registrar y calificar las respuestas del modelo con fines de auditoría, y como entrada para un mayor ajuste y refinamiento del modelo.
Capacidades de soporte es un conjunto global de capacidades de aplicación, integración y operaciones necesarias para desplegar y gestionar con éxito soluciones de IA generativa en una empresa.
Los recursos de IA generativa capturan las capacidades de hardware y plataforma necesarias para desarrollar, ajustar, desplegar y administrar de manera eficiente y efectiva modelos y soluciones de IA generativa.
Cada categoría de capacidad se compone de uno o más grupos de capacidades. Esta sección destaca los grupos y capacidades clave para la IA generativa.
El grupo de capacidades Model Hub encapsula las capacidades necesarias para gestionar modelos importados, así como modelos ajustados o entrenados por la empresa. Estas capacidades permiten a las empresas gestionar los modelos y conjuntos de datos disponibles para su uso dentro de la empresa, y limitar el acceso a modelos y conjuntos de datos a usuarios o grupos específicos dentro de la empresa. La importación de modelos y la importación de datos son capacidades clave para que las empresas limiten la entrada de modelos del creciente número de repositorios de modelos públicos como Hugging Face.
El alojamiento de modelos ofrece capacidades para desplegar modelos generales y ajustados como servicios habilitados para API dentro de una empresa, optimizando la utilización de recursos, permitiendo el refinamiento y el reemplazo independientes, y simplificando la gobernanza. La clave para esto es la gestión de políticas de acceso al modelo, que garantiza que el acceso al él esté restringido a usuarios y grupos autorizados, evitando el uso no autorizado.
La personalización de modelos es un conjunto de capacidades que permiten a una empresa ajustar y entrenar modelos de IA generativa para necesidades empresariales específicas. Por lo general, esta capacidad se realizará utilizando una plataforma en la nube, ya que el modelo de pago por uso de la nube se adapta bien a la naturaleza "ráfaga" de las demandas de recursos de ajuste y entrenamiento.
Modelo y gobernanza de datos es un conjunto crítico de capacidades para que una empresa haga uso de modelos de IA generativa a gran escala. Específicamente, estas capacidades proporcionan a las empresas los insights que necesitan para monitorear y gestionar los riesgos del modelo, como la introducción de sesgos en las respuestas del modelo, y para ayudar a abordar los requisitos normativos y de cumplimiento para la transparencia y equidad del modelo.
El monitoreo de modelos es el análogo operativo de la gobernanza de modelos; esta última se ocupa de la gestión de modelos y riesgos a largo plazo, mientras que las capacidades de monitoreo de modelos permiten a las empresas monitorear y gestionar las operaciones del modelo en tiempo real. El monitoreo de modelos se compone de varias capacidades clave, que incluyen:
La Gestión de cumplimiento de la IA generativa es una categoría de capacidades que consiste en habilitar los controles necesarios para “asegurar el uso” de la IA a través de la pila de aplicaciones y “asegurar las aplicaciones” en sí mismas. Se adhiere a las normas y directrices éticas para garantizar que los sistemas de IA respeten los valores y derechos humanos.
Gestión de la seguridad de aplicaciones de IA. Esta categoría de capacidades consiste en habilitar los controles necesarios para “asegurar el uso” de la IA a través de la pila de aplicaciones y “asegurar las aplicaciones” mismas. Se adhiere a las normas y directrices éticas para garantizar que los sistemas de IA respeten los valores y derechos humanos.
Gestión de seguridad de modelos de IA. Esta categoría de capacidades consiste en habilitar los controles necesarios para "proteger el modelo", así como en el uso de modelos. Implementa las mejores prácticas para el entrenamiento, validación y evaluación de modelos para mejorar el rendimiento y la fiabilidad.
Gestión de seguridad de datos de IA. Esta categoría de capacidades permite controles para "proteger los datos". Establece pautas claras para la recopilación, el almacenamiento y el uso de datos para garantizar la calidad de los datos y mitigar el sesgo. Aunque la seguridad de los datos no es exclusiva de la IA generativa, nos centraremos únicamente en áreas en las que esta requiere especial atención desde el punto de vista de los datos.
La IA agéntica es un grupo de capacidades necesarias para crear y desplegar aplicaciones de IA agéntica. Incluye capacidades básicas como enrutamiento y orquestación, y gestión de herramientas y llamada a herramientas.
El Ajuste para la IA generativa es un grupo de capacidades necesarias para "personalizar" un modelo generativo general a las necesidades de la empresa. Los modelos se entrenan sobre una amplia base de conocimientos y carecerán de conocimiento de la jerga y los procesos específicos de la industria. Por lo tanto, la mayoría de las empresas necesitarán hacer uso de capacidades como ingeniería rápida, ajuste rápido y ajuste de modelos para crear un modelo que comprenda los términos y procesos del negocio de la empresa.
Las capacidades de aplicaciones de IA generativa permiten a las empresas desarrollar aplicaciones avanzadas de IA generativa. Las capacidades incluyen la capacidad de generar funciones dinámicamente para responder a las consultas de los usuarios; la memoria conversacional, que permite que las aplicaciones de IA generativa retengan y hagan referencia a interacciones anteriores de manera conversacional; y el enrutamiento de modelos, que permite a las aplicaciones enrutar dinámicamente las consultas al modelo más adecuado para responder.