Las capacidades de la empresa, esenciales para lograr los objetivos estratégicos y los requisitos operativos, se describen en el modelo de capacidades de la arquitectura de IA generativa. Incluye seis categorías principales, que muestran las capacidades únicas y de apoyo necesarias para una aplicación eficaz de la IA generativa, con documentación exhaustiva disponible en otras arquitecturas.
Los restantes grupos de capacidades son capacidades de apoyo para la IA generativa. Las capacidades no son exclusivas de la IA generativa, pero deben estar presentes para apoyarla como capacidad empresarial. Estos grupos son:
La gestión de datos es un grupo de capacidades para almacenar, gestionar y transformar datos en formas que los hagan adecuados para el ajuste y el entrenamiento de modelos de IA generativa. También se incluyen en esta categoría las capacidades para registrar y calificar las respuestas del modelo con fines de auditoría, y como entrada para un mayor ajuste y refinamiento del modelo.
Las capacidades de apoyo constituyen un amplio conjunto de capacidades de aplicaciones, integración y operaciones de TI necesarias para implementar y gestionar con éxito soluciones de IA generativa en una empresa.
Los recursos de IA generativa recopilan las capacidades de hardware y plataformas necesarias para desarrollar, ajustar, implementar y gestionar de forma eficiente y eficaz modelos y soluciones de IA generativa.
Cada categoría de capacidad se compone de uno o más grupos de capacidad. En esta sección se destacan los grupos y las capacidades clave para la IA generativa.
El grupo de capacidades Model Hub encapsula las capacidades necesarias para gestionar modelos importados, así como modelos ajustados o entrenados por la empresa. Estas capacidades permiten a las empresas gestionar los modelos y conjuntos de datos disponibles para su uso dentro de la empresa, y limitar el acceso a modelos y conjuntos de datos a usuarios o grupos específicos dentro de la empresa. La importación de modelos y la importación de datos son capacidades clave para que las empresas puedan controlar la entrada de modelos procedentes del creciente número de repositorios públicos de modelos, como Hugging Face.
Model Hosting Model Hosting ofrece capacidades para implementar modelos generales y ajustados como servicios habilitados para API dentro de una empresa, optimizando la utilización de recursos, permitiendo el refinamiento y el reemplazo independientes y simplificando el gobierno. La clave para ello es la gestión de políticas de acceso al modelo, que garantiza que el acceso al modelo esté restringido a usuarios y grupos autorizados, evitando el uso no autorizado.
La personalización de modelos es un grupo de capacidades que permiten a una empresa ajustar y entrenar modelos de IA generativa para necesidades empresariales específicas. Normalmente, esta capacidad se realizará utilizando una plataforma en la nube, ya que el modelo de pago por uso de la nube se adapta bien a la naturaleza "ráfaga" de las demandas de recursos de ajuste y formación.
El gobierno de modelos y datos es un conjunto crítico de capacidades para que una empresa utilice los modelos de IA generativa a gran escala. Más concretamente, estas capacidades proporcionan a las empresas las perspectivas necesarias para monitorizar y gestionar los riesgos del modelo, como la introducción de sesgos en las respuestas del modelo, y para ayudar a dar dirección a los requisitos regulatorios y de cumplimiento para la transparencia y la equidad del modelo.
La monitorización de modelos es el análogo operativo del gobierno de modelos; mientras que el gobierno de modelos se ocupa de la gestión de modelos y riesgos a largo plazo, las capacidades de monitorización de modelos permiten a las empresas monitorizar y gestionar las operaciones de los modelos en tiempo real. La monitorización de modelos se compone de varias capacidades clave, que incluyen:
La gestión del cumplimiento de la iA generativa es una categoría de capacidades que tiene como objetivo habilitar los controles necesarios para “asegurar el uso” de la IA a través de la pila de aplicaciones y “asegurar las aplicaciones” en sí, así como cumplir con las normas y directrices éticas para garantizar que los sistemas de IA respetan los valores y derechos humanos.
Gestión de la seguridad de aplicaciones de IA. Esta categoría de capacidades tiene como objetivo habilitar los controles necesarios para “asegurar el uso” de la IA a través de la pila de aplicaciones y “asegurar las aplicaciones” en sí, así como cumplir con las normas y directrices éticas para garantizar que los sistemas de IA respetan los valores y derechos humanos.
Gestión de la seguridad de los modelos de IA. Esta categoría de capacidades consiste en habilitar los controles necesarios para "proteger el modelo", así como en el uso de modelos. Implementar buenas prácticas para el entrenamiento, validación y evaluación de modelos para mejorar el rendimiento y la fiabilidad.
Gestión de la seguridad de datos de IA. Esta categoría de capacidades permite implementar controles para "proteger la capa de datos". El objetivo es establecer directrices claras para la recopilación, el almacenamiento y el uso de los datos con el fin de garantizar su calidad y mitigar los sesgos. Aunque la seguridad de los datos no es exclusiva de la IA generativa, nos centraremos únicamente en aquellos ámbitos en los que la IA generativa requiere una atención especial en lo que respecta a los datos.
La IA agéntica es un grupo de capacidades necesarias para crear e implementar aplicaciones de IA agéntica. Entre ellas se incluyen capacidades básicas como el enrutamiento y la orquestación, y la gestión de herramientas y la llamada a herramientas.
La personalización de la IA generativa es un grupo de capacidades necesarias para "personalizar" un modelo generativo general a las necesidades de la empresa. Los modelos se entrenan sobre una amplia base de conocimientos y carecerán de conocimientos de la jerga y los procesos específicos del sector. Así, la mayoría de las empresas necesitarán hacer uso de capacidades como el prompt engineering, el prompt tuning y el model fine-tuning para crear un modelo que comprenda los términos y procesos del negocio de la empresa.
Las capacidades de aplicación IA generativa permiten a las empresas desarrollar aplicaciones avanzadas de IA generativa. Las capacidades incluyen la capacidad de generar dinámicamente funciones para responder a las consultas de los usuarios; la memoria conversacional, que permite a las aplicaciones de IA generativa retener y hacer referencia a interacciones anteriores de forma conversacional; y el enrutamiento de modelos, que permite a las aplicaciones enrutar dinámicamente las consultas al modelo más adecuado para responder.