Despliegue de activos de IA generativa
Despliegue activos de IA generativa para utilizarlos en producción y supervise estos activos desplegados.
Tipos de activos desplegables para aplicaciones de IA generativa
Puede utilizar watsonx.ai para desplegar los siguientes activos para sus aplicaciones de IA generativa:
Despliegue de plantillas de avisos
Después de guardar una plantilla de solicitud como un activo de proyecto, puede promocionarla a un espacio de despliegue. Desde el espacio de despliegue, puede desplegar su plantilla de avisos a producción y obtener el punto final para la inferencia.
Si tiene el servicio watsonx.governance , también puede capturar y realizar un seguimiento de los detalles de despliegue para una plantilla de solicitud para cumplir los requisitos de gobierno.
Para obtener más información, consulte Despliegue de una plantilla de avisos.
Despliegue de modelos ajustados
Después de ajustar un modelo de base y guardar el modelo ajustado como un activo de proyecto, puede promocionarlo a un espacio de despliegues. Desde el espacio de despliegue, puede probar el modelo sintonizado y obtener el punto final para la inferencia.
Para obtener más información, consulte Implementación de modelos ajustados.
Implantación de modelos de cimientos personalizados
Además de trabajar con modelos de base organizados por IBM, puede cargar y desplegar sus propios modelos de base. Después de que los modelos se desplieguen y se registren en watsonx.ai, cree mensajes que infieran los modelos personalizados de Prompt Lab.
El despliegue de un modelo de base personalizado proporciona la flexibilidad necesaria para implementar las soluciones de IA adecuadas para su caso de uso.
Para obtener más información, consulte Despliegue de un modelo de base personalizado.