En este tutorial, se le guiará a través de cómo crear un estilista personal impulsado por IA generativa. Este tutorial aprovecha el modelo de lenguaje grande (LLM) IBM® Granite Vision 3.2 para procesar la entrada de imágenes y Granite 3.2 con las últimas capacidades de razonamiento mejoradas para formular ideas de atuendos personalizables.
¿Con qué frecuencia se encuentra pensando: “¿Qué me pongo hoy?” ¡Ni siquiera sé por dónde empezar a elegir artículos de mi armario!” Este dilema es uno que muchos de nosotros compartimos. Gracias al uso de modelos de inteligencia artificial (IA) de última generación, esto ya no tiene por qué ser una tarea abrumadora.
Nuestra solución impulsada por IA se compone de las siguientes etapas:
3. Tras el envío de la entrada, el modelo multimodal Granite Vision 3.2 itera sobre la lista de imágenes y devuelve el siguiente resultado:
4. El modelo Granite 3.2 con razonamiento mejorado sirve como estilista de moda. El LLM utiliza la salida del modelo Vision para proporcionar una recomendación de vestimenta adecuada para el evento del usuario.
5. La sugerencia de atuendo, un marco de datos de artículos que el usuario cargó y las imágenes en la recomendación personalizada descrita se devuelven al usuario.
Necesita una cuenta de IBM Cloud para crear un proyecto watsonx.ai .
Para utilizar la interfaz de programación de aplicaciones (API) de watsonx, deberá completar los siguientes pasos. Tenga en cuenta que también puede acceder a este tutorial en GitHub.
Inicie sesión en watsonx.ai mediante su cuenta de IBM Cloud.
Cree un proyecto watsonx.ai.
Puede obtener su ID de proyecto desde dentro de su proyecto. Haga clic en la pestaña Manage. Luego, copie el ID del proyecto de la sección Details de la página General. Necesita este ID para este tutorial.
Cree una instancia de servicio watsonx.ai Runtime (elija el plan Lite, que es una instancia gratuita).
Genere una clave de API.
Asocie el servicio de watsonx.ai Runtime al proyecto que creó en watsonx.ai.
Para una experiencia más interactiva al usar esta herramienta de IA, clone el repositorio de GitHub y siga las instrucciones de configuración en el archivo README.md dentro del proyecto de estilista de IA para lanzar la aplicación Streamlit en su máquina local. De lo contrario, si prefiere seguir paso a paso, cree un Jupyter Notebook y continúe con este tutorial.
Necesitamos algunas bibliotecas y módulos para este tutorial. Asegúrese de importar los siguientes; si no están instalados, puede resolver este problema con una instalación rápida de pip.
Para establecer nuestras credenciales, necesitamos el
Podemos usar la
Se llama al
También podemos crear una instancia de la interfaz del modelo utilizando la
Para codificar nuestras imágenes de una manera que sea digerible para el LLM, las codificaremos en bytes que luego decodificaremos en representación UTF-8. En este caso, nuestras imágenes se encuentran en el directorio local de imágenes. Puede encontrar imágenes de muestra en el directorio de estilista de IA en nuestro repositorio de GitHub.
Ahora que hemos cargado y codificado nuestras imágenes, podemos consultar el modelo Vision. Nuestra instrucción es específica de nuestra salida deseada para limitar la creatividad del modelo a medida que buscamos una salida JSON válida. Almacenaremos la descripción, categoría y ocasión de cada imagen en una lista llamada
Resultado:
{
"description": "A pair of polished brown leather dress shoes with a brogue detailing on the toe box and a classic oxford design.",
"category": "shoes",
"occasion": "formal"
}
{
"description": "A pair of checkered trousers with a houndstooth pattern, featuring a zippered pocket and a button closure at the waist.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A light blue, button-up shirt with a smooth texture and a classic collar, suitable for casual to semi-formal occasions.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of khaki pants with a buttoned waistband and a button closure at the front.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A blue plaid shirt with a collar and long sleeves, featuring chest pockets and a button-up front.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of bright orange, short-sleeved t-shirts with a crew neck and a simple design.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of blue suede sneakers with white laces and perforations, suitable for casual wear.",
"category": "shoes",
"occasion": "casual"
}
{
"description": "A pair of red canvas sneakers with white laces, isolated on a white background.",
"category": "shoes",
"occasion": "casual"
}
{
"description": "A pair of grey dress pants with a smooth texture and a classic design, suitable for formal occasions.",
"category": "pants",
"occasion": "formal"
}
{
"description": "A plain white T-shirt with short sleeves and a crew neck, displayed from the front and back.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A black short-sleeved t-shirt with a crew neck and a simple design.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "Black pants with a zippered pocket and a buttoned fly, showing the waistband and pocket details.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A pair of tan leather boots with a chunky sole and a high-top design, suitable for casual wear.",
"category": "shoes",
"occasion": "casual"
}
Ahora que tenemos cada prenda y calzado categorizados, será mucho más fácil para el modelo de razonamiento generar un atuendo para la ocasión seleccionada. Creemos una instancia y consultemos el modelo de razonamiento.
Para alinear los nombres de archivo con las descripciones de las imágenes, podemos enumerar la lista de descripciones de imágenes y crear una lista de diccionarios en los que almacenamos la descripción, la categoría, la ocasión y el nombre de archivo de cada elemento en los campos respectivos.
Ahora, consultemos el modelo Granite 3.2 con razonamiento para producir un atuendo para nuestros criterios especificados utilizando la
Resultado:
Este es mi proceso de pensamiento:
- El atuendo debe ser adecuado para una mañana informal en el parque durante el otoño.
- Seleccionaré una camisa, un par de pantalones y un par de zapatos que se ajusten a la categoría de ocasión "casual".
- Evitaré prendas formales o demasiado elegantes y elegiré prendas que sean cómodas para las actividades en el parque.
Esta es mi respuesta:
Para una mañana informal en el parque en otoño, sugiero el siguiente atuendo:
1. **Camisa**: una camisa azul a cuadros con cuello y manga larga (archivo: 'image13.jpeg')
- El patrón a cuadros es clásico para el otoño y combina bien con entornos casuales de parques. Las mangas largas ofrecen cierta protección contra las temperaturas más frías de la mañana.
2. **Pantalones**: pantalones caqui con cintura abotonada y cierre de botones en la parte delantera (archivo: 'image7.jpeg')
- El caqui es una opción versátil que puede combinar con el ambiente casual y también proporciona un buen equilibrio con la camisa a cuadros. Son prácticos y cómodos para caminar.
3. **Zapatos**: un par de botas de cuero color canela con suela gruesa y diseño de caña alta (archivo: 'image3.jpeg')
- Las botas de cuero color canela ofrecen una opción elegante, pero cómoda. La suela gruesa proporciona un buen agarre y soporte, ideal para transitar por senderos de parques o terrenos irregulares.
Esta combinación proporciona un aspecto relajado y elegante, adecuado para una salida matutina casual, al tiempo que considera la comodidad y la practicidad.
Con esta descripción de atuendo generada, también podemos mostrar las prendas de vestir que recomienda el modelo. Para hacerlo, simplemente podemos extraer los nombres de archivo. En caso de que el modelo mencione el mismo nombre de archivo dos veces, es importante verificar si la imagen aún no se ha mostrado a medida que iteramos la lista de imágenes. Podemos hacerlo almacenando las imágenes mostradas en la
En este tutorial, creó un sistema que utiliza IA para proporcionar consejos de estilo a un evento específico de un usuario. Mediante fotos o capturas de pantalla de la ropa del usuario, los atuendos se personalizan para cumplir con los criterios especificados. El modelo Granite-Vision-3-2-2b fue crítico para etiquetar y categorizar cada elemento. Además, el modelo Granite-3-2-8B-instruct aprovechó sus capacidades de razonamiento para generar ideas de atuendos personalizados.
Algunos siguientes pasos para crear esta aplicación pueden incluir:
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.