このチュートリアルでは、生成AIを活用したパーソナル・スタイリストを構築する方法について説明します。このチュートリアルでは、画像インプットを処理するためのIBM® Granite™ Vision 3.2 大規模言語モデル(LLM)と、カスタマイズ可能なアウトフィットのアイデアを策定するための最新の機能を強化したGranite 3.2を活用します。
「今日、何を着ようか?」と考えることがどのくらい多いでしょうか。クローゼットのどこから始めればよいのかさえわかりません!」このジレンマは、私たちの多くが共有しているものです。最先端の人工知能(AI)モデルを使用することで、これはもはや困難な作業ではありません。
IBMのAI駆動型ソリューションは、次の段階別に構成されています。
3. インプットが送信されると、マルチモーダルGranite Vision 3.2モデルは画像リストを反復処理し、以下のアウトプットを返します。
4. その後、推論力が強化されたGranite 3.2モデルがファッション・スタイリストとしての役割を果たします。LLMは、Visionモデルのアウトプットを使用して、ユーザーのイベントに適した服装の推奨事項を提供します。
5. 服装の提案、ユーザーがアップロードしたアイテムのデータ・フレーム、および記述のパーソナライズされた推奨事項内の画像は、すべてユーザーに返されます。
watsonx.ai™プロジェクトを作成するにはIBM Cloud®のアカウントが必要です。
watsonxのアプリケーション・プログラミング・インターフェース(API)を使用するには、以下の手順を完了する必要があります。このチュートリアルはGitHubでもご覧いただけます。
IBM Cloudアカウントを使用して、watsonx.aiにログインします。
watsonx.aiプロジェクトを作成します。
プロジェクトIDはプロジェクト内から取得できます。[管理]タブをクリックし、[一般]ページの[詳細]セクションからプロジェクトIDをコピーしてください。このチュートリアルではこのIDが必要になります。
watsonx.aiランタイム・サービス・インスタンスを作成します(無料インスタンスであるLiteプランを選択します)。
APIキーを生成します。
watsonx.aiで作成したプロジェクトにwatsonx.aiランタイム・サービスを関連付けます。
このAIツールを使用する際に、よりインタラクティブなエクスペリエンスを実現するには、GitHubリポジトリーのクローンを作成し、AIスタイリスト・プロジェクト内のREADME.mdファイルのセットアップ手順に従って、ローカル・マシン上でStreamlitアプリケーションを起動してください。ステップ・バイ・ステップで進めたい場合は、Jupyter Notebookを作成し、チュートリアルを進めてください。
このチュートリアルには、いくつかのライブラリーとモジュールが必要です。以下を必ずインポートしてください。それらがインストールされていない場合は、pipをクイックインストールすることで問題が解決されます。
認証情報を設定するには、ステップ1.で生成した
正常な認証情報をカプセル化するには、
config/agents.yaml
また、
LLMで読みやすい方法で画像をエンコードするには、画像をバイトにエンコードしてから、UTF-8表現にデコードします。この場合、画像はローカルの画像ディレクトリーにあります。サンプル画像は、GitHubリポジトリーのAIスタイリストディレクトリで見つけることができます。
画像をロードしてエンコードしたので、Visionモデルにクエリを実行できます。私たちのプロンプトは、私たちが有効なJSONのアウトプットを求める際にモデルの創造性を制限するために、希望するアウトプットに特化しています。各画像の説明、カテゴリー、場面を次のリストに保存します:
アウトプット:
{
"description": "A pair of polished brown leather dress shoes with a brogue detailing on the toe box and a classic oxford design.",
"category": "shoes",
"occasion": "formal"
}
{
"description": "A pair of checkered trousers with a houndstooth pattern, featuring a zippered pocket and a button closure at the waist.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A light blue, button-up shirt with a smooth texture and a classic collar, suitable for casual to semi-formal occasions.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of khaki pants with a buttoned waistband and a button closure at the front.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A blue plaid shirt with a collar and long sleeves, featuring chest pockets and a button-up front.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of bright orange, short-sleeved t-shirts with a crew neck and a simple design.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A pair of blue suede sneakers with white laces and perforations, suitable for casual wear.",
"category": "shoes",
"occasion": "casual"
}
{
"description": "A pair of red canvas sneakers with white laces, isolated on a white background.",
"category": "shoes",
"occasion": "casual"
}
{
"description": "A pair of grey dress pants with a smooth texture and a classic design, suitable for formal occasions.",
"category": "pants",
"occasion": "formal"
}
{
"description": "A plain white T-shirt with short sleeves and a crew neck, displayed from the front and back.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "A black short-sleeved t-shirt with a crew neck and a simple design.",
"category": "shirt",
"occasion": "casual"
}
{
"description": "Black pants with a zippered pocket and a buttoned fly, showing the waistband and pocket details.",
"category": "pants",
"occasion": "casual"
}
{
"description": "A pair of tan leather boots with a chunky sole and a high-top design, suitable for casual wear.",
"category": "shoes",
"occasion": "casual"
}
これで、衣服や靴の各アイテムが分類されたため、推論モデルが選択した機会に合わせた服装を生成するのがはるかに簡単になります。推論モデルをインスタンス化してクエリーしてみましょう
ファイル名を画像の説明と一致させるには、画像の説明のリストを列挙し、各フィールドの各項目の説明、カテゴリー、場面、ファイル名を格納する辞書のリストを作成できます。
ここで、Granite 3.2モデルに推論を含めてクエリーし、指定された基準を満たす服を作成してみましょう。作成には、
アウトプット:
私の思考プロセスは次のとおりです。
- 秋の公園でのカジュアルな朝に適した服装が必要です。
-「カジュアル」な場面のカテゴリに合うシャツ1枚、パンツ1本、靴1足を選択します。
- フォーマルなアイテムや過度に着飾ったアイテムを避け、公園でのアクティビティーに快適なアイテムを選択します。
私の答えは次のとおりです。
秋の公園でのカジュアルな朝には、次の服装を提案します:
1. **シャツ**:カラー付きロングスリーブブルーチェックシャツ(ファイル:「image13.jpeg」)
- チェックパターンは秋の定番であり、カジュアルな公園シーンにぴったりです。長袖は、朝の肌寒い気温からある程度守ってくれます。
2. **パンツ**:ウエストバンドにボタンがあり、フロントボタン留めのカーキ色のパンツ (ファイル:「image7.jpeg」)
- カーキはカジュアルな雰囲気にマッチし、チェックシャツとのバランスにも優れた万能な色です。実用的で快適に歩くことができます。
3. **靴**: 厚底のハイカットデザインのタンレザーブーツ(ファイル:「image3.jpeg」)
- タンレザーブーツはスタイリッシュでありながら快適な選択肢です。厚底のソールはグリップ力とサポート力に優れ、公園の小道や凹凸がある地面を歩くのに最適です。
この組み合わせは、快適さと実用性を考慮しながら、カジュアルな朝のお出かけに適したリラックスしたまとまりのあるルックスになっています。
生成された衣服の説明を使用して、モデルが推奨する衣服も表示できます。これを行うには、ファイル名を抽出するだけで済みます。モデルが同じファイル名について2回言及している場合は、画像リストを反復する際に、その画像がまだ表示されていないかどうかを確認することが重要です。これは、表示済みの画像を
このチュートリアルでは、AIを使用してユーザーの特定のイベントにスタイリングに関するアドバイスを提供するシステムを構築しました。ユーザーの衣服の写真または製品の画面を使用して、指定された基準を満たすようにカスタマイズされます。Granite-Vision-3-2-2bモデルは、各項目のラベル付けと分類において重要でした。さらに、Granite-3-2-8B-instructモデルは推論機能を活用して、パーソナライズされた服装のアイデアを生成しました。
このアプリケーションを構築するための次のステップには、次のようなものがあります。
AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。