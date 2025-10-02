Granite 4.0の発売は、IBMのエンタープライズ対応の大規模言語モデル・ファミリーにとって新時代の始まりです。斬新なアーキテクチャーの進歩を活用して、コストとレイテンシーを削減しながら競争力のある性能を提供し、小規模で効率的な言語モデルを強化しています。Granite 4.0モデルは、スタンドアロンのデプロイメントと、大規模な推論モデルと並行して複雑なシステムにおけるコスト効率の高い構成要素の両方で、エージェント・ワークフローに不可欠なタスクに特に重点を置いて開発されました。

Granite 4.0コレクションは、複数のモデル・サイズとアーキテクチャー・スタイルで構成されており、次のような幅広いハードウェア制約にわたって最適な制作を提供します。

Granite-4.0-H-Small 、合計32Bのパラメーター（内アクティブは9B）のハイブリッド型Mixture of Experts（MoE）モデル

、合計32Bのパラメーター（内アクティブは9B）のハイブリッド型Mixture of Experts（MoE）モデル Granite-4.0-H-Tiny 、合計7Bのパラメーター（内アクティブは1B）のハイブリッド型MoEモデル

、合計7Bのパラメーター（内アクティブは1B）のハイブリッド型MoEモデル Granite-4.0-H-Micro 、3Bのパラメーターを備えた高密度ハイブリッド・モデル

、3Bのパラメーターを備えた高密度ハイブリッド・モデル このリリースには、Granite-4.0-Micro、ハイブリッド・アーキテクチャーをまだサポートしていないプラットフォームやコミュニティーに対応するために、従来の注意駆動型Transformerアーキテクチャーを備えた3B高密度モデル。

Granite 4.0-H Smallは、マルチツール・エージェントやカスタマー・サポート・オートメーションなどのエンタープライズ・ワークフローにおいて、強力でコスト効率の高い性能を実現する主力モデルです。TinyモデルとMicroモデルは、低遅延、エッジおよびローカル・アプリケーション向けに設計されており、関数呼び出しなどの主要なタスクを高速に実行するための、大規模なエージェント・ワークフロー内の構成要素としても機能します。

Granite 4.0ベンチマークの性能は、最小のGranite 4.0モデルであっても、Granite 3.3 8B（その半分未満のサイズにもかかわらず）を大幅に上回っています。しかし、その最も顕著な強みは、推論効率の顕著な向上です。従来のLLMと比較して、ハイブリッドGranite 4.0モデルは、実行に必要なRAMが大幅に少なくて済みます。特に、長いコンテキストのタスク（大規模なコードベースや広範な文書の取り込みなど）や、同時に複数のセッションを伴うタスク（多くの詳細なユーザーの問い合わせを同時に処理するカスタマー・サービス・エージェント）の場合に必要です。

最も重要なことは、このGranite 4.0のメモリ要件の劇的な削減は、高速な推論速度で大量のワークロードを実行するために必要なハードウェアのコストも同様に劇的に削減できることです。私たちの目標は、企業やオープンソース開発者に、競争力の高いLLMへのコスト効率の高いアクセスを提供することで、参入障壁を下げることです。