より大きなモデルgpt-oss-120bには1,168億のパラメータが含まれており、Mixture of Experts（MoE）アーキテクチャーを使用しているため、常にモデルの一部だけがアクティブになります。この設計により、データセンターで広く使用されている単一のNVIDIA H100 GPU上で効率的に実行できます。小規模モデルであるgpt-oss-20bは、16GBのメモリを搭載したノートPCなどの消費者向けデバイスに最適化されています。

どちらのモデルも、低、中、高の調整可能な推論レベルをサポートしているため、ユーザーはアウトプット品質とコスト、速度のバランスを取ることができます。モデルは推論チェーン全体のアウトプットを生成するため、ユーザーは最終的な答えだけを受け取るのではなく、結論にどのように到達したかを確認することができます。OpenAI社は、これにより透明性が向上し、モデルのデバッグと信頼性が容易になると述べています。

OpenAI社は、大規模なモデルがいくつかの推論および数学タスクにおいて競争力を持って実行されることを示すベンチマーク・スコアを発表しました。一般知識の標準テストであるMMLUベンチマークでは90点を獲得しました。GPQA科学ベンチマークでは80.1でした。AIME 2025の数学テストでは、97.9のスコアを達成し、象徴的な推論における強力な機能を示しています。

このモデルには、画像や音声、動画の理解は含まれておらず、コンテンツ・フィルターやモダナイゼーション・システムは装備されていません。テキスト専用であり、ユーザーはモデルのデプロイ方法に応じて独自の安全対策を実装することが求められます。ユーザーは、Granite Guardianをgpt-ossと併用して、プロンプトと応答におけるリスクの検知を支援するガードレール・モデルとして活用できます。