サードパーティ製の基盤モデル

IBM ( watsonx.ai )では、サードパーティ製の基盤モデルコレクションから選択することができます基盤モデル

watsonx.ai: では、以下のモデルが利用可能です

これらのモデルの導入方法の詳細や、価格およびコンテキストウィンドウの長さに関する概要については、こちらをご覧ください 対応している基盤モデル

基盤モデルIBM モデルに関する詳細については、を参照してください IBM 基盤モデル

モデルの選び方

対応タスクや言語など、モデル選びの参考になる要素については、および モデルの選択 を参照してください 基盤モデル

非推奨基盤モデルには、非推奨の警告アイコンが表示されます 警告アイコン。 モデルの非推奨および提供終了に関する詳細については、こちらをご覧ください 基盤モデルサイクル

基盤モデル

watsonx.ai の基盤モデルは、自然言語とプログラミング言語の両方において、幅広いユースケースに対応しています。 これらのモデルがどのようなタスクを実行できるかを確認するには、 サンプルプロンプトを確認し、試してみてください。 基盤モデルデマンド展開用基盤モデルの価格詳細については、 「オンデマンド展開モデルの時間単位の課金料金」 を参照してください。

重要:

IBM Cloud で、 watsonx のリージョンがダラスデータセンターになっている場合は、モデルカードのリンクに従ってください。 それ以外の場合は、リソースハブでモデル名を検索してください。 このモデルは、すべての地域やクラウドプラットフォームで利用できない場合があります。

allam-1-13b-instruct

重要: このモデルは非推奨となっており、2026年6月8日に廃止を終了します。

「 allam‑1‑13b‑instruct基盤モデル、国立人工知能センターが提供する、アラビア語と英語のバイリンガル大規模言語モデルです。 このモデルはサウジアラビアデータ・人工知能庁の支援を受けており、対話タスクに対応できるよう微調整されています。 ALLaM シリーズは、アラビア語技術の発展を目的として設計された、高性能な言語モデルのコレクションです。 これらのモデルは、 Llama-2 の重みで初期化され、アラビア語と英語の両方で学習が行われます。

注:Prompt Lab からこのモデルを推論する際は、AIガードレールを無効にしてください。
使用状況
アラビア語でのQ&A、要約、分類、生成、抽出、翻訳に対応しています。
size
130億のパラメータ
使用可能
  • マルチテナント型ハードウェア上に展開された IBM によって提供されます。
  • 専用利用のためにオンデマンドで展開します。
APIの料金プラン
マルチテナントモデルのデプロイメントにおけるクラス2。 価格の詳細については、 表3を参照してください。 専用利用の料金詳細については、 表5を参照してください
試してみる
サンプルを使って試してみてください:
トークンの上限
コンテキストウィンドウの長さ(入力+出力):4,096
対応している自然言語
アラビア語(現代標準アラビア語)および英語
インストラクションのチューニングに関する情報
allam-1-13b-instruct これは、 Allam-13b-base モデルを基盤としています。このモデルは、初期化時に使用されたトークンを含め、英語とアラビア語の合計3兆トークンで事前学習された基盤モデルです。 クリーニングと重複排除を行った後、アラビア語のデータセットには5,000億トークンが含まれています。 追加データは、オープンソースのコレクションやウェブクローリングから収集されています。 allam-1-13b-instruct基盤モデルは、厳選された400万件のアラビア語と600万件の英語のプロンプトと応答のペアを用いてファイン・チューニングされています。
モデルアーキテクチャ
デコーダーのみ
使用許諾条件
Llama 2 コミュニティライセンスおよび ALLaM ライセンス
詳細情報
モデル・カード

codellama-34b-instruct-hf

Llama 2 に基づくプログラムコード Meta生成モデル。 Code Llama コードの作成や議論を行うためにファイン・チューニングされています。

使用状況
Code Llama を使用して、自然言語の入力に基づいてコードを生成したり、コードを解説したり、コードを補完・デバッグしたりするプロンプトを作成します。
注:Prompt Lab からこのモデルを推論する際は、AIガードレールを無効にしてください。
size
340億のパラメータ
使用可能
専用利用のためにオンデマンドで展開します。
APIの料金プラン
価格の詳細については、 表5を参照してください。
試してみる
サンプルを使って試してみてください:
トークンの上限
コンテキストウィンドウの長さ(入力+出力):16,384
注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、8,192個に制限されています。
対応している自然言語
英語
サポートされるプログラミング言語
codellama-34b-instruct-hf基盤モデルモデルは、 Python、C++、Java、PHP、TypeScript( JavaScript )、C#、Bashなど、多くのプログラミング言語に対応しています。
インストラクションのチューニングに関する情報
この微調整版モデルは、自然言語による指示の入力と期待される出力を用いて学習され、モデルが自然言語で有用かつ安全な回答を生成できるよう誘導されています。
モデルアーキテクチャ
デコーダー
使用許諾条件
使用許諾条件
詳細情報
以下の資料をお読みください:

codestral-2501

codestral-2501基盤モデルは、によって開発された最先端の Mistral AIコーディングモデルです。 このモデルは、オリジナルの codestral-22b モデルを基にしており、より効率的なアーキテクチャと改良されたトークナイザーを備えています。 codestral-2501 モデルは、コード生成およびコード補完の処理を、元のモデルに比べて約2倍の速度で実行します。

使用状況

codestral-2501 は、低遅延・高頻度なユースケース向けに最適化されており、フィル・イン・ザ・ミドル(FIM)、コード補正、テストケースの生成などのタスクに対応しています。

size

220億のパラメータ

使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

価格の詳細については、 「オンデマンド型デプロイの時間単位課金料金」 をご覧ください。

試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):256,000 注:

  • リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、8,192個に制限されています。
対応している自然言語

英語

インストラクションのチューニングに関する情報

codestral-2501 モデルは、 Python、Java、C、C++、 JavaScript,、Bashなどの一般的な言語を含め、80以上のプログラミング言語に対応しています。 このモデルは、Swiftや Fortran といったより専門的な言語でも問題なく動作します。

モデルアーキテクチャ

デコーダー

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

DeepSeek-R1 精選モデル

Llama 3.1モデルをベースにした DeepSeek-R1 モデルの精選版は、 DeepSeek AIによって提供されています。 DeepSeek-R1 モデルは、強力な推論機能を備えたオープンソースのモデルです。 DeepSeek ( R1 )モデルによって生成されたデータサンプルは、ベースとなるLlamaモデルのファイン・チューニングに使用されます。

deepseek-r1-distill-llama-8b および deepseek-r1-distill-llama-70b モデルは、それぞれ Llama 3.1 8B および Llama 3.3 70B モデルに基づいた、 DeepSeek-R1 モデルの簡略版です。

使用状況

主に「 few-shot 」や「」 zero- といったプロンプトと共に使用され、要約、分類、推論、コーディング、数学などの指示に従うタスクにおいて優れた性能を発揮するように設計されています。

取り扱いサイズ
  • 80億のパラメータ
  • 700億のパラメータ
使用可能

8b および 70b: 専用利用向けにオンデマンドでデプロイします。

APIの料金プラン

8b: 小さい

70b: 大きい

専用利用の料金詳細については、 表5を参照してください。

試してみる

サンプルを使って試してみてください:

トークンの上限

コンテキストウィンドウの長さ(入力+出力):

  • deepseek-r1-distill-llama-8b: 131,072
  • deepseek-r1-distill-llama-70b: 131,072

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、32,768個に制限されています。

対応している自然言語

英語

インストラクションのチューニングに関する情報

DeepSeek-R1 モデルは、事前処理として教師ありファイン・チューニング (SFT)を行わずに、大規模強化学習(RL)を用いて学習されます。 その後のRL(強化学習)およびSFT(スーパーファインチューニング)の段階では、推論パターンの改善と、モデルを人間の好みに合わせることを目的としています。 DeepSeek-R1-Distill モデルは、 DeepSeek-R1 で生成されたサンプルを用いて、オープンソースのモデルを基にファイン・チューニングされています。

モデルアーキテクチャ

デコーダー

使用許諾条件

8b: ライセンス

70b: ライセンス

詳細情報

以下の資料をお読みください:

EuroLLM 指示する

EuroLLM シリーズのモデルは、UTTER(Unified Transcription and Translation for Extended Reality)プロジェクトおよび欧州連合によって開発されました。 EuroLLM のInstructモデルは、欧州連合(EU)の公用語24言語すべてに加え、商業的・戦略的に重要な11の国際言語におけるテキストの理解と生成に特化したオープンソースモデルです。

使用状況

一般的な指示の遵守や言語翻訳など、多言語対応のタスクに適しています。

サイズ
  • 1.7 10億個のパラメータ
  • 90億のパラメータ
使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

1.7b: 小さい

9b: 小さい

専用利用の料金詳細については、 表5を参照してください。

トークンの上限

コンテキストウィンドウの長さ(入力+出力):

  • eurollm-1-7b-instruct: 4,096
  • eurollm-9b-instruct: 4,096
対応している自然言語

ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、アイルランド語、イタリア語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語、アラビア語、カタロニア語、中国語、ガリシア語、ヒンディー語、日本語、韓国語、ノルウェー語、ロシア語、トルコ語、ウクライナ語。

インストラクションのチューニングに関する情報

これらのモデルは、ウェブデータ、並列データ、ウィキペディア、Arxiv、多数の書籍、およびApolloデータセットから収集された、対応する自然言語の4兆トークンを用いて学習されています。

モデルアーキテクチャ

デコーダー

使用許諾条件

Apache 2.0 ライセンス

詳細情報

以下の資料をお読みください:

gpt-ossモデル

GPT-OSS 基盤モデルである gpt-oss-20b および gpt-oss-120b は、 OpenAI’s で公開されているオープンウェイトモデルであり、高度な推論、エージェント型タスク、および開発者の多様なユースケースに対応するように設計されています。 これらのモデルは、生産環境での利用、汎用的な用途、および高度な推論を目的として設計されており、さまざまな特殊なユースケースに合わせてファイン・チューニングが可能です。

タスクに合わせて、システムのプロンプトの推論レベルを以下の3段階から設定できます:

  • :一般的な会話では応答が速い。
  • 表現 :スピード感と細部の描写のバランスが取れている。
  • 長所 :深く詳細な分析。
使用状況
Q&A、要約、分類、生成、抽出、翻訳、関数呼び出し、およびコード生成・変換に対応しています。
size
  • 200億のパラメータ
  • 1,200億のパラメータ
使用可能
  • 120b: マルチテナント型ハードウェア上に展開された IBM によって提供されます。
  • 20b および 120b: 専用利用向けにオンデマンドでデプロイします。
APIの料金プラン
120b:
入力層:クラス8、出力層:クラス1。 価格の詳細については、 表3を参照してください。
「 20b 」および「 120b 」のオンデマンド展開に関する料金の詳細については、 「オンデマンド展開モデルの時間単位課金料金」 を参照してください。
トークンの上限
コンテキストウィンドウの長さ(入力+出力):
  • gpt-oss-20b: 131,072
  • gpt-oss-120b: 131,072
対応している自然言語
英語 gpt-oss-120b基盤モデルは、多言語理解に対応しています。
インストラクションのチューニングに関する情報
主に英語で構成されたテキストのみのデータセットを用いて事前学習されており、STEM、コーディング、および一般教養に重点を置いています。
モデルアーキテクチャ
デコーダー
使用許諾条件
Apache 2.0 ライセンス
詳細情報
以下の資料をお読みください:

Llama 4のトレーニングモデル

Llama 4の基盤モデルコレクションは、によって提供されています Meta。 llama-4-maverick-17b-128e-instruct-fp8 および llama-4-scout-17b-16e-instruct-fp8-dynamic は、テキストおよび画像の理解において最適化された最高水準の性能を実現するため、ミクスチャー・オブ・エキスパート( MoE )アーキテクチャを採用したマルチモーダルモデルです。 llama-4-maverick-17b-128e-instruct-int4 モデルは、基本モデルの量子化版であり、重みが INT4 データ型に変換されています。

Llama 4 Maverickモデルは、128人の専門家を擁する、170億のアクティブパラメータを持つマルチモーダルモデルです。 Llama 4 Scoutモデルは、16人の専門家を擁する、170億のアクティブパラメータを持つモデルです。

制約事項:

llama-4-maverick-17b-128e-instruct-fp8基盤モデルでは、一部のパラメータがサポートされていません。 詳細については、 「既知の問題と制限事項」 を参照してください。

使用状況

チャットボットのように多言語の対話出力を生成し、モデル固有のプロンプト形式を採用しています。視覚認識、画像推論、キャプション生成、および画像に関する一般的な質問への回答に最適化されています。

size

170億のパラメータ

使用可能
  • llama-4-maverick-17b-128e-instruct-fp8 ※: IBM がマルチテナント型ハードウェア上で提供され、専用利用のためにオンデマンドでデプロイされる場合に限ります。
  • llama-4-maverick-17b-128e-instruct-int4: 専用利用のためにオンデマンドで展開します。
  • llama-4-scout-17b-16e-instruct-fp8-dynamic: 専用利用のためにオンデマンドで展開します。
APIの料金プラン
  • 入力階層:クラス
    9 出力階層:クラス16。 マルチ llama-4-maverick-17b-128e-instruct-fp8 テナント デプロイメント モデルの導入に関する価格の詳細については、 表3を参照してください。
  • 専用利用の料金詳細については、 「オンデマンド型デプロイの時間単位課金料金」 をご覧ください。
試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):

  • llama-4-maverick-17b-128e-instruct-fp8 合計:131,072
  • llama-4-maverick-17b-128e-instruct-int4: 131,072
  • llama-4-scout-17b-16e-instruct-fp8-dynamic: 131,072

リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、8,192個に制限されています。

対応している自然言語

アラビア語、英語、フランス語、ドイツ語、ヒンディー語、インドネシア語、イタリア語、ポルトガル語、スペイン語、タガログ語、タイ語、ベトナム語。

インストラクションのチューニングに関する情報

Llama 4は、200言語というより広範なデータセットを用いて事前学習されています。 Llama 4 Scoutモデルは約40兆トークン、Llama 4 Maverickモデルは約22兆トークンのマルチモーダルデータを用いて事前学習されており、 Metaこれらのデータは一般公開されている情報およびライセンス供与された情報から構成されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件
詳細情報

以下の資料をお読みください:

Llama 3.3 70B Instruct

Llama 3Meta .3は、700億のパラメータを持つ、事前学習および指示調整済みの生成モデル(テキスト入力/テキスト出力)です。

llama-3-3-70b-instruct は、人気のある Llama 3.1 70B Instruct 基盤モデルを改良したものです。 Llama 3.3 基盤モデルは、コーディング、段階的な推論、およびツールの呼び出しにおいて優れています。 Llama 3.3モデルは小型ながら、 Llama 3.1 405b モデルと同等の性能を発揮するため、開発者にとって最適な選択肢となっています。

使用状況

チャットボットのように多言語の対話応答を生成します。 モデル固有のプロンプト形式を使用します。

size

700億のパラメータ

使用可能
  • このモデルの量子化版は、マルチテナント型ハードウェア上に展開された IBM によって提供されています。

  • 専用用途向けに、オンデマンドで導入可能な2つのモデルが用意されています:

    • llama-3-3-70b-instruct-hf: Metaにより Hugging Face 公開されたオリジナル版。
    • llama-3-3-70b-instruct: 4基のGPUではなく、2基のGPUでデプロイ可能な、量子化されたモデル。
APIの料金プラン

マルチテナントモデルの llama-3-3-70b-instructデプロイメントイメント用クラス13。 価格の詳細については、 表3を参照してください。
専用利用の料金詳細については、 「オンデマンド型デプロイの時間単位課金料金」 をご覧ください。

試してみる

サンプルを使って試してみてください:

トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

対応している自然言語

英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語

インストラクションのチューニングに関する情報

Llama 3.3は、公開されているデータソースから収集した15兆トークンのデータを用いて事前学習されました。 微調整データには、公開されている命令データセットに加え、2,500万件以上の合成データが含まれています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件
詳細情報

以下の資料をお読みください:

Llama 3.2 Vision Instruct

Llama 3.2 Meta の基盤モデルコレクションは、によって提供されています Meta。 llama-3-2-11b-vision-instruct および llama-3-2-90b-vision-instruct モデルは、文書レベルの理解、図表の解釈、画像へのキャプション付けなど、画像を入力としてテキストを出力するユースケース向けに設計されています。

使用状況

チャットボットのような対話形式の出力を生成し、分類、物体検出・識別、画像からテキストへの変換(手書きを含む)、文脈に応じたQ&A、データ抽出・処理、画像比較、および個人向け視覚支援などのコンピュータビジョンタスクを実行できます。 モデル固有のプロンプト形式を使用します。

サイズ
  • 110億のパラメータ
  • 900億のパラメータ
使用可能
  • 11b および 90b: は、マルチテナント型ハードウェア上に展開された IBM によって提供されています。
  • 11b および 90b: 専用利用向けにオンデマンドでデプロイします。

警告アイコン IBM による llama-3-2-90b-vision-instruct基盤モデルモデルのデプロイメントは、非推奨となりました。 参照 基盤モデルサイクル

APIの料金プラン
  • 11b: 9組
  • 90b: クラス10 マルチテナント デプロイメント モデルの導入に関する価格の詳細については、 表3を参照してください。

専用利用の料金詳細については、 「オンデマンド型デプロイの時間単位課金料金」 をご覧ください。

試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力)

  • llama-3-2-11b-vision-instruct : 131,072
  • llama-3-2-90b-vision-instruct: 131,072

リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、8,192個に制限されています。 モデルに送信する画像のカウント対象となるトークンは、コンテキストウィンドウの長さには含まれません。

対応している自然言語

英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語(テキスト入力のみ)。 入力に画像が含まれている場合のみ、英語を使用してください。

インストラクションのチューニングに関する情報

Llama 3.2 Vision これらのモデルは、中核となる大規模言語モデルの重みとは別に学習された、画像推論アダプターの重みを使用しています。 この分離により、モデルの一般的な知識が保持され、事前学習時と実行時の両方でモデルの効率が向上します。 これらの Llama 3.2 Vision モデルは、60億組の画像とテキストのペアを用いて事前学習されており、 Llama 3.1 70B 基盤モデル単体を事前学習するのに必要な計算リソースよりもはるかに少ないリソースで済みました。 Llama 3.2モデルは、入力に応じて画像推論に必要な計算リソースのみを動的に確保できるため、効率的に動作します。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件
詳細情報

以下の資料をお読みください:

llama-guard-3-11b-vision

重要: このモデルは非推奨となっており、2026年6月8日に廃止を終了します。

Llama 3.2 Meta の基盤モデルコレクションは、によって提供されています Meta。 llama-guard-3-11b-vision は、テキストのみを扱う Llama-Guard-3 モデルの多模態版です。 このモデルは、ユーザー入力に含まれる画像やテキストのコンテンツを「安全」または「危険」に分類するために使用できます(プロンプト分類)。

使用状況

このモデルを使用して、画像からテキストへのプロンプトに含まれる画像やテキストの安全性を確認してください。

size
  • 110億のパラメータ
使用可能

マルチテナント型ハードウェア上に展開された IBM によって提供されます。

APIの料金プラン

マルチテナントモデルのデプロイメントプロイメント用クラス9。 価格の詳細については、 表3を参照してください。

試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、8,192個に制限されています。 モデルに送信する画像のカウント対象となるトークンは、コンテキストウィンドウの長さには含まれません。

対応している自然言語

英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語(テキスト入力のみ)。 入力に画像が含まれている場合のみ、英語を使用してください。

インストラクションのチューニングに関する情報

コンテンツの安全性分類向けにファイン・チューニングされた事前学習済みモデル。 安全ではないと分類されるコンテンツの種類に関する詳細については、モデルカードをご覧ください。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件
詳細情報

以下の資料をお読みください:

Llama 3.1ベース

Llama 3.1 Meta の基盤モデルコレクションは、によって提供されています Meta。 Llama 3.1 基盤モデルベースファウンデーションモデルである llama-3-1-8b と llama-3-1-70b は、道具の使用をサポートし、全体的に優れた推論能力を備えた多言語モデルです。

使用状況

長文の要約や、多言語対応の対話型エージェント、コーディングアシスタントでの利用に適しています。

微調整の目的で、 Llama 3.1モデルファミリーの以下の基盤モデルを使用できます:

  • llama-3-1-8b
  • llama-3-1-70b-gptq
サイズ
  • 80億のパラメータ
  • 700億のパラメータ
使用可能

8b および 70b: 専用利用向けにオンデマンドでデプロイします。

APIの料金プラン

価格の詳細については、 表5を参照してください。

試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):

  • llama-3-1-8b: 131,072
  • llama-3-1-70b: 131,072
対応している自然言語

英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語

モデルアーキテクチャ

デコーダーのみ

使用許諾条件
詳細情報

以下の資料をお読みください:

Llama 3.1 Instruct

Llama 3.1 Meta の基盤モデルコレクションは、によって提供されています Meta。 Llama 3.1 基盤モデルは、多言語対話ユースケース向けに最適化された、事前学習済みかつ指示調整済みのテキスト専用生成モデルです。 これらのモデルは、人間のフィードバックを用いたファイン・チューニングあり微調整と強化学習を活用し、有用性や安全性といった人間の好みに合わせて調整されています。

llama-3-405b-instruct-fp8 モデルは、 Llama 3.1ファミリーの中で最大のオープンソース基盤モデルです Meta。 基盤モデル、合成データ生成器、学習後のデータランク付け評価器、あるいは推論に適した派生モデルの専門的な能力を向上させるモデルティーチャー/スーパーバイザーとしても活用できます。

使用状況
チャットボットのような対話形式の出力を生成します。 モデル固有のプロンプト形式を使用します。
サイズ
  • 80億のパラメータ
  • 700億のパラメータ
  • 4,050億個のパラメータ
使用可能
  • 8b、 70b および 405b: 専用利用のためにオンデマンドでデプロイします。
APIの料金プラン
専用利用の料金詳細については、 表5を参照してください。
試してみる
トークンの上限
コンテキストウィンドウの長さ(入力+出力)
  • 8b: 131,072

  • 70b: 131,072

  • 405b: 16,384

    • このモデルは131,072文字のコンテキストウィンドウに対応していますが、モデルが応答を生成するのにかかる時間を短縮するため、ウィンドウは16,384文字に制限されています。
  • リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、4,096個に制限されています。

対応している自然言語
英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語。
インストラクションのチューニングに関する情報
Llama 3.1は、公開されているデータソースから収集した15兆トークンのデータを用いて事前学習されました。 微調整データには、公開されている命令データセットに加え、2,500万件以上の合成データが含まれています。
モデルアーキテクチャ
デコーダーのみ
使用許諾条件
詳細情報
以下の資料をお読みください:

Llama 3 Instruct

基盤モデルLlama 3Meta モデルファミリーは、OpenAIによって開発 Llama 3Meta され、OpenAIが Meta OpenAI.ai上で提供している Hugging Face、誰でも利用可能なオープンな大規模言語モデルです。 Llama 3基盤モデルは、さまざまなユースケースに対応可能な、指示ファイン・チューニング言語モデルです。

使用状況

チャットボットのような対話形式の出力を生成します。

サイズ
  • 80億のパラメータ
  • 700億のパラメータ
使用可能
  • 専用利用のためにオンデマンドで展開します。
APIの料金プラン

専用利用の料金詳細については、 表5を参照してください。

試してみる

プロンプト例: Llama 3 と会話する

トークンの上限

コンテキストウィンドウの長さ(入力+出力)

  • llama-3-8b-instruct: 8,192
  • llama-3-70b-instruct: 8,192

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、4,096個に制限されています。

対応している自然言語

英語

インストラクションのチューニングに関する情報

Llama 3 トレーニング後の処理手順が改善され、誤拒否率の低減、アライメントの向上、 基盤モデル基盤モデルの出力の多様性の向上が図られています。 その結果、推論能力、コード生成能力、および指示に従う能力が向上します。 Llama 3 より多くのトレーニングトークン( 15T )を持つほど、言語理解能力が高まる。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

META LLAMA 3 コミュニティライセンス

詳細情報

以下の資料をお読みください:

Llama 2 Chat

これらの Llama 2 Chat モデルは、によって Meta 提供されています。 Hugging Face ファイン・チューニングモデルは、チャット生成に有用です。 これらのモデルは、一般に公開されているオンラインデータを用いて事前学習され、人間のフィードバックに基づく強化学習を用いてファイン・チューニング。

使用状況
チャットボットのような対話形式の出力を生成します。 モデル固有のプロンプト形式を使用します。
size
  • 700億のパラメータ
使用可能
  • 70b: 専用利用のためにオンデマンドで展開します。
APIの料金プラン
専用利用の料金詳細については、 表5を参照してください。
試してみる
サンプルを使って試してみてください:
トークンの上限
コンテキストウィンドウの長さ(入力+出力)
  • 70b: 4,096
対応している自然言語
英語
インストラクションのチューニングに関する情報
Llama 2 公開されているデータソースから収集した2兆トークンのデータを用いて事前学習が行われた。 ファイン・チューニングデータには、公開されている学習用データセットに加え、人間によってアノテーションが施された100万件以上の新規例が含まれています。
モデルアーキテクチャ
デコーダーのみ
使用許諾条件
使用許諾条件
詳細情報
以下の資料をお読みください:

ミニストラル3

ministral-3b-instruct-2512 および ministral-8b-instruct-2512 は、によって開発された Mistral AI、教師データファイン・チューニング基盤モデルです。 Ministral 3 デプロイメント はエッジ展開向けに設計されており、さまざまな環境でモデルを実行できる柔軟性を提供します。 これらのモデルは、視覚処理機能を備えた高性能かつ効率的な小型言語モデルであり、チャットや指示ベースのユースケースに最適です。

使用状況
分類、生成、抽出、翻訳、 検索拡張生成、コード生成、関数呼び出しなどに適しています。
size
30億パラメータ 80億パラメータ
使用可能
  • 3b および 8b: 専用利用向けにオンデマンドでデプロイします。
APIの料金プラン
専用利用の料金詳細については、 「オンデマンド型デプロイの時間単位課金料金」 をご覧ください。
試してみる
サンプル・プロンプト
トークンの上限
コンテキストウィンドウの長さ(入力+出力):
  • 3b: 262,144
  • 8b: 262,144
対応している自然言語
英語、フランス語、スペイン語、ドイツ語、イタリア語、ポルトガル語、オランダ語、中国語、日本語、韓国語、アラビア語、およびその他数十の言語。
サポートされるプログラミング言語
Ministral 3 基盤モデルは、複数のプログラミング言語を用いて学習されています。
インストラクションのチューニングに関する情報
Ministral 3 基盤モデルは、多言語データやコードデータが大部分を占めるデータセットを用いて学習されています。
モデルアーキテクチャ
デコーダーのみ
使用許諾条件
上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。
詳細情報
以下の資料をお読みください:

ministral-8b-instruct

ministral-8b-instruct基盤モデルは、によって開発された指示ファイン・チューニングMistral AI微調整モデルです。 ministral-8b-instruct モデルは、デバイス内での演算処理、ローカルでのインテリジェンス、およびエッジ環境でのユースケース向けに最適化されています。 このモデルは、エッジデバイス上で実行され、プライバシーを最優先とした推論を必要とする重要な用途において、高い性能を発揮します。

使用状況

翻訳、関数呼び出し、推論タスクに適しており、テキストの理解や変換、オフライン対応のスマートアシスタント、ローカル分析、自律型ロボットなどを含みます。

size

80億のパラメータ

使用可能
  • 専用利用のためにオンデマンドで展開します。
APIの料金プラン

専用利用の料金詳細については、 5およびオンデマンド型モデルの時間単位課金料金をご参照ください。

ご注意: この基盤モデルには、利用時間ごとに追加の利用料が適用されます。
試してみる

サンプル・プロンプト

トークンの上限

コンテキストウィンドウの長さ(入力+出力):32,768

対応している自然言語

英語、フランス語、ドイツ語、イタリア語、スペイン語、およびその他数十の言語。

サポートされるプログラミング言語

ministral-8b-instruct モデルは、いくつかのプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

ministral-8b-instruct基盤モデルは、多言語データやコードデータが大部分を占めるデータセットを用いて学習されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報

以下の資料をお読みください:

mistral-large-2512

このモデルは非推奨となっており、2026年6月8日に廃止が終了します。

mistral-large-2512 (別名 Mistral Large 3)は、 Mistral AIによって開発された大規模言語モデルである。 mistral-large-2512基盤モデルは、きめ細かな「専門家混合(MiXe)」アーキテクチャを採用した、最先端のオープンウェイト型汎用マルチモーダルモデルです。 このモデルは指示に基づく後学習が施されており、信頼性と長文の理解力を重視して設計されています。 Mistral Large の3つの基盤モデルは、実運用レベルの支援ツール、検索機能強化システム、科学分野のワークロード、および複雑なエンタープライズワークフロー向けに設計されています。 mistral-large-2512 には大きなコンテキストウィンドウが備わっているため、 検索拡張生成 (RAG)のユースケースで送信するプロンプトに、大規模なドキュメントをコンテキスト情報として追加することができます。

その他の入門情報については、ウェブ Mistral AI サイトの 「 watsonx.ai 」ページをご覧ください。

使用状況

テキストの理解、変換、コード生成など、複雑な多言語推論タスクに適しています。 チャット、エージェント型、および指示ベースのユースケースに最適です。 このモデルはコンテキストウィンドウが広いため、モデルにプロンプトを送る際は、max tokens パラメータを使用してトークンの上限を指定してください。

使用可能
  • マルチテナント型ハードウェア上に展開された IBM によって提供されます
  • 専用利用のためにオンデマンドで展開する
APIの料金プラン
  • 入力レベル:クラス1
  • 出力レベル:クラス2

マルチテナント デプロイメントに関する価格の詳細については、 表3を参照してください。

専用利用の料金詳細については、 5およびオンデマンド型モデルの時間単位課金料金をご参照ください。

試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):256,000

対応している自然言語

英語、フランス語、ドイツ語、イタリア語、スペイン語、中国語、日本語、韓国語、ポルトガル語、オランダ語、ポーランド語、その他数十の言語。

サポートされるプログラミング言語

mistral-large-2512 モデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

mistral-large-2512基盤モデルは、テキスト、コードベース、さまざまな分野の数学データなど、多様なデータセットを用いて事前学習されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

mistral-large

Mistral Large 2 (別名「 Mistral-Large-Instruct-2407 」)は Mistral AI、によって開発された大規模言語モデルのファミリーである。 mistral-large基盤モデルは、英語、フランス語、スペイン語、ドイツ語、イタリア語の文法や文化的背景に精通し、それらを理解しています。 基盤モデルは、他にも数十の言語を理解することができます。 このモデルは広いコンテキストウィンドウを備えているため、 検索拡張生成 (RAG)のユースケースで送信するプロンプトに、大規模な文書をコンテキスト情報として追加することができます。 mistral-large基盤モデルは、コードの生成、レビュー、コメント付け、関数呼び出し、JSON形式での結果生成といったプログラム関連のタスクにおいて高い効果を発揮します。

その他の入門情報については、ウェブ Mistral AI サイトの 「 watsonx.ai 」ページをご覧ください。

使用状況
テキストの理解、変換、コード生成など、複雑な多言語推論タスクに適しています。 このモデルはコンテキストウィンドウが広いため、モデルにプロンプトを送る際は、max tokens パラメータを使用してトークンの上限を指定してください。
使用可能
  • 専用利用のためにオンデマンドで展開する
注:

このモデルは、リソースハブに次のように表示されます:

  • マルチテナント型ハードウェアに展開された IBM によって提供されています: mistral-large
  • 専用利用のためのオンデマンド展開: mistral-large-instruct-2407

APIの料金プラン

オンデマンド型デプロイの価格詳細については、 表5を参照してください。

ご注意: この基盤モデルには、利用時間ごとに追加の利用料が適用されます。
試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、16,384個に制限されています。

対応している自然言語

英語、フランス語、ドイツ語、イタリア語、スペイン語、中国語、日本語、韓国語、ポルトガル語、オランダ語、ポーランド語、その他数十の言語。

サポートされるプログラミング言語

mistral-large モデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

mistral-large基盤モデルは、テキスト、コードベース、さまざまな分野の数学データなど、多様なデータセットを用いて事前学習されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

mistral-large-instruct-2411

の mistral-large-instruct-2411基盤モデルは、 Mistral Large 2Mistral AI モデルファミリーに属しています。 このモデルは、推論、知識、およびコーディングを専門としています。 このモデルは、 Mistral-Large-Instruct-2407基盤モデル基盤モデルの機能を拡張し、長いプロンプトコンテキスト、システムプロンプトの指示、および関数呼び出しのリクエストをより適切に処理できるようにしています。

使用状況

mistral-large-instruct-2411基盤モデルは、多言語対応で、コーディングに長け、エージェント中心の設計となっており、システムのプロンプトに従うことで、 検索拡張生成タスクや、大規模なコンテキストを含むプロンプトを扱う必要があるその他のユースケースを支援します。

size

1,230億のパラメータ

使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

オンデマンド型デプロイの価格詳細については、 表5を参照してください。

ご注意: この基盤モデルには、利用時間ごとに追加の利用料が適用されます。
試してみる
トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

対応している自然言語

多言語に対応しており、特に英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、中国語、日本語、韓国語、アラビア語、ヒンディー語に強みを持っています。

サポートされるプログラミング言語

mistral-large-instruct-2411基盤モデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

mistral-large-instruct-2411基盤モデルモデルは、 Mistral AI. の Mistral-Large-Instruct-2407基盤モデルを拡張したものです。 トレーニングにより、モデルの推論能力が向上した。 また、トレーニングでは、モデルがより慎重かつ的確に応答するよう微調整し、解決策が見つからない場合や、確信を持って回答するための十分な情報がない場合にそれを認めるようにすることで、 ハルシネーションを減らすことにも重点が置かれた。

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

mistral-medium-2505

重要: このモデルは非推奨となっており、2026年6月8日に廃止を終了します。

Mistral Medium 3は、によって開発された言語 Mistral AIモデル群です。 Mistral Mediumモデルは大きなコンテキストウィンドウを備えており、これにより、 検索拡張生成 (RAG)のユースケース向けに送信するプロンプトに、大規模なドキュメントをコンテキスト情報として追加することができます。

mistral-medium-2505基盤モデルは、多くの言語の文法や文化的背景に精通し、それらを理解しています。 このモデルは視覚的な入力も処理でき、プログラミング、数学的推論、文書理解、対話において優れた能力を発揮します。

制限事項:mistral-medium-2505 は、チャットAPIによるツールの呼び出しに対応していません。
使用状況

複雑な多言語推論タスク、長文の理解、コード生成、関数呼び出し、およびエージェント型ワークフローに適しています。

使用可能
  • 2505: IBM により提供され、マルチテナント型ハードウェア上に展開され、専用利用のためにオンデマンドで展開されます。
  • 2508: 専用利用のためのオンデマンド展開。
APIの料金プラン

マルチテナント デプロイメントに関する価格の詳細については、 表3を参照してください。

提供されたMistral Mediumモデルの推論にかかる料金は、乗数によって算出されません。 以下の特別価格帯が適用されます:

  • 入力階層: Mistral Large 入力
  • 出力階層: Mistral Large

専用利用の料金詳細については、 5およびオンデマンド型モデルの時間単位課金料金をご参照ください。

試してみる

トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、16,384個に制限されています。

対応している自然言語

アラビア語、ペルシア語、ウルドゥー語、ヘブライ語、トルコ語、インドネシア語、ラオス語、マレー語、タイ語、タガログ語、ベトナム語、ヒンディー語、ベンガル語、グジャラート語、カンナダ語、 マラーティー語、ネパール語、パンジャーブ語、タミル語、テルグ語、ブルトン語、カタロニア語、チェコ語、デンマーク語、ギリシャ語、フィンランド語、クロアチア語、オランダ語、ノルウェー語、ポーランド語、ルーマニア語、スウェーデン語、セルビア語、ウクライナ語、フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語、日本語、韓国語、ロシア語、中国語。

サポートされるプログラミング言語

Mistral-mediumモデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

ミストラル 基盤モデル ミディアム・ファウンデーション・モデルは、テキスト、コードベース、さまざまな分野の数学データなど、多様なデータセットを用いて事前学習されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

mistral-nemo-instruct-2407

mistral-nemo-instruct-2407基盤モデルは、との共同開発 Mistral AI により構築 NVIDIAされました。 Mistral NeMo 推論、世界知識、コーディングの正確性において、特にその規模のモデルとしては極めて優れた性能を発揮する。

使用状況
この Mistral NeMo モデルは多言語対応であり、関数呼び出しに基づいて学習されています。
size
120億のパラメータ
使用可能
専用利用のためにオンデマンドで展開します。
APIの料金プラン
オンデマンド型デプロイの価格詳細については、 表5を参照してください。
トークンの上限
コンテキストウィンドウの長さ(入力+出力):131,072
対応している自然言語
多言語に対応しており、特に英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、中国語、日本語、韓国語、アラビア語、ヒンディー語に強みを持っています。
サポートされるプログラミング言語
この Mistral NeMo モデルは、いくつかのプログラミング言語を用いて学習されています。
インストラクションのチューニングに関する情報
Mistral NeMo 高度なファイン・チューニングと調整の段階を経た。
使用許諾条件
Apache 2.0 ライセンス
詳細情報
以下の資料をお読みください:

mistral-small-3-2-24b-instruct-2506

「Mistral Small 3.2 」 基盤モデルは、によって開発された「Mistral Small 3.1Mistral AI」を基盤としています。 mistral-small-3-2-24b-instruct-2506 は、命令の追跡や関数呼び出しを改善し、繰り返しや無限ループによる出力を減らします。 このモデルは指示ファイン・チューニング施されており、テキスト処理能力、指示の遵守、会話支援、画像理解、マルチモーダル理解、および高度な推論能力が向上しています。 エージェント型アプリケーションをサポートするように設計されており、システムプロンプトへの準拠や、JSON出力を生成する関数呼び出しに対応しています。

導入に関する詳細については、ウェブ Mistral AI サイトの 「 watsonx.ai 」ページをご覧ください。

使用状況
会話型エージェントや関数呼び出しに適しています。
size
240億のパラメータ
使用可能
専用利用のためにオンデマンドで展開します。
APIの料金プラン
専用利用の料金詳細については、 5およびオンデマンド型モデルの時間単位課金料金をご参照ください。
試してみる
サンプル・プロンプト
トークンの上限
コンテキストウィンドウの長さ(入力+出力):131,072
対応している自然言語
英語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、マレー語、ネパール語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語、アラビア語、ベンガル語、中国語、ペルシア語、その他多数の言語。
サポートされるプログラミング言語
mistral-small-3-2-24b-instruct-2506 モデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。
インストラクションのチューニングに関する情報
mistral-small-3-2-24b-instruct-2506基盤モデルは、テキスト、コードベース、さまざまな分野の数学データなど、多様なデータセットを用いて事前学習されています。
モデルアーキテクチャ
デコーダーのみ
使用許諾条件
Apache 2.0 ライセンス
詳細情報

mistral-small-3-1-24b-instruct-2503

「Mistral Small 3.1 」 基盤モデルは、 Mistral AIによって開発された「Mistral Small 3」を基盤としており、テキスト処理性能を損なうことなく、視覚理解能力と長文処理能力を強化しています。 mistral-small-3-1-24b-instruct-2503 モデルは、指示ファイン・チューニング施されており、テキスト処理能力、指示の遵守、会話支援、画像理解、マルチモーダル理解、および高度な推論能力が向上しています。 このモデルは、エージェント型アプリケーションをサポートするように構築されており、システムのプロンプトへの準拠や、JSON出力を生成する関数呼び出しに対応しています。

その他の入門情報については、ウェブ Mistral AI サイトの 「 watsonx.ai 」ページをご覧ください。

使用状況

会話型エージェントや関数呼び出しに適しています。

使用可能
  • マルチテナント型ハードウェア上に展開された IBM によって提供されます。
  • 専用利用のためにオンデマンドで展開します。
APIの料金プラン

入力層:クラス C1
 出力層:クラス17。
マルチテナント デプロイメント モデルの導入に関する価格の詳細については、 表3を参照してください。 オンデマンド展開モデルの料金詳細については、 表5 および 「オンデマンド展開モデルの時間単位課金率」 を参照してください。

試してみる

サンプル・プロンプト

トークンの上限

コンテキストウィンドウの長さ(入力+出力):131,072

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、16,384個に制限されています。

対応している自然言語

英語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、マレー語、ネパール語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語、アラビア語、ベンガル語、中国語、ペルシア語、その他数十の言語。

サポートされるプログラミング言語

mistral-small-3-1-24b-instruct-2503 モデルは、 Python、Java、C、C++、 JavaScript,、Bash、Swift、 Fortran など、80以上のプログラミング言語を用いて学習されています。

インストラクションのチューニングに関する情報

mistral-small-3-1-24b-instruct-2503基盤モデルは、テキスト、コードベース、さまざまな分野の数学データなど、多様なデータセットを用いて事前学習されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

Apache 2.0 ライセンス

詳細情報

以下の資料をお読みください:

mixtral-8x7b-base

mixtral-8x7b-base基盤モデルは、によって提供されています Mistral AI。 mixtral-8x7b-base基盤モデルは、モデルパラメータをグループ化し、各トークンに対してそのグループの一部( エキスパートと呼ばれる)を選択してトークンを処理する、生成型のスパース・ミックス・オブ・エキスパート・ネットワークである。 その結果、各トークンは470億個のパラメータにアクセス可能ですが、推論にはそのうち130億個のアクティブなパラメータのみを使用するため、コストとレイテンシを低減できます。

使用状況

分類、要約、生成、コードの作成・変換、言語翻訳など、幅広い用途に適しています。

size

46.7 10億個のパラメータ

使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

オンデマンド型デプロイの価格詳細については、 表5を参照してください。

トークンの上限

コンテキストウィンドウの長さ(入力+出力):32,768

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、16,384個に制限されています。

対応している自然言語

英語、フランス語、ドイツ語、イタリア語、スペイン語

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

Apache 2.0 ライセンス

詳細情報

以下の資料をお読みください:

mixtral-8x7b-instruct-v01

mixtral-8x7b-instruct-v01基盤モデルは、によって提供されています Mistral AI。 「 mixtral-8x7b-instruct-v01基盤モデルは、モデルパラメータをグループ化し、各トークンに対して、そのトークンを処理するためのグループのサブセット(「 エキスパート 」と呼ばれる)を選択する、事前学習済みの生成型スパース・ミックス・オブ・エキスパート・ネットワークです。 その結果、各トークンは470億個のパラメータにアクセス可能ですが、推論にはそのうち130億個のアクティブなパラメータのみを使用するため、コストとレイテンシを低減できます。

使用状況

分類、要約、生成、コードの作成・変換、言語翻訳など、幅広い用途に適しています。 このモデルのコンテキストウィンドウは通常より大きいため、モデルにプロンプトを送信する際は、max tokens パラメータを使用してトークンの上限を指定してください。

size

46.7 10億個のパラメータ

使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

オンデマンド型デプロイの価格詳細については、 表5を参照してください。

試してみる

サンプル・プロンプト

トークンの上限

コンテキストウィンドウの長さ(入力+出力):32,768

注:新規トークンの最大数(つまり、リクエストごとに基盤モデルによって生成されるトークンの数)は、16,384個に制限されています。

対応している自然言語

英語、フランス語、ドイツ語、イタリア語、スペイン語。

インストラクションのチューニングに関する情報

Mixtral 基盤モデルは、インターネット上のデータを用いて事前学習されています。 Mixtral 8x7B Instruction 基盤モデルは、指示に従うように微調整されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

Apache 2.0 ライセンス

詳細情報

以下の資料をお読みください:

mt0-xxl-13b

この mt0-xxl-13b モデルは、によって提供されています BigScience 。 Hugging Face このモデルは、英語、英語以外の言語、および多言語のプロンプトを用いた言語生成および翻訳タスクに対応できるよう最適化されています。

使用方法 :一般的な使用法として、 zero- または few-shot プロンプトと共に使用します。 翻訳を行う際は、翻訳したいテキストの終わりを示すためにピリオドを付けてください。そうしないと、モデルが文を翻訳せずにそのまま続けてしまう可能性があります。

size
130億のパラメータ
使用可能
  • 専用利用のためにオンデマンドで展開されます。
APIの料金プラン
オンデマンド型デプロイの価格詳細については、 表5を参照してください。
試してみる
以下のサンプルを試してみてください:
対応している自然言語
多言語
トークンの上限
コンテキストウィンドウの長さ(入力+出力):4,096
対応している自然言語
このモデルは、108言語の多言語データを用いて事前学習され、46言語の多言語データを用いてファイン・チューニング、多言語タスクを実行できるように設計されています。
インストラクションのチューニングに関する情報
BigScience コードやデータセットに関する詳細を公開しています。
モデルアーキテクチャ
エンコーダー・デコーダー
使用許諾条件
Apache 2.0 ライセンス
詳細情報
以下の資料をお読みください:

pixtral-12b

Pixtral( 12B )は、によって開発された Mistral AIマルチモーダルモデルです。 pixtral-12b基盤モデルは、自然画像と文書の両方を理解できるよう学習されています。 このモデルは、画像を本来の解像度とアスペクト比のまま分析することができ、画像の処理に使用するトークンの数について柔軟性を持たせています。 基盤モデルは、その長いコンテキストウィンドウ内で複数の画像に対応しています。 このモデルは、画像入力・テキスト出力のマルチモーダルタスクにおいて高い性能を発揮し、指示の遂行において特に優れています。

使用状況

図表の理解、文書に基づく質問への回答、マルチモーダル推論、および指示の遵守。

size

120億のパラメータ

APIの料金プラン
使用可能
  • 専用利用のためにオンデマンドで展開します。
試してみる

ドキュメントや画像を使ってチャットする

トークンの上限

コンテキストウィンドウの長さ(入力+出力):128,000

リクエストごとに基盤モデルモデルによって生成されるトークンの最大数は、8,192個に制限されています。

対応している自然言語

英語

インストラクションのチューニングに関する情報

pixtral-12b モデルは、画像データとテキストデータを交互に組み合わせて学習されており、Mistral Nemoモデルを基盤とし、4億パラメータのビジョンエンコーダをゼロから学習させて構築されています。

モデルアーキテクチャ

デコーダーのみ

使用許諾条件

Apache 2.0 ライセンス

詳細情報

以下の資料をお読みください:

poro-34b-chat

Poro 34b のチャットは、チャットの利用シーンに対応するよう設計されており、フィンランド語と英語の両方で指示に従うためのトレーニングを提供します。 Poroは、Silo AIが TurkuNLP およびHigh Performance Language Technologies(HPLT)と共同で開発したものです。

使用状況

このモデルを使って、チャットボットのような対話形式の出力を生成してください。

size

340億のパラメータ

使用可能

専用利用のためにオンデマンドで展開します。

APIの料金プラン

オンデマンド型デプロイの価格詳細については、 表5を参照してください。

試してみる

サンプル・プロンプト

トークンの上限

コンテキストウィンドウの長さ(入力+出力):2,048

対応している自然言語

英語、フィンランド語

インストラクションのチューニングに関する情報

Poro-34b-Chat このモデルは、英語とフィンランド語の両方の指示に従うデータセットを用いて、ベースとなる Poro-34b モデルの教師ファイン・チューニング (SFT)を通じて開発された。

モデルアーキテクチャ

デコーダー

使用許諾条件

上限付き補償に関する契約上の保護措置を含む利用規約については、 「利用規約 」をご覧ください。

詳細情報
以下の資料をお読みください:

詳細情報