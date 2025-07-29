コンテキスト内学習（ICL）は、GPT-3を発表した画期的な研究論文「Language Models are Few-Shot Learners」で紹介された高度なAI機能です1。モデルがバックプロパゲーションによるトレーニングフェーズを経てパラメーターを変更する教師あり学習とは異なり、ICLは事前トレーニング済みの言語モデルに完全に依存しており、パラメーターは変更しません。

AIモデルは、タスクを推測し、期待されるアウトプットを生成するための一時的なガイドとしてプロンプトを使用します。ICLは、プロンプト内の例の間の関係（インプット／アウトプットペアとも呼ばれます）を認識し、同じマッピングを新しいインプットに適用することによって機能します。このプロセスは人間の推論を模倣しており、過去のエクスペリエンスから類似点を導き出すことで新しい問題を解決します。事前トレーニング中に学習したパターンと知識を活用し、新しいタスクに動的に適応させることで、高い柔軟性と効率性を実現します。

本質的に、コンテキスト内学習は、通常はインプットシーケンスの一部として自然言語で記述された一連の例（インプット／アウトプットペアまたはコンテキスト内の例）を含むプロンプトに基づいて大規模言語モデル（LLM）を条件付けすることによって機能します。多くの場合データセットから抽出されるこれらの例は、モデルの再トレーニングには使用されず、コンテキスト・ウィンドウに直接入力されます。このウィンドウは、LLMが一度に処理できるテキストの量を示し、一貫した応答を生成するための一時メモリとして機能し、連続インプットを処理するモデルの一部です。

形式的に、プロンプトはインプット／アウトプットのペアの形式をもつk個の例で構成されるとします。

C={(x1 ,y1 ),(x2 ,y2 ),...,(xk ,yk )}

新しい入力「x」と出力空間の候補「Y={y1,...,ym}」が与えられると、モデルはプロンプトの条件に合う可能なアウトプットの確率を計算します。

P(yj ∣ x,C)

予測は、最も高い確率の選択肢を選択することによって決定されます。

y ^ = arg max y j ∈ Y P ( y j ∣ x , C )

このプロセス中に、モデルは重みを更新しません。代わりに、ディープラーニングのTransformer（トランスフォーマー）アーキテクチャーを活用し、モデルは現在のプロンプト内の例のみを使用してパターンを動的に学習します。

この方法を実際に確認するには、センチメント分類タスクを考えてみましょう。プロンプトは次のようになります。

レビュー：映画は素晴らしかった → センチメント：肯定的

レビュー：ストーリーラインが嫌いだ → センチメント：否定的

レビュー：音楽が心地よかった → センチメント：

このモデルは、以前のインプット・マッピングで観察された構造を継続し、「肯定的」を予測することによって最後の行を完成させます。この例では、モデルがタスクを推測し、少数の例に基づいて適切な応答を生成する、few-shot学習を紹介します。