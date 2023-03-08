その名前が示すように、生成AIは画像、音楽、音声、コード、動画、テキストを生成し、既存のデータを解釈して操作します。生成AIは新しい概念ではなく、生成AIを支える機械学習技術は過去10年間で進化してきました。最新のアプローチは、「トランスフォーマー」と呼ばれるNeural Networksアーキテクチャーに基づいています。Transformerアーキテクチャーと教師なし学習を組み合わせることで、複数のデータ・モダリティーを処理できる既存のベンチマークを上回るパフォーマンスを実現する大規模な基盤モデルが出現しました。

これらの大規模モデルは、より高度で複雑なモデルを開発するための出発点となるため、基礎モデルと呼ばれます。基盤モデルの上に構築することで、特定のユースケースやドメインに合わせた、より専門的で洗練されたモデルを作成できます。GPT-3、BERT、T5、DALL-Eなどのモデルの初期の例では、何が可能なのか（短いプロンプトを入力するだけで、システムがパラメーターに基づいて、レポート全文または複雑な画像を生成するということ）が示されました。

大規模言語モデル（LLM）は、NLPタスク用に大量のテキスト・データで明示的に学習し、通常は1億を超える大量のパラメーターを含んでいます。これらは、さまざまなタスクのための自然言語テキストの処理と生成を容易にします。それぞれのモデルには長所と短所があり、どれを使用するかの選択は、特定のNLPタスクと分析対象のデータの特性によって異なります。特定の仕事に使用する適切なLLMを選択するには、LLMの専門知識が必要です。

BERTは、文中の単語間の双方向の関係を理解するように設計されており、主にタスクの分類、質問応答、named entity recognitionに使用されます。一方、GPTは、主に言語翻訳、要約、コンテンツ作成などのテキスト生成タスクに使用される単方向トランスフォーマー・ベースのモデルです。T5も変換器ベースのモデルですが、BERTやGPTとは異なり、テキスト・トゥ・テキスト・アプローチで学習され、言語翻訳、要約、質問応答など、さまざまな自然言語処理タスクに合わせて微調整が可能です。