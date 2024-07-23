7月23日（火曜日）、Meta社は多言語大規模言語モデル（LLM）コレクションのLlama 3.1の発売を発表しました。Llama 3.1は、事前トレーニング済みと命令チューニング済みのテキストイン／テキストアウトのオープンソース生成AIモデルの両方を備えており、サイズは8B、70B、そして初めて405Bパラメーターです。
現在利用可能なオープンソース言語モデルの中で最大かつ最強であり、市場で最高のプロプライエタリモデルと競合するものと見込まれる、指示調整済みLlama 3.1-405Bが、IBM® watsonx.aiにてご利用いただけます。現在、IBM® Cloud、ハイブリッドクラウド、またはオンプレミスにデプロイできます。
4月18日にLlama 3モデルが発売されたことを受け、Llama 3.1がリリースされました。付属のローンチ発表の中で、Meta社は「近い将来の目標は、Llama3を多言語化およびマルチモーダルにし、より長くコンテキストを持ち、推論やコーディングなどのLLM機能全体の全体的なパフォーマンスを向上し続けることです」と述べました。
本日のLlama 3.1のリリースは、コンテキストの長さの大幅な増加から、ツールの使用や多言語機能の拡大に至るまで、その目標に向けた大きな進歩を示しています。
2023年12月、50を超えるグローバルな創設メンバーや協力者と共同でMeta社とIBMはAI Allianceを立ち上げました。AI Allianceは、業種・業務、研究、学界、新興企業、組織、官公庁・自治体にわたる主要組織を結集して、私たちの社会のニーズと複雑さを最もよく反映したAIの進化を形成することを目指しています。設立以来、Allianceのメンバーは100人を超えるまでに成長しました。
具体的には、AI Allianceは、開発者と研究者が信頼性、安全性、セキュリティー、多様性、科学的厳密さ、経済的競争力を確保しながら、責任あるイノベーションを加速できるようにするオープン・コミュニティーの育成に専念しています。この目的のために、アライアンスは、ベンチマークと評価基準を開発・デプロイし、社会全体の課題に取り組むことを支援し、グローバルなAIスキル構築をサポートし、安全かつ有益な方法でAIのオープンな開発を促進するプロジェクトを支援しています。
Llama 3.1は、新しいアイデアとアプローチを構築、実験し、責任を持って拡張するためのオープンな最先端のモデル・ファミリーと開発エコシステムをグローバルなAIコミュニティーに提供することで、その使命をさらに推進します。強力な新しいモデルに加え、このリリースには、堅牢なシステム・レベルの安全対策、新しいサイバーセキュリティー評価対策、および更新された推論時間制限が含まれています。全体として、これらの参考情報は、生成AIのための信頼および安全ツールの開発と使用の標準化を促進します。
「400B以上のパラメーター」を備えた今後のLlamaモデルについては、モデルの性能についての予備評価も含め、4月のLlama 3の発表で議論されましたが、その正確なサイズと詳細は、今日の発売まで公表されませんでした。Llama 3.1はすべてのモデル・サイズにわたって大幅なアップグレードを行いますが、新しい405Bオープンソース・モデルは、最先端の独自開発のクローズド・ソースLLMと前例のない同等性を達成しています。
Meta社が本日発表した最新の数値は、405Bモデルが他の最先端の製品と比較していかに印象的であるかを包括的に物語っています。一般的なベンチマーク全体で主要なLLMと比較してみましょう。[1]
405Bを他の最先端モデルと比較する場合、考慮すべき要素は性能ベンチマークだけではありません。クローズド・ソースの競合他社とは異なり、基盤となるモデルが予告なく変更される可能性があるAPIを通じてのみアクセスできるLlama 3.1-405Bは、オンプレミスで構築、変更、さらには実行できる安定したプラットフォームです。このような制御と予測可能性は、一貫性と再現性を重視する研究者、企業、その他の団体にとって恩恵となります。
IBMはMeta社と同様に、実行可能なオープン・モデルが利用可能になることで、より優れた安全な製品が実現し、イノベーションが加速され、AI市場全体の健全化に貢献すると信じています。洗練された405Bパラメーターのオープンソース・モデルの規模と機能は、あらゆる規模の組織に独自の機会とユースケースを提供します。
405Bは、推論やテキスト生成のためのモデルを直接使用する以外に、そのサイズとそれに対応する計算需要を考慮すると、ほとんどのハードウェア環境上でローカルに実行するには量子化やその他の最適化手法が必要となる場合があります。そこで、405Bは次の目的で活用できます。
Llama 3.1 モデルのリリースを成功させるため、Meta AI は、 IBM® watsonxのように、モデル評価、安全制限、検索拡張生成（RAG）の主要な機能を提供するプラットフォームの使用を「強く推奨」しています。
待望の405Bモデルは、Llama 3.1リリースで最も注目すべき側面かもしれませんが、唯一の注目に値する側面ではありません。Llama 3.1モデルはLlama 3と同じTransformerアーキテクチャーを共有していますが、すべてのモデル・サイズでLlama 3の対象製品に対して、いくつかの大幅なアップグレードが行われています。
事前にトレーニングされ、命令チューニングされたLlama 3.1モデルのすべてで、コンテキスト長は、Llama 3の8,192トークンから、Llama 3.1の128,000トークンへと大幅に拡張されました。これは、1600％増という驚異的な増加です。Llama 3.1のコンテキストの長さは、企業ユーザーに提供されているGPT-4oのバージョンと同等であり、GPT-4（またはChatGPT FreeのGPT-4oのバージョン）よりもかなり大きく、Claude 3が提供する200,000トークン・ウィンドウに匹敵します。Llama 3.1はユーザーのハードウェアやクラウド・プロバイダーにデプロイできるため、需要が高い期間でもコンテキストの長さが一時的に制限されることはありません。同様に、Llama 3.1は一般的に広範な使用制限の対象外です。
モデルのコンテキスト長（別名コンテキスト・ウィンドウ）は、LLMがいつでも考慮または「記憶」できるテキスト（トークン単位）の総量を指します。会話、文書、またはコード・ベースがモデルの最大コンテキスト長を超える場合、モデルが続行できるように、トリミングまたは要約する必要があります。Llama 3.1の拡張されたコンテキスト・ウィンドウは、Llamaモデルが詳細を忘れずにはるかに長い会話を実行し、トレーニングや推論中にはるかに大きな文書やコードサンプルをINGESTできるようになったということです。
テキストをトークンに変換する場合、単語とトークンの「交換レート」は固定されていませんが、適切な推定値は1単語あたり約1.5トークンになります。Llama 3.1の128,000トークン・コンテキスト・ウィンドウは、約85,000単語に相当します。Hugging FaceのTokenizer Playgroundは、さまざまなモデルがテキスト入力をどのようにトークン化するかを簡単に確認・実験することができます。
Llama 3.1モデルは、Llama 3向けに導入された新しいトークナイザーのメリットを引き続き享受しています。このトークナイザーは、Llama 2と比較して言語をはるかに効率的に符号化します。
Meta社は、イノベーションに対する責任あるアプローチに従い、拡張されたコンテキストの長さに対して慎重かつ徹底したアプローチをとっています。これまでの実験的なオープンソースの努力によって、128,000のトークン・ウィンドウ、あるいは1Mのトークン・ウィンドウを持つLlamaの派生物が生み出されたことは注目に値します。これらのプロジェクトは、オープン・モデルに対するMeta社のコミットメントのメリットを示す優れた例ではあるが、注意深く取り組む必要があります。最近の研究によると、非常に長いコンテキスト・ウィンドウは、厳しい対策がない場合、「LLMにとって豊富な新しい攻撃対象領域」となります。
幸いなことに、Llama 3.1のリリースには、新しい推論制限のセットも含まれています。Llama GuardやCyberSec Evalの更新版とともに、Prompt Guardの導入がサポートされており、直接および間接のプロンプトインジェクションフィルタリングを提供します。Meta社はCodeShieldという堅牢な推論時間フィルタリングツールでさらなるリスク軽減を提供しています。これはLLMが生成した安全でないコードの本番システムへの導入を防ぐために設計されています。
生成AIの実装と同様に、強固なセキュリティー、プライバシー、安全対策を備えたプラットフォーム上にのみモデルをデプロイすることが常に賢明です。
あらゆるサイズの事前トレーニング済みと命令のチューニング済みLlama 3.1モデルはどちらも多言語化されます。Llama 3.1モデルは英語以外にも、スペイン語、ポルトガル語、イタリア語、ドイツ語、タイなどの言語にも精通しています。Meta社は、「他のいくつかの言語」はまだトレーニング後の検証段階にあり、将来リリースされる可能性があると述べています。
Llama 3.1のInstructモデルは「ツールの使用」用にファイン・チューニングされています。つまり、Meta社は、LLMの機能を補完または拡張する特定のプログラムとのインターフェース用能力を最適化しました。これには、特定の検索、画像生成、コード実行、数学的推論ツールのためのツール呼び出しを生成するトレーニングや、ゼロショット・ツールの使用（これまでトレーニングでは見られなかったツールとスムーズに統合する機能）のサポートが含まれます。
Meta社の最新リリースは、真に最先端の生成AIモデルを特定のユースケースに合わせてチューニングし、調整するための前例のない機会です。
Llama 3.1のサポートは、AIにおけるオープンソースのイノベーションを推進し、サードパーティモデルや IBM® Graniteモデル・ファミリーを含むwatsonxの最高水準のオープン・モデルへのアクセスを提供するというIBMのコミットメントの一環です。
IBM® watsonxは、クライアントがLlama 3.1のようなオープンソース・モデルの実装を、オンプレミスや希望するクラウド環境での展開の柔軟性から、ファイン・チューニング、プロンプトエンジニアリング、エンタープライズ・アプリケーションとの統合のための直感的なワークフローまで、ニーズに最適な形で真にカスタマイズできるようにします。ビジネス向けのカスタムAIアプリケーションを容易に構築し、あらゆるデータソースを管理し、責任あるAIワークフローを加速させます。これらすべてを単一のプラットフォーム上で実現します。
Llama 3.1-405Bは、現在IBM® watsonx.aiで利用可能であり、その後に8Bおよび70Bモデルも間もなく利用可能になります。
Llama 3.1-405Bとwatsonx.aiを使用したRAGチュートリアルを今すぐ開始してください。
[1]独自モデルのベンチマーク評価は、2024年6月20日（Claude 3.5 SonnetおよびClaude 3 Opus）および2024年3月4日（Claude 3 SonnetおよびHaiku）のAnthropic、2024年5月13日のOpenAI（GPTモデル）、および2024年5月のGoogle Deepmind（Geminiモデル）の自己申告データに基づいています。