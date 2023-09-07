今はビジネスのための AI にとってエキサイティングな時代です。顧客サービスから人事、コードのモダナイゼーションまで、さまざまな分野でこのテクノロジーをより広く応用するにつれ、人工知能（AI）は私たちの仕事を難しくするのではなく、よりスマートにするのに役立っています。私たちはビジネスのためのAI革命を始めたばかりです。生産性と創造性を向上させる可能性は膨大です
しかし、今日のAIは信じられないほどダイナミックな分野であり、AIプラットフォームはそのダイナミズムを反映し、今日と将来の需要を満たすために最新の進歩を組み込む必要があります。だからこそ、IBMはAI製品ポートフォリオである IBM watsonxに強力な新機能を追加し続けているのです。
本日、私たちは最新の追加内容を発表します。それはIBM製の新しい基盤モデルファミリーであり、watsonx.aiで利用可能になります。watsonx.aiは生成AI、基盤モデル、機械学習のための私たちのスタジオです。「Granite」と総称されるこれらのマルチサイズの基盤モデルは、言語とコードの両方に生成AIを適用しています。Graniteが建設や製造で多くの用途を持つ強力な多目的材料であるように、IBMはこれらの Graniteモデルもお客様のビジネスに永続的な価値をもたらすと信じています。
それでは、その内部を詳しく見ていき、私たちがこれらのモデルをどのように構築したか、そしてこれらのモデルがビジネスにおいて AI を次のレベルに引き上げるのにどう役立つかについて少し説明しましょう。
IBMリサーチによって開発されたGraniteモデル（Granite.13b.instructとGranite.13b.chat）は、「デコーダー」アーキテクチャを使用。これが、シーケンス内の次の単語を予測する今日の大規模言語モデルの能力を支えています。
130億のパラメータ・モデルを有するGraniteモデルは、大型モデルよりも効率的であり、単一のV100-32GB GPUに収まります。また、要約、質問応答、分類などの特殊なビジネス領域のタスクでは優れたパフォーマンスを発揮しながら、環境への影響を小さくすることができます。これらのモデルはさまざまな業種・業務に幅広く適用可能で、コンテンツ生成、洞察の抽出、検索拡張生成(モデルを外部の知識ソースにリンクすることで応答の品質を向上させるフレームワーク)、名前付きエンティティー認識 (テキスト内の重要な情報を識別して抽出する) などの他の NLP タスクをサポートします。
IBMでは、ビジネスを対象としたモデルの構築に重点を置いています。Graniteファミリーのモデルも例外ではなく、前処理前7TB、前処理後2.4TBの多様なデータセットで訓練し、モデルにとって意味を持つ1兆個のトークンの文字集合を生成しました。当社のデータ・セットのセレクションは、ビジネス・ユーザーのニーズをターゲットにしており、以下のドメインのデータが含まれています。
エンタープライズに特化したデータセットでモデルをトレーニングすることで、モデルにこれらの業種・業務の特殊言語や専門用語に精通させ、関連する業種・業務知識に基づいた意思決定を確実に行えるようにします。
ビジネスにおいては、信頼は事業運営のライセンスです。特にAIに関しては、「私たちを信頼してほしい」という姿勢には議論の余地がありません。企業向けAIを開発した最初の企業の1社であるIBMのAI開発アプローチは、信頼と透明性への取り組みに根差した基本原則によって導かれています。IBM watsonx製品を活用すると、AIのユーザーであるだけではなく、それ以上にAIの価値創造者になることができます。この製品は、データ収集から始まり、モデルやアプリケーションの責任あるデプロイメントを追跡するためのコントロールポイントに至るまで、ガバナンス、リスク・アセスメント、バイアスの軽減、コンプライアンスに重点を置いた、基盤モデルや生成AIの構築とテストのためのエンドツーエンドのプロセスを備えています。
Graniteモデルは、クライアントが独自のアプリケーションに適応させるために利用できるため、トレーニングに使用されるすべてのデータ・セットは、定義されたガバナンス、リスク、コンプライアンス（GRC）レビュー・プロセスを実施しています。IBMは、IBM AI倫理原則に準拠したデータをIBM Data Pileに組み込むためのガバナンス手順を開発しました。データのGRC基準に対処することは、トレーニング・データのライフサイクル全体に及びます。私たちの目標は、トレーニングされた基盤モデルから、モデルがトレーニングされた特定のデータセット・バージョンにまでさかのぼる監査可能なリンクを確立することです。
多くのメディアの注目が、（当然のことながら）生成AIがヘイトや中傷的なアウトプットを生み出すリスクに集中しています。IBM では、企業がそのようなリスクを負う余裕がないことを理解しています。そのため、Graniteモデルは、IBM 独自の「HAP 検出器」によって精査されたデータでトレーニングされています。HAP 検出器は、憎悪的で冒とく的なコンテンツ (したがって「HAP」) を検知して排除するように IBM によってトレーニングされた言語モデルであり、社内モデルと公開モデルのベンチマーク対象となっています。文書内の各文にスコアが割り当てられた後、文とスコアに対して分析が実行され、分布が探索されます。これにより、フィルタリングの対象となる文の割合が決定されます。
これ以外にも、様々な品質基準を適用しています。重複を検出・除去し、アウトプットの質を向上させるとともに、文書品質フィルターを使って、トレーニングに適さない低品質文書をさらに除去します。私たちはまた、海賊版やその他の不快な内容を投稿していることで知られるウェブサイトの監視やそれらのサイトの回避など、定期的かつ継続的なデータ保護対策をデプロイしています。
生成AIテクノロジーのランドスケープは常に変化しているため、当社のエンドツーエンド・プロセスは継続的に進化、改善し、企業が信頼できる成果を提供します。
ビジネスのためのAIに関するIBMのビジョンの鍵は、エンパワーメントの概念です。すべての組織は、独自の目標を達成するためにGraniteモデルを活用し、またあらゆる企業には、それらが法律、社会規範、業種・業務、市場の要求、アーキテクチャーの要件に由来するかどうかにかかわらず、準拠すべき独自の規制があります。私たちは、企業がwatsonxのツールを使って、ワークロードがどこにあろうとも、（制限の範囲内で）自社の価値観に従ってモデルをパーソナライズする権限を与えられるべきだと考えています。
しかし、それだけではありません。watsonx で何を行うにしても、データの所有権はユーザーが保持します。当社は、モデルのトレーニングにお客様のデータを使用しません。お客様が構築したモデルはお客様が管理し、どこででも活用できます。
最初の Granite モデルは始まりに過ぎません。他の言語でもさらに多くのモデルが計画されており、IBM のトレーニングを受けたモデルも準備中です。一方、watsonxにはオープンソース・モデルを追加し続けます。IBM は最近、Meta の Llama 2 チャット 700 億パラメータのモデルを一部のクライアントに早期アクセスとして提供し、9 月下旬には広く利用可能にする予定であると発表しました。加えて、IBMは、80以上のプログラミング言語、Gitコミット、GitHubの問題、Jupyter Notebookを含むコード用の大規模言語モデルであるStarCoderをホストします。
新しいモデルに加えて、IBMはwatsonx.aiスタジオで新しい補完機能も立ち上げつつあります。今月末には、チューニング・スタジオの第一弾（イテレーション）がリリースされる予定です。このスタジオには、プロンプト・チューニングが含まれます。つまり、独自の信頼できるデータに基づいたモデルのトレーニングを通じて、クライアントが基盤モデルをクライアント固有のダウンストリーム・タスクに適応させるための効率的で低コストな方法が含まれます。また、ユーザーがカスタム・データ・スキーマや内部データ・セットから人工表形式データ・セットを作成できるよう支援する「合成データ生成」も導入します。この主要な機能により、ユーザーはリスクを軽減しながら、AIモデルのトレーニング、ファイン・チューニングまたはシナリオ・シミュレーションのための洞察を引き出すことができ、意思決定を強化し、市場投入までの時間を短縮できます。
Granite 基盤モデルやその他の機能をwatsonxに加えたことで、ビジネスのためのAIの刺激的な新しい可能性が広がります。新しいモデルと新しいツールを使用すると、新しいアイデアや新しいソリューションが生まれます。その中で最も優れた点は何でしょうか？私たちは、まだ始まったばかりなのです
IBMの将来の方向性と意図に関する記述は目標や目的を表すものに過ぎず、予告なしに変更または撤回されることがあります。