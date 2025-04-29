ChatGPTと、基盤モデルで構築された他の数十のチャットボットのおかげで、大規模言語モデル（LLM）についてはほぼ誰もが知っています。しかし、大規模データベース・モデル（LDM）の場合はどうでしょうか？
「LDMは、LLMやチャットボットの領域である人間の言語やテキストではなく、大規模なデータセットやトランザクション・フローから洞察を得るために調整されたモデルです」と、IBMのインフラストラクチャー担当SVPであるRic Lewis氏は、IBM 2025 Investor Dayで述べました。
LLMは、書籍、記事、Wikipedia、その他さまざまなソースなどの一般に公開されているデータに基づいてトレーニングされますが、通常、トレーニング資料には企業内の膨大なデータは含まれていません。実際、現在、企業データのうち大規模な言語モデルで使用されているのはわずか1％です。
一方、LDMは、トランザクション記録、製品情報、顧客関係データ、トレーニング・ログ、従業員記録など、企業データのソースでトレーニングを受けます。その結果、企業はLDMを使用して、セマンティック検索として知られるプロセスで、会話型の質問を使用してデータベース内にある未活用の99%のデータの意味を明らかにすることができます。セマンティック検索では、キーワードの照合だけでなく、ユーザーの検索照会の背後にある意味やコンテキストを理解できます。
「LDMは、ビジネス・アプリケーションやトランザクション・フローに組み込まれたデータを活用して、企業にとって新しい洞察と新しい価値を引き出す、非常に優れた新しい方法です」と、IBM ThinkのインタビューでLewis氏は述べています。「LDMはまだ登場したばかりですが、エージェント・アプリケーションに情報を提供し、企業の成果向上を支援するために活用される可能性について、私たちは楽観しています」と彼は説明し、これらのモデルはすでにトランザクション・プロセスにAIを導入させるために採用されていると付け加えました。
たとえば、平均消費力と購入履歴を持つ顧客を特定したいと考えている小売を考えてみましょう。この顧客は最近保管に来て、新しい美容製品に強い関心を示しています。従来、小売業者のデータサイエンティストは、パイプライン、つまり未加工データを検討中の特定のビジネス上の質問に対する有用な答えに変えるプロセスを定義することから始めていました。次に、「ニューヨーク州に居住する20歳から40歳までのすべての顧客を検索する。この1年間に美容製品に少なくとも1,000米ドルを費やした顧客を見つける」など、非常に具体的な用語でデータベース・クエリーを作成します。
その後、データ・サイエンティストは必要なデータを抽出して別のプラットフォームに読み込み、数週間から数か月にわたってデータベース内のどの顧客に類似しているかを判断します。
従来のデータベース検索を完了するまでの広範なプロセスを考慮すると、「企業のメインフレーム上には生成AIの対象とはならない多くのデータがあり、企業が洞察を得られていない」とIBMシリコンバレー・ラボの Db2プログラム・ディレクター、Catherine Wuは IBM Thinkで語っています。
この問題の一部は、データを外部環境に移動することに伴うコストとセキュリティーの懸念に起因しています。「データを移動するだけで、ITコストの30～40％がかかっているという顧客の声があります」とWuは言います。「また、データがメインフレームから移動すると、その先に送られる先を追跡できなくなるため、これはお客様にとって大きな懸念事項となります。」
対照的に、LDMを使用すると、データベースがオンプレミス、クラウド、またはその2つのハイブリッドのいずれにあるかに関係なく、ユーザーはデータベースを検索し、より迅速かつ簡単に答えを得ることができます。したがって、上記の例の小売業者は、データベースにクエリーを実行して、「Claire社のような顧客上位100社をリストしてください」と尋ねることができます。そしてその後すぐに、基本的なSQLトレーニングを受けた人なら誰でも、データを移動させることなく、その情報を引き出すことができるようになったとWuは言います。IBMは2022年に、大規模なデータベース・モデルを用いた最初のデータベース製品であるSQL Data Insights（SQL DI）を発売しました。これは IBM Zメインフレーム上にあるz/OS向けDb2データベースの一部であり、世界の金融取引の70%以上を価値によって支えています。
ポッドキャスト「Mixture of Experts」の最近のエピソードで、Graniteのテクニカル製品管理担当ディレクターであるKate Souleが語ったように、LLMは「やり過ぎになりがち」です。
「LDMのトレーニングとチューニングの要件は、LLMとは異なるインフラストラクチャーで実現できます」とIBMのLewisは言います。「ほとんどの企業が解決しようとしている問題を処理するのに、GPUの大規模なファームは必要ありません。LLMのトレーニングに使用されるすべてのデータと比べて、企業の取引データベースは比較的小規模です。」しかし、Lewisによると、企業固有のデータを使用することで、「特定の結果をよりコスト効率よく、多くの場合はより効果的に実現するための特定のモデル」を作成できます。
IBMのSQL DIを使用すると、データ型に関係なく、データベース列内の各値がテキスト・トークンに変換されます。「その結果、モデルは各データベース・レコードを、レコード内の位置に関係なく、他のトークンと同等の関係を維持する、英語に似た文中の不規則な単語のbag-of-Wordsとして認識します」と、IBMディスティングイッシュト・エンジニアのAkiko Hoshikawaは述べています。次に、SQL DIは、テーブル行内とテーブル行全体の両方で、周囲の列値に基づいて重要なデータベース値を推定します。この方法でトレーニングされたモデルを使用すると、ほぼ誰でもリレーショナル・データに対してAIクエリーを実行し、意味的に類似したデータをデータベース内で直接検出して照合できます。
多くの企業が概念実証としてLDMを検討していますが、保険業界や小売でLDMを利用している企業もあり、すでにこれらのツールを使用してデータベースから価値を抽出するプロセスを高速化しています。
スイスで最も古い保険会社であるSwiss Mobiliar社のデータ・エバンジェリストであるThomas Baumann氏は、社内のいくつかの領域でIBMのSQL DIを使用しています。Baumann社は、自動車保険の見積もりをより適切に調整して売上を伸ばすために、SQL DIの使用を開始しました。営業担当者が新規保険契約者候補とやり取りする際に見積書を入力すると、LDMが最も類似した過去の事例を抽出して、顧客が保険契約に応じる確率を判断します。
「その後、ユーザーは、免責金額を減らしたり、より大幅な割引を提供したりするなどのパラメーターの一部を変更することで、成功の可能性について新しい確率を再計算できます」と、IBM ThinkでのインタビューでBaumann氏は述べています。「見積もりは以前よりもはるかに洗練され、個々の顧客に合わせて調整されています。」
Swiss Mobiliar社の自動車保険商品にIBMのSQL DIを使用する際、同社は人口統計、車両データ、価格など、各レコードの数十の属性を含む自動車保険見積もりデータの約1,500万件のレコードでモデルをトレーニングしました。Baumann氏は、営業担当者は、候補者を選ぶ前にその確率をチェックすることで、より科学的な見積もりを作成できることに気づいたと述べています。
その結果は、保険販売の成約率が6か月間で7％向上しました。Baumann氏によれば、LDMを使用しなければ約2年でこの改善が見られたといいます。この試験運用の成功に基づき、Swiss Mobiliar社は現在、建物保険から住宅保険まで、すべての保険商品（生命保険を除く）にLDMを採用しています。
Baumann氏は次のように述べています。「SQL DIの2つの主なメリットは、アイデアから本番稼働前まで非常に速く移行できることです。また、あるプラットフォームから別のプラットフォームにデータを移動させる必要もありません」と語っています。
IBMのSQL DIチームは、保険以外にも、よりカスタマイズされたショッピング体験を顧客に提供するためにLDMを使用することに興味のある米国およびヨーロッパの食品小売業者数社と協力しています。たとえば、顧客は特定の種類のシリアルを手に持ち、データベースでセマンティッククエリーを実行して、似たような味がするが、より健康的な栄養成分を含む代替のシリアルを表示することができます。提案に使用されるLDMは、「より洗練され、パーソナライズされたAmazonやNetflixのおすすめ」のようなものだと、Hoshikawaは言います。
企業は、顧客向けアプリケーションを超えて、LDMをデプロイし、異常検知やリアルタイムの不正アクセス検知など、多くのB2B分野で検知を行っています。たとえば、契約書を発行する企業であれば、LDMを使って通常とは異なる契約を迅速に特定できると、IBMのHoshikawaは言います。
一方、LDMは、より高度なリアルタイム不正アクセス検知も強化できます。典型的なパターンに従わない取引を特定するだけでなく、LDMはデータベースを照会して、Better Business Bureauの報告書がない会社や所在地がない会社など、疑わしい行動に関連するさまざまな属性を含むレコードを特定できます。
Lewisは、LLMとLDMに続いて、他の多くの特殊なモデルが登場すると考えています。「LDMはLLMと同様に、さまざまなエージェント型アプリケーションを可能にし、成果の向上を促進するための貴重なツールであると私たちは信じています」と彼は言います。「しかし、それらが常に単独で使用されるとは考えていません。実際には、LDMをエンタープライズ・データ・モデルに組み込み、LLMやその他の目的に合ったモデルと組み合わせて、企業や社会に大規模に新しい価値を大規模に推進することが理想的なシナリオだと考えています。」
同様に、Lewisは、1つの企業や組織が必ずしも支配的であるとは考えていません。「スイスのアーミーナイフのようなモデルを開発するように、最大数のサーバーとGPUを備えた一企業が支配的になると想定してはいけません」とLewisは言います。「私はそうは思いません。同じようにさまざまな分野の専門家の知識を利用することで最大の洞察を得ることができると考察するのと同じように、LLMやLDMや今後到来するさまざまな専用モデルを組み合わせる能力が真に新しい洞察につながり、真に最適化された成果を提供することができます。」
