ベクトル・データベースとは

By Tom Krantz , Jim Holdsworth , Matthew Kosinski

ベクトル・データベースとは

ベクトル・データベースは、高次元のベクトル・データを保存、管理、インデックス付けするものです。

ベクトル・データベースでは、データ・ポイントが「ベクトル」と呼ばれる数値の配列として保管され、類似性に基づいて比較したりクラスター化したりすることができます。この設計により、低レイテンシーのクエリーが可能になり、人工知能（AI）アプリケーションに最適となっています。

ベクトル・データベースは、生成AI ユースケースの推進に必要な速度と性能を提供するため、人気が高まっています。実際、2025年の研究によると、ベクトル・データベースの導入は前年比377%増加しており、大規模言語モデル（LLM）関連のテクノロジーの中で最も急速な成長が報告されています。

ベクトル・データベースと従来型データベースの比較

近年、データの性質は劇的に変化しています。もはや、従来のデータベースの行と列に整然として保存されている構造化された情報だけにとどまりません。ソーシャル・メディアの投稿、画像、動画、音声を含む非構造化データは、その量と価値の両方で増加しており、企業のAI戦略を再構築すると同時に、データインフラに新たな需要をもたらしています。

従来のリレーショナル・データベースは、定義されたスキーマ内で構造化および半構造化データセットの管理に優れています。しかし、AIワークロード用に非構造化データをリレーショナル・データベースにロードして準備するには多大な労力がかかります。

従来の検索では、キーワード、タグ、メタデータなどの個別のトークンに依存し、完全に一致した場合に基づいて結果が返されるため、この制限がさらに厳しくなります。例えば、「スマートフォン」を検索すると、その特定の用語を含むコンテンツのみが検索されます。

ベクトル・データベースは、根本的に異なるアプローチを採用しています。データ・ポイントは行と列の代わりに密なベクトルとして表現され、各次元はデータの学習された特徴を表します。これらの高次元のベクトル埋め込みはベクトル空間に存在し、アイテム間の関係を幾何学的に測定できます。

各次元は潜在的な機能（数学的モデルとアルゴリズムを通じて学習される、推論された特性）を表すため、ベクトル表現は隠れたパターンを捉えます。「スマートフォン」のベクトル検索クエリーでは、正確な単語が表示されない場合でも、「携帯電話」や「モバイル・デバイス」などの意味的に関連する結果が返されることもあります。

データを高次元空間でモデル化し、特殊なインデックス技術を適用することで、ベクトル・データベースは、リレーショナル・データベースがサポートするように設計されていない、大規模なデータセットにおける低レイテンシーの類似性検索を可能にします。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ベクトル・データベースが重要な理由

LLM、生成AIシステム、高度な自然言語処理（NLP）ワークフローが急速に台頭し、組織がデータを扱い、保管する方法を変えました。今日のAIワークロードは、ベクトルデータとの高速でリアルタイムのインタラクション、および検索拡張生成（RAG）パイプラインとのシームレスな統合に依存しています。

ベクトル・データベースは、こうしたニーズに対応するインフラストラクチャーを備えています。大量の非構造化データを低レイテンシーで類似検索できるため、チャットボットやレコメンデーションシステムなどのAIアプリケーションに威力を発揮します。

ベクトル・データベース内のコア概念

ベクトル・データベースの動作を理解するには、2つのコア概念を確立することが役立ちます。1つはデータを数値で記述するベクトルで、もう1つは非構造化コンテンツを、意味と文脈を捉える高次元表現に変換するベクトル埋め込みです。

ベクトル

ベクトルはテンソルのサブセットです。機械学習（ML）において、テンソルはn次元空間内の数値グループ、または数値グループのグループ化に対する総称です。テンソルは、データの数学的な記帳装置として機能します。最も小さい要素から解説していきます。

スカラーは、1つの数値を含む、0次元のテンソルです。例えば、気象データをモデリングするシステムは、1日の最高気温（華氏）をスカラー形式で85と表す場合があります。

ベクトルは、1次元（または1次か1階）のテンソルであり、同じタイプを持つデータの複数のスカラーを含んでいます。この例を踏まえると、天気モデルでは、ある日の最低気温、平均気温、最高気温をベクトル形式で表すと、62、77、85となります。スカラーの各要素はベクトルの特徴、つまり次元であり、その日の天気の特徴を表しています。

言い換えれば、ベクトルは数値を構造化された形式に整理する方法です。しかし、AIシステムがその非構造化情報を処理するには、データを数値配列に変換する必要があります。この変換は、ベクトル埋め込みを通じて実現されます。

ベクトル埋め込み

ベクトル埋め込みはデータ・ポイントの数値表現で、テキストや画像を含むさまざまな種類のデータをMLモデルが処理できる数値配列に変換します。

これを実現するために、埋め込みモデルはインプットデータを高次元ベクトル空間にマッピングする方法を学習します。このベクトル空間は、予測誤差を定量化するタスク固有の損失関数を通じて学習されたパターンを反映しています。ベクトル埋め込みは、ディープラーニングで使われるニューラルネットワークのような下流のAIモデルによって、分類、検索、クラスタリングなどのタスクを実行するために利用されます。

単語の小さなコーパスを考えてみましょう。単語の埋め込みは3次元ベクトルとして表されます。

ネコ [0.2, -0.4, 0.7]
イヌ [0.6, 0.1, 0.5]

この例では、各単語（「cat」）が固有のベクトル（[0.2, -0.4, 0.7]）で構成されています。ベクトル内の値は、3次元ベクトル空間内の単語の位置を表します。同様の意味またはコンテキストを持つ単語は、同様のベクトル表現を持つことが期待されます。「ネコ」と「イヌ」のベクトルは、意味関係を反映して、互いに近くになります。

同様に、「car」と「vehicle」という言葉は同じ意味ですが、共有し、綴りは異なります。AIアプリケーションがセマンティック検索を実行するには、「自動車」と「車両」というベクトル表現で共通する意味を捉える必要があります。ベクトル埋め込みは、この意味を数値化し、レコメンデーションエンジンやチャットボット、OpenAIのChatGPTのような生成アプリケーションのバックボーンとなっています。

ベクトル埋め込みの詳細はこちら

AI Academy

生成AIの成功の鍵はデータ管理

生成AIの使用を成功させるために、高品質のデータが不可欠である理由をご覧ください。

エピソードに移動

ベクトル・データベースの仕組み

高速でスケーラブルなセマンティック検索を促進するために、ベクトル・データベースは次の3つのコア機能に依存しています。

ベクトルストレージ
ベクトルのインデックス作成
ベクトル検索

ベクトルストレージ

基本レベルで、ベクトル・データベースは埋め込みを保管します。各データの次元数は固定されており、通常はタイトル、ソース、タイムスタンプ、カテゴリーなどのメタデータとともに保管され、メタデータのフィルターを使用して照会できます。

埋め込みは事前に生成されて保管されるため、ベクトル・データベースは、クエリー時に表現を再計算することなく、同様の埋め込みを取得できます。この生成と検索の分離により、大規模に低レイテンシーの類似性検索が可能になります。

多くのシステムでは、ベクトルの類似性とメタデータの制約を組み合わせた（例えば、特定の日付範囲またはカテゴリー内に作成された意味的に類似したドキュメントを取得するなど）ハイブリッド検索もサポートされています。

ベクトルのインデックス作成

高次元空間での類似性検索を高速化するために、ベクトル・データベースは、保管されたベクトル埋め込みにインデックスを作成します。ベクトルにインデックスを付けると新しいデータ構造にマッピングされ、ベクトル間の類似検索や距離検索を高速化できます。

これらのインデックスは、データセット全体をスキャンせずに類似したベクトルを取得する近似最近傍（ANN）検索をサポートします。一般的なANNインデックス・アルゴリズムには、HNSW（hierarchical navigable small world）と局所性鋭敏ハッシュ（LSH）があります。

HNSWは、上位層で長距離リンクを使用し、最下層で密なローカル・リンクを使用する階層的な多層グラフを作成します。¹

LSHは、ハッシュ関数を使ってベクトルをバケット内にグループ化し、類似ベクトルが同じバケットに入るようにします。

ANNインデックスに加えて、ベクトル・データベースではメモリ使用量を削減するために、しばしば積量子化（PQ）が使用されます。PQは、各データセットを（すべてのベクトルを保管するのではなく）相対距離を保持する短いコードに変換し、システムが効率的な検索パフォーマンスを維持しながら、より大きなコレクションを保存できるようにします。

ベクトル検索

ベクトル検索は、類似したデータ・ポイントを発見して比較するために使用されるベクトル・データベースの検索層です。正確にキーワードや値を一致させるのではなく、要素間の意味関係を捉えます。このコンテキスト認識型の検索機能はRAGシステムの基盤となり、 AIシステムや検索ベースの機械学習モデルに関連するコンテキストを提供します。

ユーザーがAIモデルにプロンプトを送信すると、モデルはクエリー・ベクトルと呼ばれる、そのクエリーの埋め込みを生成します。次に、データベースはクエリー・ベクトルをインデックス付きベクトルと比較し、類似度スコアを計算して最近傍を特定します。

ベクトル検索では、複数のアルゴリズムを適用してANN検索を実行します。これらのアルゴリズムはパイプラインに集められ、クエリーされたベクトルに隣接するデータ（例えば、eコマースのカタログで視覚的に類似している製品など）を迅速かつ正確に取得します。埋め込みは事前に計算され、インデックス形式で保管されるため、結果はミリ秒以内に返されます。

関連するベクトルが特定されると、類似度を計算するか、距離メトリクスを使用して比較されます。一般的な方法には以下が含まれます。

コサイン類似度：ベクトル間の角度距離を測定し、方向がどの程度揃っているかを判断します。

ジャッカード類似度：2つのセット間の重複をその合計要素数と比較します。

ドット積：ベクトルの大きさと方向に基づいて類似性を評価します。

ユークリッド距離：高次元空間内のベクトル間の直線距離を計算します。

ハミング距離：2値ベクトル間の位置の違いを数えます。

データベースは、これらの類似性計算に従って最もランクの高いベクトルを返し、セマンティック検索やその他の自然言語処理ワークフローなどの機械学習タスクをサポートします。

ベクトル検索について詳細はこちら

ベクトル・データベースのメリット

ベクトル・データベースは、次のようなメリットをもたらすことにより、企業のAIストラテジーにおいてますます中心的な存在となっています。

速度と性能：ベクトル・データベースは、検索を高速化するためにさまざまなインデックス技術を使用しています。ベクトルのインデックス作成と距離計算のアルゴリズムは、数百万、数十億ものデータ・ポイントを持つデータセットから関連結果を検索する際の性能を最適化するのに役立ちます。

拡張性：ベクトル・データベースは、クエリー要求やデータ量が増加してもノードを追加して性能を維持しながら水平方向に拡張することで、大量の非構造化データを保管・管理することができます。

所有コストの削減：ベクトル・データベースは、より高速なデータ検索を可能にするため、基盤モデルのトレーニングを高速化します。

データ管理：ベクトル・データベースは通常、新しい非構造化データを簡単に更新・挿入できるデータ管理機能を内蔵しています。

柔軟性：ベクトル・データベースは、画像、動画、その他の多次元データを利用する際の複雑さに対処できるよう構築されています。

ベクトル・データベースのユースケース

ベクター・データベースは、特定のビジネスおよびAIユースケースに合わせてカスタマイズできます。多くの場合、組織はIBM Granite、Meta社のLlama-2、Google社のFlanなど、汎用埋め込みモデルから始めます。モデルはその後、ベクトル・データベースに保存されたエンタープライズデータを用いて強化されます。この組み合わせにより、ダウンストリームのAIアプリケーションの関連性と精度が向上します。

ベクトル・データベースのアプリケーションは膨大にあり、拡大を続けています。主なユースケースは次のとおりです。

検索 - 拡張生成
対話型AI
レコメンデーション・エンジン
異常検知

検索拡張生成

RAGにより、LLMは外部のナレッジ・ベースから事実情報を取得できます。特にカスタマー・ケア、HR、人材管理などの分野では、市場投入までの時間の短縮、効率的な推論、信頼性の高いアウトプットにより、企業はますますRAGを支持するようになっています。

RAGは、信頼できる企業データに基づいてモデルを構築することで、ハルシネーション（幻覚）を減らし、ユーザーが検証のために基盤となるソースにアクセスできるようにします。推論ステージでは最も大量のオペレーションが実行されるため、高次元の埋め込みへの高速、正確、かつスケーラブルなアクセスが必要です。

ベクトル・データベースはこれらの埋め込みのインデックス作成、保管、取得に優れており、不正アクセス検知システムや予知保全プラットフォームなどのアプリケーションに必要な速度、精度、スケールを提供します。

対話型AI

ベクトル・データベースは、特にRAGフレームワークの実装に使用される場合、土台となる関連知識を効率的かつ正確に解析する仮想エージェントの能力を強化することでエージェントのやり取りを改善するのに役立ちます。エージェントはユーザーのクエリーに対し、リアルタイムの状況に応じた回答に参照資料と該当ページ番号を添えて提供することができます。

レコメンデーション・エンジン

電子商取引サイトは、ベクトルを使用して顧客の好みや製品の属性を表現できます。これにより、過去に購入した商品と類似した商品を提案することで、顧客体験と顧客維持を向上させることができます。ストリーミング・プラットフォームとソーシャル・メディア・アプリケーションも同じアプローチを適用し、ユーザーが過去に視聴または共有したコンテンツとの類似性に基づいて、動画、音楽、投稿を推奨します。

異常検知

正常な振る舞いを高次元空間のベクトルとして表現することで、組織はベクトルの距離に基づいて外れ値を検知できます。確立されたクラスターから大きく離れたデータ・ポイントは、不正行為、システム障害、または異常なアクティビティー・パターンを示している可能性があります。類似度は数学的に計算されるため、ネットワーク・トラフィックから産業システムのセンサーの読み取り値まで、膨大なデータセット全体で異常をリアルタイムで検出できます。これにより、小さな逸脱がコストのかかるインシデントへとエスカレートする前に、チームが介入できるようになります。

ベクトル・データベースは、多くのAIアプリケーションにおけるファクトベースの検索に適していますが、すべての種類のクエリーに最適というわけではありません。

トピックの要約や広範なテーマ分析などのワークロードでは、LLMが最近傍の一致だけに頼るのではなく、関連するすべてのコンテキストを読み取ることが必要です。このようなシナリオでは、リスト・インデックスや別の非ベクトル構造を使用すると、ベクトル空間をナビゲートすることなく最初の関連要素を素早く表面化できるため、より高速で効率的な結果が得られる可能性があります。

ベクトル・データベースを使う人

ベクトル・データベースは幅広いAIワークロードをサポートしますが、その価値は役割によって異なります。ほとんどの企業では、ユーザーは2つの大まかなグループに分類されます。1つはAI駆動型エクスペリエンスを設計および実装するビルダーで、もう1つはそれらのシステムを本番環境で拡張および保守するオペレーターです。

ビルダー

ビルダーは、ベクトル・データベースを使用して埋め込みを保管し、AIアプリケーションを強化することで、ベクトル検索を利用するアプリケーション、パイプライン、モデルを作成します。

開発者

開発者は、言語固有のソフトウェア開発キット（SDK）や予測可能なアプリケーション・プログラミング・インターフェース（API）のためにベクトル・データベースを利用しています。多くの場合、チャットボットやレコメンデーションエンジンなどのアプリケーションにベクトル検索を統合します。

データ・エンジニア

データエンジニアは、埋め込みを生成、変換、検証するパイプラインを設計します。ベクトル・データベースは、分散データ環境全体での取り込みワークフロー、メタデータの取得、リネージュ追跡を簡素化します。

AIエンジニアとMLエンジニア

AIやMLのエンジニアは、埋め込みモデルを運用し、RAGやその他の推論ワークロードの検索ロジックを管理します。低レイテンシーのルックアップと埋め込みバージョン管理について、ベクトル・データベースに依存しています。

データサイエンティスト

データサイエンティストは埋め込みの品質を評価し、モデルの性能を分析します。ベクトル・ストアを使用して、高次元データを探索し、トレーニングセットを充実させ、データセット間の意味的関係を検証します。

オペレーター

オペレーターは、ベクター・ワークロードの拡張性と信頼性を維持します。ベクトル・データベースが本番環境でどのように実行されるか、およびより広範なデータおよびAIエコシステムにどのように適合するかを管理します。

オペレーションおよびサイト信頼性エンジニアリングチーム

オペレーションとサイト信頼性エンジニアリング（SRE）チームは、ベクトル・クエリーがレイテンシー、スループット、可用性の要件を満たしていることを確認するために性能を監視します。

エンタープライズ・アーキテクト

エンタープライズ・アーキテクトは、ベクトル・データベースがレイクハウス、ガバナンス・フレームワークおよび既存データ・プラットフォームとどのように統合されるかを決定し、相互運用性や長期的なアーキテクチャー適合性を評価します。

セキュリティーおよびガバナンス・チーム

セキュリティーおよびガバナンス・チームは、埋め込みとメタデータが企業および規制要件に準拠していることを確認します。アクセス制御を実施し、ベクトル化されたデータが適切なプライバシーと保護レベルを維持することを確認します。

ビジネスおよびデータ・エグゼクティブ

経営幹部は、ベクトル・データベースが企業のAIストラテジーをどのようにサポートするかを評価します。これらは、コスト効率、ガバナンス、リスク管理、およびベクトル機能が既存の運用モデルとどのように統合されるかに重点を置いています。

ベクトル・データベースの選択方法

ベクトル・データベース機能を選択する際、組織には幅広い選択肢があります。データとAIのニーズを満たすデータベースを見極めるために、多くの組織が検討する事項を挙げます。

ベクトルデータベースの種類
データ・エコシステムとの統合
ベクトル・データベースを作成およびデプロイするためのツール

ベクトルデータベースの種類

組織が選択できる選択肢には、次のようなものがあります。

スタンドアロン・ベクトル・データベース：松ぼっくりなどの独自の完全ベクトル化されたデータベース。

オープンソースのベクトルデータベース：オープンソースソリューションとしてWeaviateやMilvusのようなものがあり、組み込みのRESTful APIを提供し、PythonおよびJavaプログラミング言語をサポートしています。

ベクトル機能を統合したデータレイクハウス：IBM watsonx.dataのような、ベクトルデータベース機能を統合したデータレイクハウス。

既存のデータベース用のベクトル拡張機能：PostgreSQLのオープンソースのpgvector拡張機能など、ベクトル類似検索機能を提供するベクトル・データベースおよびデータベース検索拡張機能。SQLベクトル・データベースは、従来のSQLデータベースが持つ利点とベクトル・データベースの力を組み合わせることができます。

ベクトルをサポートする検索エンジン：OpenSearchのようなプラットフォームは、埋め込みデータを取り込んでクエリーするためのRESTful APIとともに、組み込みのベクトル検索機能を提供します。

ベクトル・ワークロードを実行するための新たなオプションは、サーバーレス・ベクトル・データベースです。サーバーレス設計によりインフラストラクチャーの管理やプロビジョニングの必要性がなくなり、チームはクラスター操作ではなく埋め込み生成やアプリケーション開発に集中できるようになります。容量はクエリー量とデータサイズに応じて自動的に拡張できるため、チームは性能を調整することなく予測できないワークロードに対応できます。

サーバーレス・ベクター・データベースは、ラピッド・プロトタイピング、イベント駆動型のAIアプリケーション、コスト管理と運用の簡素化が優先される開発環境に特に役立ちます。

データ・エコシステムとの統合

ベクトル・データベースはスタンドアロンの機能としてではなく、より広範なデータ・AIエコシステムの一部として考慮すべきです。

多くはAPIやネイティブ拡張機能を備えているか、データベースと統合できるようになっています。ベクトル・データベースは企業データを使用してモデルを強化するように構築されているため、組織は適切なデータ・ガバナンスとセキュリティーを導入して、LLMのトレーニングに使用されるデータが信頼できることを確認する必要もあります。

APIだけでなく、多くのベクトル・データベースは、APIをラップできるプログラミング言語固有のSDKを使用しています。開発者は、SDKを使用するとアプリ内のデータ操作が容易になる場合がよくあります。

ベクトル・データベースを作成およびデプロイするためのツール

LangChainは、LLMを使用したアプリケーションの開発に適した、オープンソースのオーケストレーション・フレームワークです。ベクトル・データベースの開発を最適化できます。

PythonベースとJavaScriptベースのライブラリーの両方で利用可能であり、LangChainのツールとAPIは、ローカルおよびクラウド・ベースのベクトル・ストアを用いてバーチャル・アシスタントなどのLLM駆動型アプリを構築するプロセスを簡素化します。実際、LangChainはLLM、埋め込み、ベクトル・ストア、ドキュメント・ローダー、ツールなど、合計1,000以上の統合を含む幅広いエコシステムへのアクセスを提供しています。

データレイクハウスは、統合されたベクトルデータベースと組み合わせることで、組織が生成AIアプリケーションのためにベクトル化された埋め込みを統一し、キュレーションし、準備するのを助けることができます。これにより、AIワークロードの関連性と精度が向上し、最終的により良いビジネス成果がもたらされます。

データレイクハウスの詳細について