IBM Synthetic Data Sets

AIの導入を加速し、予測精度を高める設計により、ビジネス・イノベーションと価値創出を推進

デジタル・コンポーネントと未来的なデザインに焦点を当てた、テクノロジーとイノベーションを表現した3Dブロックのデジタル・イラスト。

事前構築されたAI用の合成データセット

IBM Synthetic Data Setsは、金融サービスにおけるIBM ZおよびLinuxONEエンタープライズに役立つ予測AIモデルと大規模言語モデル(LLM)をトレーニングするように設計された、事前に構築された人工データセットです。

IBMの金融サービスの専門知識を活用して構築されたこれらのデータセットは、迅速、安全、正確なAI開発のための、豊富なプライバシー準拠データ(CSVまたはDDLでダウンロード可能)を提供します。

Webセミナー:IBM Synthetic Data Setsの紹介
AIモデルのトレーニングを安全に加速する

コンプライアンスに準拠した迅速な使用のために構築された、ダウンロード可能なPIIなしのデータセットを使用して、AIモデルの作成を加速します。

より豊富なデータでモデルを強化

不正ラベルや複数のエンティティーを含む豊富な合成データにアクセスして、より強力で幅広い洞察を取得します。

AIモデルの精度を検証

ラベル付きトランザクションを応答キーとして使用し、不正アクセス検知モデルをテスト、検証、改良します。

財務におけるリスク検知の最適化

キュレートされたデータセットにより、金融サービスAIプロジェクトにおける予測精度を向上させ、リスクを軽減します。

実際のPIIが含まれていないことを示すIBM Synthetic Data Setsの図
準拠データセット

エージェントベースのモデル生成手法は、統計的な母集団レベルで行われるため、アクセスに数か月かかる可能性のある実際の原始データは必要ありません。データセットは人工的に生成されたものであり、実際のPIIや匿名化されたPIIを含まないため、データ・プライバシー規制に準拠しています。

維持されたロジックを示すIBM Synthetic Data Setsの図
現実的な合成データ

IBM Synthetic Data Setsは、当社のエージェント・ベースのモデルに組み込まれた何年にもわたるカスタム・インプットとコードに基づいており、他の合成データ生成ツールでは実現できないものです。これらのデータセットは、他の合成データ生成ツールでデータを生成する際にしばしば課題となる、現実世界の複雑な関係性や制約を保持し、正確に反映しています。

既知のグラウンド・トゥルースを示すIBM Synthetic Data Setsの図
AIモデルの精度を向上

グラウンド・トゥルースの学習データは、真実であると知られている情報に関する注釈を追加し、AIモデルの精度を向上させます。IBM Synthetic Data Setsには、各取引が詐欺やマネー・ロンダリングのラベル付けがされている、既知のグラウンド・トゥルースが含まれています。

参照整合性を示すIBM Synthetic Data Setsの図
データ・テーブルの接続

参照整合性とは、異なるテーブル間の関係性を指し、その接続が意味的に正しく、正確で一貫性があり、最新であることを示します。参照整合性はIBM Synthetic Data Setsに見られますが、標準の合成データ生成ツールを使用して生成したデータではあまり見られません。

実際のPIIが含まれていないことを示すIBM Synthetic Data Setsの図
準拠データセット

エージェントベースのモデル生成手法は、統計的な母集団レベルで行われるため、アクセスに数か月かかる可能性のある実際の原始データは必要ありません。データセットは人工的に生成されたものであり、実際のPIIや匿名化されたPIIを含まないため、データ・プライバシー規制に準拠しています。

維持されたロジックを示すIBM Synthetic Data Setsの図
現実的な合成データ

IBM Synthetic Data Setsは、当社のエージェント・ベースのモデルに組み込まれた何年にもわたるカスタム・インプットとコードに基づいており、他の合成データ生成ツールでは実現できないものです。これらのデータセットは、他の合成データ生成ツールでデータを生成する際にしばしば課題となる、現実世界の複雑な関係性や制約を保持し、正確に反映しています。

既知のグラウンド・トゥルースを示すIBM Synthetic Data Setsの図
AIモデルの精度を向上

グラウンド・トゥルースの学習データは、真実であると知られている情報に関する注釈を追加し、AIモデルの精度を向上させます。IBM Synthetic Data Setsには、各取引が詐欺やマネー・ロンダリングのラベル付けがされている、既知のグラウンド・トゥルースが含まれています。

参照整合性を示すIBM Synthetic Data Setsの図
データ・テーブルの接続

参照整合性とは、異なるテーブル間の関係性を指し、その接続が意味的に正しく、正確で一貫性があり、最新であることを示します。参照整合性はIBM Synthetic Data Setsに見られますが、標準の合成データ生成ツールを使用して生成したデータではあまり見られません。

ユースケース
クレジットカードのイラスト
クレジットカード不正アクセス検知

不正アクセス検知を正確に行うことで、顧客の満足度とロイヤルティを維持しながら、財務上の損失を最小限に抑えることができます。決済カード向けIBM Synthetic Data Setsは、ラベル付きトランザクション・データを提供することで、不正行為防止AIモデルを改善します。

お金のアイソメトリック図
マネー・ロンダリング防止対策

コア・バンキングとマネーロンダリング対策用IBM Synthetic Data Setsは、実際の銀行データでは利用できないグローバルな現金の取引を含むラベル付きデータを提供します。これにより、より強力なマネーロンダリング対策モデルを構築し、リスクと誤検知を減らし、調査時間とコストを節約できます。

保険会社のビルのアイソメトリック図
保険請求詐欺

保険会社は実際の請求データを使用しますが、住宅保険向けのIBM Synthetic Data Setsには、さまざまな請求タイプと詐欺のケースをカバーする模擬的な「what-if」シナリオが追加されています。各請求には詐欺、検知状況、理由に関するラベルが付けられており、不正請求を検出するためのAIモデルのトレーニング、検証、改善に活用できる豊富なデータセットが提供されています。

Banking tech awards USA 2025バッジ
IBM Synthetic Data SetsでBanking Tech Awardsの「Best AI Solution」賞を受賞しました。
次のステップ

Synthetic Data Setsを使用してIBM ZおよびLinuxONE上でAIプロジェクトを開始する方法をご覧ください。

IBM Redpaperを読む 製品Webセミナーの再生を見る
その他の参考情報 資料 サポート ライフサイクル・サービスとサポート コミュニティー