IBM Synthetic Data Sets

Entwickelt zur Beschleunigung der KI-Einführung und zur Erhöhung der Vorhersagegenauigkeit, um Innovation und Wertschöpfung im Unternehmen zu steigern

Digitale Illustration von 3D-Blöcken, die für Technologie und Innovation stehen, mit Schwerpunkt auf digitalen Komponenten und futuristischem Design.

Vorgefertigte synthetische Datensätze für KI

IBM Synthetic Data Sets sind vorgefertigte, künstliche Datensätze, die darauf ausgelegt sind, prädiktive KI-Modelle und große Sprachmodelle (Large Language Models, LLMs) zu trainieren, um IBM Z- und LinuxONE-Unternehmen im Bereich der Finanzdienstleistungen einen Nutzen zu bieten.

Diese Datensätze basieren auf dem Fachwissen von IBM im Bereich der Finanzdienstleistungen und liefern umfangreiche, datenschutzkonforme Daten (herunterladbar in CSV oder DDL) für eine schnelle, sichere und präzise KI-Entwicklung.

Webinar: Einführung in IBM Synthetic Data Sets
Beschleunigen Sie das Training von KI-Modellen auf sichere Weise

Starten Sie die Erstellung von KI-Modellen mit herunterladbaren Datensätzen, die frei von personenbezogenen Daten sind und für eine schnelle und konforme Nutzung entwickelt wurden.

Verbesserung von Modellen mit umfangreicheren Daten

Greifen Sie auf umfangreiche synthetische Daten zu, einschließlich Betrugskennzeichnungen und mehrerer Entitäten für bessere, umfassendere Erkenntnisse.

Validierung der Genauigkeit von KI-Modellen

Verwenden Sie gekennzeichnete Transaktionen als Antwortschlüssel, um Betrugserkennung zu testen, zu validieren und zu verfeinern.

Optimieren Sie die Risikoerkennung im Finanzwesen

Verbessern Sie die Vorhersagegenauigkeit und reduzieren Sie das Risiko in KI-Projekten für Finanzdienstleistungen mit kuratierten Datensätzen.

IBM Synthetic Data Sets-Diagramm, das keine echten personenbezogenen Daten enthält
Konforme Datensätze

Die agentengestützte Methode zur Modellgenerierung basiert auf einer statistischen Populationsebene, sodass keine echten Quelldaten benötigt werden. Der Zugriff auf diese könnte Monate dauern. Die Datensätze entsprechen den Datenschutzbestimmungen, da sie keine echten oder anonymisierten personenbezogenen Daten enthalten, weil sie künstlich generiert wurden.

IBM Synthetic Data Sets-Diagramm mit beibehaltener Logik
Realistische synthetische Daten

IBM Synthetic Data Sets basieren auf jahrelangen benutzerdefinierten Eingaben und Code, der in unser agentenbasiertes Modell eingearbeitet wurde und den andere Generatoren für synthetische Daten nicht bieten. Diese Datensätze bewahren und spiegeln die komplexen Beziehungen und Einschränkungen der realen Welt genau wider, die bei der Datengenerierung mit anderen synthetischen Datengeneratoren oft eine Herausforderung darstellen.

IBM Synthetic Data Sets-Diagramm, das die bekannte Ground Truth zeigt
Die Genauigkeit von KI-Modellen verbessern

Ground-Truth-Trainingsdaten fügen Anmerkungen zu Informationen hinzu, von denen bekannt ist, dass sie wahr sind, wodurch die Genauigkeit der KI-Modelle verbessert wird. IBM Synthetic Data Sets verfügt über die bekannte Ground Truth, bei der jede Transaktion als Betrug und Geldwäsche gekennzeichnet ist.

IBM Synthetic Data Set-Diagramm, das referenzielle Integrität zeigt
Datentabellen verbinden

Referenzielle Integrität bezieht sich auf die Beziehung zwischen verschiedenen Tabellen und darauf, dass die Verbindung sinnvoll, genau, einheitlich und aktuell ist. Referenzielle Integrität ist in allen IBM Synthetic Data Sets vorhanden, kommt jedoch selten bei Daten vor, die standardmäßige synthetische Datengeneratoren verwenden.

IBM Synthetic Data Sets-Diagramm, das keine echten personenbezogenen Daten enthält
Konforme Datensätze

Die agentengestützte Methode zur Modellgenerierung basiert auf einer statistischen Populationsebene, sodass keine echten Quelldaten benötigt werden. Der Zugriff auf diese könnte Monate dauern. Die Datensätze entsprechen den Datenschutzbestimmungen, da sie keine echten oder anonymisierten personenbezogenen Daten enthalten, weil sie künstlich generiert wurden.

IBM Synthetic Data Sets-Diagramm mit beibehaltener Logik
Realistische synthetische Daten

IBM Synthetic Data Sets basieren auf jahrelangen benutzerdefinierten Eingaben und Code, der in unser agentenbasiertes Modell eingearbeitet wurde und den andere Generatoren für synthetische Daten nicht bieten. Diese Datensätze bewahren und spiegeln die komplexen Beziehungen und Einschränkungen der realen Welt genau wider, die bei der Datengenerierung mit anderen synthetischen Datengeneratoren oft eine Herausforderung darstellen.

IBM Synthetic Data Sets-Diagramm, das die bekannte Ground Truth zeigt
Die Genauigkeit von KI-Modellen verbessern

Ground-Truth-Trainingsdaten fügen Anmerkungen zu Informationen hinzu, von denen bekannt ist, dass sie wahr sind, wodurch die Genauigkeit der KI-Modelle verbessert wird. IBM Synthetic Data Sets verfügt über die bekannte Ground Truth, bei der jede Transaktion als Betrug und Geldwäsche gekennzeichnet ist.

IBM Synthetic Data Set-Diagramm, das referenzielle Integrität zeigt
Datentabellen verbinden

Referenzielle Integrität bezieht sich auf die Beziehung zwischen verschiedenen Tabellen und darauf, dass die Verbindung sinnvoll, genau, einheitlich und aktuell ist. Referenzielle Integrität ist in allen IBM Synthetic Data Sets vorhanden, kommt jedoch selten bei Daten vor, die standardmäßige synthetische Datengeneratoren verwenden.

Anwendungsfälle
Abbildung einer Kreditkarte
Erkennung von Kreditkartenbetrug

Eine präzise Betrugserkennung sorgt für zufriedene und treue Kunden und minimiert gleichzeitig finanzielle Verluste. IBM Synthetic Data Sets for Payments Card verbessert KI-Modelle zum Schutz vor Betrug durch die Bereitstellung gekennzeichneter Transaktionsdaten.

Isometrische Darstellung von Geld
Geldwäschebekämpfung

IBM Synthetic Data Sets for Core Banking and Money Laundering bietet gekennzeichnete Daten, einschließlich globaler und Bargeldtransaktionen, die in echten Bankdaten nicht verfügbar sind. Dies fördert die Entwicklung stärkerer Modelle zur Bekämpfung von Geldwäsche, die Reduzierung von Risiken und Fehlmeldungen sowie die Ersparnis von Untersuchungszeit und Kosten.

Isometrische Darstellung eines Versicherungsgebäudes
Versicherungsbetrug

Versicherungen verwenden echte Schadendaten. IBM Synthetic Data Sets für Wohngebäudeversicherungen hingegen nutzen hypothetische synthetische Szenarien, die diverse Schadentypen und Betrugsfälle abdecken. Jeder Schadensfall wird nach Betrug, Erkennungsstatus und Grund gekennzeichnet und bietet so einen umfangreichen Datensatz zum Trainieren, Validieren und Verbessern von KI-Modellen zur Betrugserkennung.

Banking Tech Awards USA 2025 Badge
IBM Synthetic Data Sets gewinnt den Banking Tech Award als „Beste KI-Lösung“.
Gehen Sie den nächsten Schritt

Entdecken Sie, wie Sie KI-Projekte auf IBM Z und LinuxONE mit synthetischen Datensätzen auf den Weg bringen können.

IBM Redpaper lesen Sehen Sie sich die Wiedergabe des Webinars an
Weitere Erkundungsmöglichkeiten Dokumentation Support Service und Unterstützung während des gesamten Lebenszyklus Community