IBM Synthetic Data Sets

Conçus pour accélérer l’adoption de l’IA et améliorer l’exactitude des prédictions afin de stimuler l’innovation et la création de valeur dans l’entreprise

Illustration numérique de blocs 3D représentant la technologie et l’innovation, avec un accent sur les composants numériques et la conception futuriste.

Jeux de données synthétiques prédéfinis pour l’IA

Les IBM® Synthetic Data Sets sont des jeux de données synthétiques prédéfinis qui permettent d’entraîner des modèles d’IA prédictifs et des grands modèles de langage (LLM) au profit des entreprises de services financiers utilisant IBM Z et LinuxONE.

Reposant sur l’expertise d’IBM en matière de services financiers, ces jeux de données fournissent des données riches et respectueuses de la confidentialité (téléchargeables en CSV ou DDL) pour un développement rapide, sécurisé et précis de l’IA.

Webinaire : Présentation des IBM Synthetic Data Sets
Accélérez l’entraînement des modèles d’IA en toute sécurité

Accélérez la création de modèles d’IA grâce à des jeux de données téléchargeables, exempts de données personnelles et conçus pour une utilisation rapide et conforme.

Améliorer les modèles avec des données plus riches

Accédez à des données synthétiques riches, notamment des étiquettes de fraude et plusieurs entités, pour obtenir des informations plus précises et plus complètes.

Valider la précision des modèles d'IA

Utilisez les transactions étiquetées comme clé de réponse pour tester, valider et affiner les modèles de détection des fraudes.

Optimisez la détection des risques dans le secteur financier

Améliorez l’exactitude des prédictions et réduisez les risques dans les projets d’IA liés aux services financiers grâce à des jeux de données sélectionnés avec soin.

Schéma d’IBM Synthetic Data Sets montrant qu’aucune donnée personnelle n’est incluse
Jeux de données conformes

La méthodologie de génération de modèles basée sur des agents s’applique au niveau d’une population statistique : aucune donnée source concernant des personnes réelles, dont l’accès peut prendre des mois, n’est nécessaire. Les jeux de données sont conformes aux réglementations en matière de confidentialité des données : ils ne contiennent aucune information personnelle réelle ou anonymisée puisqu’ils sont générés artificiellement.

Schéma des IBM Synthetic Data Sets montrant la logique maintenue
Des données synthétiques réalistes

IBM Synthetic Data Sets s'appuie sur des années d’entrées personnalisées et de code qui ont été intégrés à notre modèle basé sur un agent, dont les autres générateurs de données synthétiques ne disposent pas. Ces jeux de données conservent et reflètent fidèlement les relations et les contraintes complexes du monde réel, des éléments qui posent souvent problème dans la génération de données avec d’autres générateurs de données synthétiques.

Schéma des IBM Synthetic Data Sets montrant la vérité de terrain connue
Améliorer la précision des modèles d'IA

Les données d’entraînement de vérité terrain ajoutent des annotations concernant les informations connues pour être véridiques, améliorant ainsi la précision du modèle d’IA. IBM Synthetic Data Sets inclut des données de vérité terrain connues, où chaque transaction est étiquetée pour la fraude et le blanchiment d’argent.

Schéma d’IBM Synthetic Data Sets montrant l’intégrité référentielle
Connecter des tableaux de données

L’intégrité référentielle fait référence à la relation entre différentes tables, et au fait que la connexion est logique, précise, cohérente et à jour. L'intégrité référentielle est présente dans IBM Synthetic Data Sets, mais rarement avec les données qui utilisent des générateurs de données synthétiques standard.

Schéma d’IBM Synthetic Data Sets montrant qu’aucune donnée personnelle n’est incluse
Jeux de données conformes

La méthodologie de génération de modèles basée sur des agents s’applique au niveau d’une population statistique : aucune donnée source concernant des personnes réelles, dont l’accès peut prendre des mois, n’est nécessaire. Les jeux de données sont conformes aux réglementations en matière de confidentialité des données : ils ne contiennent aucune information personnelle réelle ou anonymisée puisqu’ils sont générés artificiellement.

Schéma des IBM Synthetic Data Sets montrant la logique maintenue
Des données synthétiques réalistes

IBM Synthetic Data Sets s'appuie sur des années d’entrées personnalisées et de code qui ont été intégrés à notre modèle basé sur un agent, dont les autres générateurs de données synthétiques ne disposent pas. Ces jeux de données conservent et reflètent fidèlement les relations et les contraintes complexes du monde réel, des éléments qui posent souvent problème dans la génération de données avec d’autres générateurs de données synthétiques.

Schéma des IBM Synthetic Data Sets montrant la vérité de terrain connue
Améliorer la précision des modèles d'IA

Les données d’entraînement de vérité terrain ajoutent des annotations concernant les informations connues pour être véridiques, améliorant ainsi la précision du modèle d’IA. IBM Synthetic Data Sets inclut des données de vérité terrain connues, où chaque transaction est étiquetée pour la fraude et le blanchiment d’argent.

Schéma d’IBM Synthetic Data Sets montrant l’intégrité référentielle
Connecter des tableaux de données

L’intégrité référentielle fait référence à la relation entre différentes tables, et au fait que la connexion est logique, précise, cohérente et à jour. L'intégrité référentielle est présente dans IBM Synthetic Data Sets, mais rarement avec les données qui utilisent des générateurs de données synthétiques standard.

Cas d’utilisation
Illustration d’une carte bancaire
Détection des fraudes par carte de crédit

Une détection précise des fraudes permet de satisfaire et de fidéliser les clients tout en minimisant les pertes financières. IBM Synthetic Data Sets for Payments Cards améliore les modèles d’IA dédiés à la protection contre la fraude en fournissant des données de transaction étiquetées.

Illustration isométrique représentant de l’argent
Lutte contre le blanchiment d’argent

IBM Synthetic Data Sets for Core Banking and Money Laundering fournit des données étiquetées, y compris des transactions mondiales et en espèces qui ne sont pas disponibles dans les données bancaires réelles. Cela permet d’élaborer des modèles plus solides destinés à la lutte contre le blanchiment d’argent, réduisant les risques et les faux positifs, et représentant des gains de temps et d’argent pour les enquêtes.

Illustration isométrique d’un immeuble de bureaux d’assurance
Fraude aux assurances

Les assureurs utilisent des données réelles sur les sinistres, mais IBM Synthetic Data Sets for Homeowners Insurance ajoute des scénarios synthétiques « hypothétiques » qui couvrent différents types de sinistres et de cas de fraude. Chaque sinistre est étiqueté pour la détection des fraudes, le statut de détection et la raison, fournissant un riche jeu de données pour entraîner, valider et améliorer les modèles d’IA en vue de détecter les demandes frauduleuses.

Badge des Banking Tech Awards USA 2025
IBM Synthetic Data Sets remporte le Banking Tech Award de la « Meilleure solution d’IA ».
Passez à l’étape suivante

Découvrez comment lancer des projets d’IA sur IBM Z et LinuxONE grâce aux Synthetic Data Sets.

Lire le Redpaper IBM Regarder le webinaire produit en replay
Autres moyens d’information Documentation Support Services et assistance tout au long du cycle de vie Communauté