IBM Synthetic Data Sets

Kumpulan data sintetis siap pakai untuk AI

IBM® Synthetic Data Sets adalah kumpulan data buatan siap pakai yang dirancang untuk melatih model AI prediktif dan model bahasa besar (LLM) yang berguna bagi perusahaan layanan keuangan yang mengandalkan IBM Z dan LinuxONE.

Dibuat dengan keahlian layanan keuangan IBM, kumpulan data ini memberikan data yang kaya dan patuh terhadap privasi (dapat diunduh dalam CSV atau DDL) untuk pengembangan AI yang cepat, aman, dan akurat.

Webinar: Pengenalan IBM Synthetic Data Sets

Mempercepat pelatihan model AI dengan aman

Mulai pembuatan model AI dengan kumpulan data bebas PII yang dapat diunduh yang dibuat untuk penggunaan yang cepat dan sesuai.

Tingkatkan model dengan data yang lebih kaya

Akses data sintetis yang kaya, termasuk label penipuan, dan banyak entitas untuk insight yang lebih andal dan lebih luas.

Memvalidasi keakuratan model AI

Gunakan transaksi berlabel sebagai kunci jawaban untuk menguji, memvalidasi, dan menyempurnakan model deteksi penipuan.

Mengoptimalkan deteksi risiko dalam keuangan

Tingkatkan akurasi prediksi dan kurangi risiko dalam proyek AI layanan keuangan dengan kumpulan data yang dikurasi.

Tidak ada PII nyata yang disertakan
Tidak ada PII nyata yang disertakan
Logika dipertahankan
Logika dipertahankan
Kebenaran pertumbuhan yang diketahui
Kebenaran pertumbuhan yang diketahui
Integritas referensial
Integritas referensial

Diagram Kumpulan Data Sintetis IBM yang menunjukkan tidak ada PII nyata yang disertakan

Kumpulan data yang sesuai

Metodologi pembuatan model berbasis agen berada pada tingkat populasi statistik sehingga tidak memerlukan data sumber nyata, yang dapat memakan waktu berbulan-bulan untuk mengaksesnya. Kumpulan data mematuhi peraturan privasi data karena tidak berisi PII asli atau anonim karena dibuat secara artifisial.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan logika yang dipertahankan

Data sintetis yang realistis

IBM Synthetic Data Sets didasarkan pada input dan kode khusus selama bertahun-tahun yang disertakan ke dalam model berbasis agen kami yang tidak ditawarkan oleh generator data sintetis lainnya. Kumpulan data ini mempertahankan dan secara akurat mencerminkan hubungan dan batasan kompleks dunia nyata yang sering kali menghadirkan tantangan saat menghasilkan data dengan generator data sintetis lainnya.

Tingkatkan akurasi model AI

Data pelatihan kebenaran dasar menambahkan anotasi mengenai informasi yang diketahui benar, sehingga meningkatkan akurasi model AI. IBM Synthetic Data Sets memiliki kebenaran dasar yang diketahui, di mana setiap transaksi diberi label untuk penipuan dan pencucian uang.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan integritas referensial

Hubungkan tabel data

Integritas referensial merujuk pada hubungan antara berbagai tabel, dan bahwa hubungan tersebut masuk akal, akurat, konsisten, dan terkini. Integritas referensial ditemukan di seluruh IBM Synthetic Data Sets tetapi tidak sering ditemukan pada data yang menggunakan generator data sintetis standar.

Kumpulan data yang sesuai

Data sintetis yang realistis

Tingkatkan akurasi model AI

Hubungkan tabel data

Contoh penggunaan

Deteksi penipuan kartu kredit

Deteksi penipuan yang akurat membuat pelanggan puas dan loyal sambil meminimalkan kerugian finansial. IBM Synthetic Data Sets untuk Payments Cards meningkatkan model AI perlindungan penipuan dengan menyediakan data transaksi berlabel.

Anti pencucian uang

IBM Synthetic Data Sets for Core Banking and Money Laundering menyediakan data berlabel, termasuk transaksi global dan tunai yang tidak tersedia dalam data perbankan yang sebenarnya. Hal ini membantu membangun model antipencucian uang yang lebih kuat, sehingga mengurangi risiko dan false positive, menghemat waktu dan biaya investigasi.

Penipuan klaim asuransi

Perusahaan asuransi menggunakan data klaim yang sebenarnya, tetapi IBM Synthetic Data Sets for Homeowners Insurance menambahkan skenario buatan "what-if" yang mencakup beragam jenis klaim dan kasus penipuan. Setiap klaim diberi label untuk penipuan, status deteksi penipuan, dan alasan, sehingga menyediakan kumpulan data yang kaya untuk melatih, memvalidasi, dan meningkatkan model AI untuk mendeteksi klaim penipuan.

Lencana Banking tech awards USA tahun 2025

IBM Synthetic Data Sets memenangkan Penghargaan Teknologi Perbankan untuk “Solusi AI Terbaik".

Ambil langkah selanjutnya

Temukan cara memulai proyek AI pada IBM Z dan LinuxONE dengan Kumpulan Data Sintesis.

Cara penelusuran lainnya

Dokumentasi

Dukungan

Layanan dan dukungan siklus hidup

Komunitas