IBM Synthetic Data Sets

Dirancang untuk mempercepat adopsi AI dan meningkatkan akurasi prediksi untuk mendorong inovasi dan nilai bisnis

Ilustrasi digital blok 3D yang merepresentasikan teknologi dan inovasi, dengan fokus pada komponen digital dan desain futuristik.

Kumpulan data sintetis siap pakai untuk AI

IBM® Synthetic Data Sets adalah kumpulan data buatan siap pakai yang dirancang untuk melatih model AI prediktif dan model bahasa besar (LLM) yang berguna bagi perusahaan layanan keuangan yang mengandalkan IBM Z dan LinuxONE.

Dibuat dengan keahlian layanan keuangan IBM, kumpulan data ini memberikan data yang kaya dan patuh terhadap privasi (dapat diunduh dalam CSV atau DDL) untuk pengembangan AI yang cepat, aman, dan akurat.

Webinar: Pengenalan IBM Synthetic Data Sets
Mempercepat pelatihan model AI dengan aman

Mulai pembuatan model AI dengan kumpulan data bebas PII yang dapat diunduh yang dibuat untuk penggunaan yang cepat dan sesuai.

Tingkatkan model dengan data yang lebih kaya

Akses data sintetis yang kaya, termasuk label penipuan, dan banyak entitas untuk insight yang lebih andal dan lebih luas.

Memvalidasi keakuratan model AI

Gunakan transaksi berlabel sebagai kunci jawaban untuk menguji, memvalidasi, dan menyempurnakan model deteksi penipuan.

Mengoptimalkan deteksi risiko dalam keuangan

Tingkatkan akurasi prediksi dan kurangi risiko dalam proyek AI layanan keuangan dengan kumpulan data yang dikurasi.

Diagram Kumpulan Data Sintetis IBM yang menunjukkan tidak ada PII nyata yang disertakan
Kumpulan data yang sesuai

Metodologi pembuatan model berbasis agen berada pada tingkat populasi statistik sehingga tidak memerlukan data sumber nyata, yang dapat memakan waktu berbulan-bulan untuk mengaksesnya. Kumpulan data mematuhi peraturan privasi data karena tidak berisi PII asli atau anonim karena dibuat secara artifisial.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan logika yang dipertahankan
Data sintetis yang realistis

IBM Synthetic Data Sets didasarkan pada input dan kode khusus selama bertahun-tahun yang disertakan ke dalam model berbasis agen kami yang tidak ditawarkan oleh generator data sintetis lainnya. Kumpulan data ini mempertahankan dan secara akurat mencerminkan hubungan dan batasan kompleks dunia nyata yang sering kali menghadirkan tantangan saat menghasilkan data dengan generator data sintetis lainnya.

Diagram Kumpulan Data Sintetis IBM yang menunjukkan kebenaran dasar diketahui
Tingkatkan akurasi model AI

Data pelatihan kebenaran dasar menambahkan anotasi mengenai informasi yang diketahui benar, sehingga meningkatkan akurasi model AI. IBM Synthetic Data Sets memiliki kebenaran dasar yang diketahui, di mana setiap transaksi diberi label untuk penipuan dan pencucian uang.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan integritas referensial
Hubungkan tabel data

Integritas referensial merujuk pada hubungan antara berbagai tabel, dan bahwa hubungan tersebut masuk akal, akurat, konsisten, dan terkini. Integritas referensial ditemukan di seluruh IBM Synthetic Data Sets tetapi tidak sering ditemukan pada data yang menggunakan generator data sintetis standar.

Diagram Kumpulan Data Sintetis IBM yang menunjukkan tidak ada PII nyata yang disertakan
Kumpulan data yang sesuai

Metodologi pembuatan model berbasis agen berada pada tingkat populasi statistik sehingga tidak memerlukan data sumber nyata, yang dapat memakan waktu berbulan-bulan untuk mengaksesnya. Kumpulan data mematuhi peraturan privasi data karena tidak berisi PII asli atau anonim karena dibuat secara artifisial.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan logika yang dipertahankan
Data sintetis yang realistis

IBM Synthetic Data Sets didasarkan pada input dan kode khusus selama bertahun-tahun yang disertakan ke dalam model berbasis agen kami yang tidak ditawarkan oleh generator data sintetis lainnya. Kumpulan data ini mempertahankan dan secara akurat mencerminkan hubungan dan batasan kompleks dunia nyata yang sering kali menghadirkan tantangan saat menghasilkan data dengan generator data sintetis lainnya.

Diagram Kumpulan Data Sintetis IBM yang menunjukkan kebenaran dasar diketahui
Tingkatkan akurasi model AI

Data pelatihan kebenaran dasar menambahkan anotasi mengenai informasi yang diketahui benar, sehingga meningkatkan akurasi model AI. IBM Synthetic Data Sets memiliki kebenaran dasar yang diketahui, di mana setiap transaksi diberi label untuk penipuan dan pencucian uang.

Diagram Kumpulan Data Sintesis IBM yang menunjukkan integritas referensial
Hubungkan tabel data

Integritas referensial merujuk pada hubungan antara berbagai tabel, dan bahwa hubungan tersebut masuk akal, akurat, konsisten, dan terkini. Integritas referensial ditemukan di seluruh IBM Synthetic Data Sets tetapi tidak sering ditemukan pada data yang menggunakan generator data sintetis standar.

Contoh penggunaan
Ilustrasi kartu kredit
Deteksi penipuan kartu kredit

Deteksi penipuan yang akurat membuat pelanggan puas dan loyal sambil meminimalkan kerugian finansial. IBM Synthetic Data Sets untuk Payments Cards meningkatkan model AI perlindungan penipuan dengan menyediakan data transaksi berlabel.

Ilustrasi isometrik uang
Anti pencucian uang

IBM Synthetic Data Sets for Core Banking and Money Laundering menyediakan data berlabel, termasuk transaksi global dan tunai yang tidak tersedia dalam data perbankan yang sebenarnya. Hal ini membantu membangun model antipencucian uang yang lebih kuat, sehingga mengurangi risiko dan false positive, menghemat waktu dan biaya investigasi.

Ilustrasi isometrik bangunan asuransi
Penipuan klaim asuransi

Perusahaan asuransi menggunakan data klaim yang sebenarnya, tetapi IBM Synthetic Data Sets for Homeowners Insurance menambahkan skenario buatan "what-if" yang mencakup beragam jenis klaim dan kasus penipuan. Setiap klaim diberi label untuk penipuan, status deteksi penipuan, dan alasan, sehingga menyediakan kumpulan data yang kaya untuk melatih, memvalidasi, dan meningkatkan model AI untuk mendeteksi klaim penipuan.

Lencana Banking tech awards USA tahun 2025
IBM Synthetic Data Sets memenangkan Penghargaan Teknologi Perbankan untuk “Solusi AI Terbaik".
Ambil langkah selanjutnya

Temukan cara memulai proyek AI pada IBM Z dan LinuxONE dengan Kumpulan Data Sintesis.

Baca IBM Redpaper Tonton pemutaran webinar produk
Cara penelusuran lainnya Dokumentasi Dukungan Layanan dan dukungan siklus hidup Komunitas