IBM® Synthetic Data Sets

Desenvolvido para acelerar a adoção de IA e aumentar a precisão preditiva para impulsionar a inovação e o valor nos negócios

Ilustração digital de blocos 3D representando tecnologia e inovação com foco em componentes digitais e design futurista.

Synthetic Data Sets criado previamente para IA

O IBM® Synthetic Data Sets são conjuntos de dados artificiais criados previamente projetados para treinar modelos de IA preditiva e grandes modelos de linguagem (LLMs) para beneficiar empresas do IBM® Z e LinuxONE em serviços financeiros.

Desenvolvido com o conhecimento especializado em serviços financeiros da IBM, esses conjuntos de dados fornecem dados ricos e em conformidade com a privacidade (para download em CSV ou DDL) para o desenvolvimento rápido, seguro e preciso da IA.

Webinar: introdução ao IBM Synthetic Data Sets
Acelere o treinamento de modelos de IA com segurança

Inicie a criação de modelos de IA com conjuntos de dados para download e sem PII, criados para uso rápido e em conformidade.

Melhore os modelos com dados mais ricos

Acesse vastos dados sintéticos, incluindo rótulos de fraude e várias entidades, para obter insights mais sólidos e amplos.

Valide a precisão dos modelos de IA

Use transações rotuladas como uma chave de resposta para testar, validar e refinar modelos de detecção de fraude.

Otimize a detecção de riscos em finanças

Melhore a precisão preditiva e reduza os riscos em projetos de IA para serviços financeiros com conjuntos de dados selecionados.

Diagrama dos IBM Synthetic Data Sets mostrando que nenhum PII real está incluído
Conjuntos de dados em conformidade

A metodologia de geração de modelos baseada em agentes opera em nível de população estatística, de modo que nenhum dado de origem real, cuja obtenção pode levar meses, é necessário. Os conjuntos de dados estão em conformidade com as regulamentações de privacidade de dados, pois não contêm nenhum PII real ou anonimizado, pois são gerados artificialmente.

Diagrama dos IBM Synthetic Data Sets mostrando lógica mantida
Dados sintéticos realistas

Os IBM Synthetic Data Sets são baseados em anos de inputs customizados e código incorporado ao nosso modelo baseado em agentes, que outros geradores de dados sintéticos não oferecem. Estes conjuntos de dados retêm e refletem com precisão as complexas relações e restrições do mundo real, que frequentemente apresentam desafios ao gerar dados com outros geradores de dados sintéticos.

Diagrama do IBM Synthetic Data Sets mostrando a verdade fundamental conhecida
Aprimore a precisão dos modelos de IA

Dados de treinamento com verdade fundamental adicionam anotações sobre informações que são conhecidas como verdadeiras, aprimorando a precisão dos modelos de IA. Os IBM Synthetic Data Sets possuem verdade fundamental conhecida, onde cada transação é rotulada para fraude e lavagem de dinheiro.

Diagrama dos IBM Synthetic Data Sets mostrando integridade referencial
Conecte as tabelas de dados

A integridade referencial refere-se à relação entre diferentes tabelas, e ao fato de que a conexão faz sentido, é precisa, consistente e está atualizada. A integridade referencial é encontrada em todos os IBM Synthetic Data Sets, mas raramente é observada em dados gerados por geradores de dados sintéticos padrão.

Diagrama dos IBM Synthetic Data Sets mostrando que nenhum PII real está incluído
Conjuntos de dados em conformidade

A metodologia de geração de modelos baseada em agentes opera em nível de população estatística, de modo que nenhum dado de origem real, cuja obtenção pode levar meses, é necessário. Os conjuntos de dados estão em conformidade com as regulamentações de privacidade de dados, pois não contêm nenhum PII real ou anonimizado, pois são gerados artificialmente.

Diagrama dos IBM Synthetic Data Sets mostrando lógica mantida
Dados sintéticos realistas

Os IBM Synthetic Data Sets são baseados em anos de inputs customizados e código incorporado ao nosso modelo baseado em agentes, que outros geradores de dados sintéticos não oferecem. Estes conjuntos de dados retêm e refletem com precisão as complexas relações e restrições do mundo real, que frequentemente apresentam desafios ao gerar dados com outros geradores de dados sintéticos.

Diagrama do IBM Synthetic Data Sets mostrando a verdade fundamental conhecida
Aprimore a precisão dos modelos de IA

Dados de treinamento com verdade fundamental adicionam anotações sobre informações que são conhecidas como verdadeiras, aprimorando a precisão dos modelos de IA. Os IBM Synthetic Data Sets possuem verdade fundamental conhecida, onde cada transação é rotulada para fraude e lavagem de dinheiro.

Diagrama dos IBM Synthetic Data Sets mostrando integridade referencial
Conecte as tabelas de dados

A integridade referencial refere-se à relação entre diferentes tabelas, e ao fato de que a conexão faz sentido, é precisa, consistente e está atualizada. A integridade referencial é encontrada em todos os IBM Synthetic Data Sets, mas raramente é observada em dados gerados por geradores de dados sintéticos padrão.

Casos de uso
Ilustração de um cartão de crédito
Detecção de fraude em cartões de crédito

A detecção precisa de fraudes mantém os clientes satisfeitos e leais, ao mesmo tempo que minimiza perdas financeiras. O IBM Synthetic Data Sets for Payments Cards aprimora os modelos de IA de proteção contra fraudes ao fornecer dados de transações rotulados.

Ilustração isométrica de dinheiro
Redução de dinheiro

O IBM Synthetic Data Sets for Core Banking and Money Laundering fornece dados rotulados, incluindo transações globais e em dinheiro que não estão disponíveis em dados bancários reais. Isso ajuda a construir modelos mais robustos de combate à lavagem de dinheiro, reduzindo riscos e falsos positivos, economizando tempo e custos de investigação.

Ilustração isométrica do edifício de seguros
Fraude em sinistros de seguros

As seguradoras utilizam dados reais de sinistros, mas o IBM Synthetic Data Sets for Homeowners Insurance adiciona cenários sintéticos hipotéticos que abrangem diversos tipos de sinistros e casos de fraudes. Cada sinistro é rotulado para fraude, status de detecção e motivo, proporcionando um vasto conjunto de dados para treinar, validar e aprimorar modelos de IA para detectar sinistros fraudulentos.

Distintivo do Banking Tech Awards USA de 2025
O IBM Synthetic Data Sets ganha o Banking Tech Award por "Melhor Solução de IA".
Dê o próximo passo

Descubra como iniciar projetos de IA no IBM Z e LinuxONE com o Synthetic Data Sets.

Leia o IBM Redpaper Assista à reprodução do webinar do produto
Outras maneiras de explorar Documentação Suporte Serviços e suporte para o ciclo de vida Comunidade