IBM Synthetic Data Sets

حل مصمم لتسريع اعتماد الذكاء الاصطناعي وزيادة الدقة التنبؤية لدفع عجلة الابتكار وتحقيق أكبر قيمة ممكنة من الأعمال

رسم توضيحي رقمي لكتل ثلاثية الأبعاد تمثِّل التكنولوجيا والابتكار، مع التركيز على العناصر الرقمية والتصميم المستقبلي.

مجموعات بيانات اصطناعية جاهزة للذكاء الاصطناعي

تُعَد IBM® Synthetic Data Sets مجموعات بيانات جاهزة واصطناعية مصممة لتدريب نماذج الذكاء الاصطناعي التنبؤية والنماذج اللغوية الكبيرة (LLMs)، لصالح مؤسسات IBM® Z وLinuxONE في قطاع الخدمات المالية.

تم تطوير مجموعات البيانات هذه بالاستفادة من خبرة IBM في الخدمات المالية، وتوفِّر بيانات غنية ومتوافقة مع معايير الخصوصية (قابلة للتنزيل بصيغ CSV أو DDL) لتطوير الذكاء الاصطناعي بسرعة ودقة وأمان.

ندوة الإنترنت: مقدمة عن IBM Synthetic Data Sets
تسريع تدريب نماذج الذكاء الاصطناعي بشكل آمن

بدء إنشاء نماذج الذكاء الاصطناعي بسرعة باستخدام مجموعات البيانات القابلة للتنزيل والخالية من معلومات التعريف الشخصية المصممة للاستخدام السريع والمتوافق.

تعزيز النماذج ببيانات أكثر ثراءً

الوصول إلى البيانات الاصطناعية الغنية بما في ذلك تسميات الاحتيال والكيانات المتعددة للحصول على رؤى أقوى وأوسع.

التحقق من دقة نماذج الذكاء الاصطناعي

استخدام المعاملات المصنّفة كمفتاح إجابة لاختبار نماذج الكشف عن الاحتيال والتحقق منها وتحسينها.

تحسين الكشف عن المخاطر في التمويل

تحسين الدقة التنبؤية وتقليل المخاطر في مشاريع الذكاء الاصطناعي للخدمات المالية باستخدام مجموعات البيانات المنسقة.

مخطط مجموعات بيانات IBM Synthetic Data Sets لا يتضمن أي معلومات شخصية حقيقية عن هوية المستخدم
مجموعات بيانات متوافقة

تعتمد منهجية إنشاء النموذج القائم على الوكيل على مستوى إحصائي لمجموعة من الأشخاص المستهدفين، وبالتالي لا تكون هناك حاجة إلى بيانات من مصدر حقيقي، والتي قد يستغرق الوصول إليها شهورًا عديدة. مجموعة البيانات متوافقة مع لوائح البيانات الشخصية؛ لأنها لا تحتوي على أي معلومات شخصية حقيقية أو مجهولة المصدر؛ لأنها منشأة بشكل مصطنع.

مخطط مجموعات بيانات IBM Synthetic Data Sets يوضح المنطق الذي تم اتباعه
بيانات اصطناعية واقعية

يقوم حل IBM Synthetic Data Sets على سنوات من الخبرة والمدخلات المخصصة والتعليمات البرمجية التي وضعناها في نموذجنا القائم على الوكيل والذي لا تقدمه مولدات البيانات الاصطناعية الأخرى. تحتفظ مجموعة البيانات هذه بالعلاقات والقيود المعقدة في العالم الحقيقي وتعكس بدقة العلاقات والقيود المعقدة التي غالبًا ما تمثل تحديات عند توليد البيانات باستخدام مولدات البيانات التركيبية الأخرى.

مخطط مجموعات بيانات IBM Synthetic Data Sets الذي يوضح حقائق أساسية معروفة
تحسين دقة نموذج الذكاء الاصطناعي

تنجح بيانات تدريب الحقائق الأساسية في إضافة تعليقات توضيحية ذات صلة بالمعلومات المعروف أنها صحيحة، مما يعزز دقة نموذج الذكاء الاصطناعي. تتضمن مجموعات بيانات IBM Synthetic Data Sets حقائق أساسية معروفة، حيث يتم تصنيف كل معاملة من معاملات الاحتيال وغسيل الأموال.

مخطط مجموعات بيانات IBM Synthetic Data Sets يوضح التكامل المرجعي
ربط جداول البيانات

يشير التكامل المرجعي إلى العلاقة بين الجداول المختلفة، وأن يكون الارتباط منطقيًا ودقيقًا ومتسقًا ومحدثًا. ويوجد التكامل المرجعي عبر IBM Synthetic Data Sets ولكن لا يوجد غالبًا مع البيانات التي تستخدم مولدات البيانات الاصطناعية القياسية.

مخطط مجموعات بيانات IBM Synthetic Data Sets لا يتضمن أي معلومات شخصية حقيقية عن هوية المستخدم
مجموعات بيانات متوافقة

تعتمد منهجية إنشاء النموذج القائم على الوكيل على مستوى إحصائي لمجموعة من الأشخاص المستهدفين، وبالتالي لا تكون هناك حاجة إلى بيانات من مصدر حقيقي، والتي قد يستغرق الوصول إليها شهورًا عديدة. مجموعة البيانات متوافقة مع لوائح البيانات الشخصية؛ لأنها لا تحتوي على أي معلومات شخصية حقيقية أو مجهولة المصدر؛ لأنها منشأة بشكل مصطنع.

مخطط مجموعات بيانات IBM Synthetic Data Sets يوضح المنطق الذي تم اتباعه
بيانات اصطناعية واقعية

يقوم حل IBM Synthetic Data Sets على سنوات من الخبرة والمدخلات المخصصة والتعليمات البرمجية التي وضعناها في نموذجنا القائم على الوكيل والذي لا تقدمه مولدات البيانات الاصطناعية الأخرى. تحتفظ مجموعة البيانات هذه بالعلاقات والقيود المعقدة في العالم الحقيقي وتعكس بدقة العلاقات والقيود المعقدة التي غالبًا ما تمثل تحديات عند توليد البيانات باستخدام مولدات البيانات التركيبية الأخرى.

مخطط مجموعات بيانات IBM Synthetic Data Sets الذي يوضح حقائق أساسية معروفة
تحسين دقة نموذج الذكاء الاصطناعي

تنجح بيانات تدريب الحقائق الأساسية في إضافة تعليقات توضيحية ذات صلة بالمعلومات المعروف أنها صحيحة، مما يعزز دقة نموذج الذكاء الاصطناعي. تتضمن مجموعات بيانات IBM Synthetic Data Sets حقائق أساسية معروفة، حيث يتم تصنيف كل معاملة من معاملات الاحتيال وغسيل الأموال.

مخطط مجموعات بيانات IBM Synthetic Data Sets يوضح التكامل المرجعي
ربط جداول البيانات

يشير التكامل المرجعي إلى العلاقة بين الجداول المختلفة، وأن يكون الارتباط منطقيًا ودقيقًا ومتسقًا ومحدثًا. ويوجد التكامل المرجعي عبر IBM Synthetic Data Sets ولكن لا يوجد غالبًا مع البيانات التي تستخدم مولدات البيانات الاصطناعية القياسية.

حالات الاستخدام
رسم توضيحي لبطاقة ائتمان.
الكشف عن الغش في بطاقات الائتمان

يضمن الكشف الدقيق عن الاحتيال رضا العملاء وولاءهم، مع تقليل الخسائر المالية إلى الحد الأدنى. يعمل الحل IBM Synthetic Data Sets for Payments Cards على تحسين نماذج الذكاء الاصطناعي الخاصة بالحماية من الاحتيال من خلال توفير بيانات معاملات مصنَّفة.

رسم توضيحي متساوي الأبعاد لنقود
مكافحة غسل الأموال

يوفر حل IBM Synthetic Data Sets for Core Banking and Money Laundering بيانات مصنَّفة، تشمل المعاملات النقدية والعالمية غير المتاحة في البيانات المصرفية الفعلية. ويساعد ذلك على بناء نماذج أقوى لمكافحة غسل الأموال، ما يقلل المخاطر والإيجابيات الزائفة، ويوفر الوقت والتكاليف في عمليات التحقيق.

رسم توضيحي متساوي الأبعاد لمبنى تأمين
الاحتيال في مطالبات التأمين

تستخدم شركات التأمين بيانات المطالبات الحقيقية ولكن حل IBM Synthetic Data Sets for Homeowners Insurance يضيف سيناريوهات "ماذا لو" الاصطناعية التي تغطي أنواعًا أخرى متنوعة من المطالبات ومزيدًا من حالات الاحتيال. يتم تصنيف كل مطالبة بتصنيفات تشمل حالة الاحتيال وحالة الكشف والسبب؛ لتوفير مجموعة بيانات غنية تُستخدم في تدريب نماذج الذكاء الاصطناعي والتحقق منها وتحسينها للكشف عن المطالبات الاحتيالية.

شارة جوائز Banking Tech الأمريكية لعام 2025.
حصلت IBM Synthetic Data Sets على جائزة Banking Tech عن فئة أفضل حل مدعوم بالذكاء الاصطناعي.
اتخِذ الخطوة التالية

اكتشِف كيف يمكنك تسريع انطلاق مشاريع الذكاء الاصطناعي على IBM Z وLinuxONE باستخدام Synthetic Data Sets.

اقرأ منشور IBM Redpaper شاهِد إعادة عرض ندوة الإنترنت عن المنتج.
مزيد من الطرق للاستكشاف التوثيق الدعم خدمات دورة الحياة والدعم المجتمع