مستودع بحيرة البيانات هو منصة بيانات تجمع بين أفضل مزايا مستودعات البيانات وبحيرات البيانات في حل موحد لإدارة البيانات.
تستند بنية مستودع بحيرة البيانات وبنية الحوكمة الخاصة بشركة IBM لبيئات السحابة الهجينة إلى منصة watsonx.data. يمكِّن مستودع بحيرة البيانات الهجين والمفتوح الشركات من توسيع النطاق التحليلات والذكاء الاصطناعي، مما يوفر مخزن بيانات قويًا مبنيًا على بنية مستودع بحيرة بيانات مفتوحة. تجمع هذه البنية بين سمات أداء وسهولة استخدام مستودع البيانات ومرونة وقابلية توسع بحيرة البيانات، مما يوفر حلاً متوازنًا لإدارة البيانات ومهام التحليل.
تُقدَّم منصة watsonx.data في صورة عرض برمجيات كخدمة (SaaS) وحل محلي. بالنسبة للعملاء في المناطق الجغرافية التي لا يتوفر فيها عرض SaaS، أو الذين يحتاجون إلى بقاء منصة مستودع بحيرة البيانات في أماكن العمل بسبب قيود تنظيمية أو غيرها، توفر IBM خيارات نشر مرنة لتمكين القدرات في أي مكان:
مستودع بحيرة البيانات - watsonx.data هي بنية الجيل التالي من مخازن البيانات، حيث تحقق التوازن بين قدرات مستودعات البيانات وبحيرات البيانات. يمثل هذا النهج حجر الأساس لاستراتيجية IBM الخاصة بمستودع بحيرة البيانات، مما يسهل توسيع نطاق أحمال تشغيل الذكاء الاصطناعي والتعلم الآلي (ML) مع ضمان كفاءة إدارة البيانات.
منصة GenAI - يمكن توصيل مستودع بحيرة البيانات اختياريًا بمنصة GenAI لتعزيز الاستعلامات باستخدام النماذج اللغوية الكبيرة (LLMs). يمكن للمستخدمين إدخال موجِّه، ليتم إرساله إلى نموذج LLM مضبوط بدقة لإنشاء استعلامات استرجاع يمكن تنفيذها بواسطة المحركات المدعومة في مستودع بحيرة البيانات.
نمط مستودع بحيرة البيانات 1: محركات استعلام متعددة مناسبة للغرض
استخدام الحوسبة الملائمة لتحسين التكلفة عبر اختيار المحرك المناسب لكل نوع من أحمال التشغيل، مع مشاركة البيانات والبيانات الوصفية بين جميع المحركات في نفس الوقت، والاستفادة من مخزن التعريف المشترك (مثل كتالوج البيانات) والبيئة الموحدة.
نمط مستودع بحيرة البيانات 2: منصة موحدة لجميع بياناتك
يتيح مستودع بحيرة البيانات نهجًا حديثًا لبنى البيانات، حيث قامت المؤسسات على مدى السنوات ببناء العديد من صوامع مخازن البيانات لتلبية احتياجات مختلفة، بدءًا من مستودعات بيانات المؤسسات المنظمة وعالية الأداء (EDW) وصولًا إلى بحيرات البيانات ذات الحجم الكبير وغير المنظمة أو شبه المنظمة، والتي تتحول في معظم الأحيان إلى مستنقعات بيانات بسبب الازدواجية وضعف جودة البيانات وغياب الحوكمة. مستودع بحيرة البيانات مع watsonx.data سيوفر طبقة واحدة للوصول إلى مجموعة متنوعة من مخازن البيانات عبر محركات استعلام متعددة وتنسيقات بيانات مفتوحة وحوكمة، دون الحاجة إلى نقل البيانات.
نمط مستودع بحيرة البيانات 3: تحسين أحمال التشغيل في مستودع البيانات لتقليل التكلفة
يتيح تقليل تكلفة التخزين مع الحفاظ على القدرات الزمنية من خلال الاستفادة من من التخزين منخفض التكلفة والحوسبة في مستودع بحيرة البيانات، مما يسمح لمحركات الاستعلام المتعددة باستخدام نفس مجموعة البيانات. تتيح محركات الاستعلام مثل Spark تنفيذ استعلامات مادية/مُفرّغة للبيانات في حالتها الحالية (مثل عدم تضمين السجل الكامل لتغييرات البيانات)، مما يقلل من حجم الاستعلام وتكلفة حوسبة الاستعلام. بالإضافة إلى ذلك، تتيح قدرات المعالجة المسبقة والتحويلات الانتقائية في مستودع بحيرة البيانات التوزيع الأمثل لأحمال تشغيل مستودع البيانات، مما يؤدي إلى تقليل التكلفة.
نمط مستودع بحيرة البيانات 4: نشر السحابة المتعددة الهجينة
يتيح الاتصال بالبيانات والوصول إليها عن بعد عبر السحابة الهجينة مع القدرة على تخزين المصادر البعيدة مؤقتا
نمط مستودع بحيرة البيانات 5: دمج بيانات الكمبيوتر المركزي مع النظام البنائي التحليلي
يتيح مزامنة ودمج بيانات Db2 for z/OS في مستودع بحيرة البيانات لتحليلات البيانات، وإجراء تحليلات فورية على الكمبيوتر المركزي باستخدام بيانات VSAM وDb2. ستعمل المحاكاة الافتراضية للبيانات على الاستعلام عن البيانات مباشرةً من الكمبيوتر المركزي مع مراعاة اعتبارات الحمل الإضافي، بينما ستقوم CDC بالتقاط البيانات بتنسيق Iceberg وفقًا للتكرار الذي تحدده الإدارة (لا يؤثر على أداء الكمبيوتر المركزي ولكنه لا يوفر بيانات في الوقت الفعلي).
يعتمد اختيار محرك الاستعلام على نوع البيانات التي يتم الاستعلام عنها.
بنية الذكاء الاصطناعي التوليدي من IBM هي بنية الذكاء الاصطناعي التوليدي الكاملة من IBM داخل أداة IBM IT Architect Assistant (IIAA)، وهي أداة لتطوير وإدارة البنية. باستخدام أداة IIAA، يمكن للمهندسين تطوير البنية وتخصيصها لبناء حلول الذكاء الاصطناعي التوليدي الخاصة بهم.
يحتوي هذا المستودع على مسار Tekton لنشر IBM watsonx.data على ممجوعة Red Hat Openshift
يحتوي هذا المستودع على أصول لتشغيل مختبر وورشة عمل لتمكين استخدام watsonx.data