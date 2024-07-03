يجب على المؤسسات التركيز على بناء قاعدة بيانات مفتوحة وموثوقة للوصول إلى البيانات الموثوقة للذكاء الاصطناعي. تعمل Open على إنشاء أساس لتخزين البيانات وإدارتها ودمجها والوصول إليها استنادًا إلى القدرات المفتوحة والقابلة للتشغيل البيني، والتي تشمل عمليات نشر السحابة الهجينة وتخزين البيانات وتنسيقات البيانات ومحركات الاستعلام والحوكمة والبيانات الوصفية. يتيح لك ذلك سهولة التكامل مع استثماراتك التقنية الحالية مع التخلص من صوامع البيانات وتسريع التحول القائم على البيانات.

إن إنشاء أساس موثوق للبيانات يؤدي إلى تمكين إدارة البيانات والبيانات الوصفية عالية الجودة والموثوقة والآمنة والمحكومة بحيث يمكن تقديمها للتحليلات وتطبيقات الذكاء الاصطناعي مع تلبية احتياجات خصوصية البيانات والامتثال التنظيمي. تساعد العناصر الأربعة التالية على بناء قاعدة بيانات مفتوحة وموثوقة.

1. تحديث البنية التحتية لبياناتك إلى السحابة الهجينة لأغراض التطبيقات والتحليلات والذكاء الاصطناعي التوليدي

أصبح اعتماد الإستراتيجيات متعددة السحابة والهجينة إلزاميًا، ما يتطلب قواعد بيانات تدعم النشر المرن عبر السحابة الهجينة. تتوقع شركة Gartner أن 95% (يؤدي الرابط إلى صفحة خارج موقع ibm.com) من المبادرات الرقمية الجديدة ستتطور على منصات السحابة الأصيلة، وهي ضرورية لتقنيات الذكاء الاصطناعي التي تتطلب تخزين البيانات وقابلية التوسع.

2. تمكين التطبيقات القائمة على البيانات والتحليلات والذكاء الاصطناعي باستخدام قواعد البيانات المناسبة وإستراتيجية مستودع بحيرة البيانات المفتوحة

لتخزين البيانات وتحليلها، يجب عليك استخدام قاعدة البيانات المناسبة لأحمال التشغيل وأنواع البيانات والأداء. وهذا يضمن لك وجود أساس بيانات يلبي متطلبات البيانات المتزايدة أينما وُجدت. يجب أن تتضمن إستراتيجية البيانات قواعد بيانات مصممة بمكونات مفتوحة ومتكاملة، ما يسمح بالتوحيد السلس والوصول إلى البيانات لإجراء تحليلات متقدمة وتطبيقات الذكاء الاصطناعي داخل منصة البيانات. يتيح ذلك لمؤسستك استخلاص رؤى قيمة وتعزيز صناعة القرار المستنيرة.

على سبيل المثال، تحتاج المؤسسات إلى قواعد بيانات معاملات عالية الأداء وآمنة ومرنة لإدارة بياناتها التشغيلية الأكثر حساسية. وبفضل توفر السحابة الهجينة، يمكن للمؤسسات استخدام قواعد بياناتها لتحديث التطبيقات القديمة وبناء تطبيقات سحابية أصلية جديدة وتشغيل مساعدي الذكاء الاصطناعي والتطبيقات المؤسسية.

مع تطور أنواع البيانات والتطبيقات، قد تحتاج إلى قواعد بيانات NoSQL متخصصة للتعامل مع هياكل البيانات المتنوعة ومتطلبات التطبيقات المحددة. وتشمل هذه السلاسل الزمنية والوثائق والرسائل وقيمة المفاتيح والبحث الكامل بالنص وقواعد البيانات في الذاكرة، والتي تلبي احتياجات متنوعة مثل إنترنت الأشياء (IOT) وإدارة المحتوى والتطبيقات الجغرافية المكانية.

لتشغيل أحمال تشغيل الذكاء الاصطناعي والتحليلات عبر قواعد بيانات المعاملات وقواعد البيانات المصممة لغرض معين لديك، يجب عليك التأكد من أنها تندمج بسلاسة مع بنية مستودع بحيرة البيانات المفتوحة دون ازدواجية أو عمليات استخراج وتحويل وتحميل (ETL) إضافية. باستخدام مستودع بحيرة البيانات، يمكنك الوصول إلى نسخة واحدة من البيانات أينما كانت بياناتك.

يتعامل مستودع بحيرة البيانات مع عدة صيغ مفتوحة (مثل Apache Iceberg عبر cloud object storage) ويجمع البيانات من مصادر مختلفة ومستودعات موجودة عبر السحابة الهجينة. كما يتيح مستودع بحيرة البيانات الأكثر فعالية من حيث التكلفة إمكانية فصل التخزين عن الحوسبة من خلال عدة محركات استعلام مفتوحة المصدر ومن خلال التكامل مع محركات التحليلات الأخرى لتحسين أحمال التشغيل للحصول على أداء متفوق من حيث السعر.

يشمل ذلك التكامل مع محركات مستودع البيانات الخاصة بك، والتي يجب أن توازن الآن بين معالجة البيانات في الوقت الفعلي وصناعة القرارات، مع تخزين الكائنات الفعال من حيث التكلفة والتقنيات مفتوحة المصدر وطبقة بيانات وصفية مشتركة لمشاركة البيانات بسلاسة مع مستودع بحيرة البيانات الخاص بك. مع بنية مستودع بحيرة البيانات المفتوحة، يمكنك الآن تحسين أحمال تشغيل مستودعات البيانات الخاصة بك لتناسب الأداء السعري وتحديث بحيرات البيانات التقليدية بأداء وحوكمة أفضل للذكاء الاصطناعي.

قد تمتلك المؤسسات أيضًا بيتابايت -إن لم يكن إكسابايت- من بيانات الملكية الخاصة عالية القيمة المخزنة في الكمبيوتر المركزي لديها، والتي تحتاج إلى إطلاق العنان لها للحصول على رؤى جديدة ونماذج تعلم آلي/ذكاء اصطناعي. ومن خلال مستودع بحيرة البيانات المفتوح الذي يدعم مزامنة البيانات بين الكمبيوتر المركزي والتنسيقات المفتوحة مثل Iceberg، يمكن للمؤسسات تحديد الاحتيال بشكل أفضل وفهم سلوك المستفيدين وبناء نماذج ذكاء اصطناعي تنبئية لفهم نتائج الأعمال المتقدمة وتوقعها وتوجيهها.

قبل بناء ذكاء اصطناعي توليدي موثوق به لعملك، تحتاج أولاً إلى بنية البيانات الصحيحة لإعداد هذه البيانات المتباينة وتحويلها إلى بيانات ذات جودة. قد يشمل أساس البيانات الصحيح للذكاء الاصطناعي التوليدي مخازن معرفة متنوعة تمتد لتشمل قواعد بيانات NoSQL للمحادثات وقواعد بيانات المعاملات للبيانات السياقية وبنية مستودع بحيرة البيانات للوصول إلى بياناتك وإعدادها لأغراض الذكاء الاصطناعي والتحليلات وقدرات تضمين المتجهات لتخزين التضمينات واستردادها لأغراض التوليد المعزز بالاسترجاع (RAG). تتيح طبقة البيانات الوصفية المشتركة والحوكمة لفهرسة بياناتك ودورة حياة البيانات مخرجات موثوقة للذكاء الاصطناعي.

3. إرساء أساس من الثقة: جودة البيانات والحوكمة للذكاء الاصطناعي في المؤسسات

مع تزايد اعتماد المؤسسات على الذكاء الاصطناعي لتعزيز صناعة القرارات الحرجة، تكون أهمية جودة البيانات وحوكمتها شديدة الأهمية. ووفقًا لـ Gartner، من المتوقع التخلي عن 30% من مشاريع الذكاء الاصطناعي التوليدي بحلول عام 2025 بسبب سوء جودة البيانات أو عدم كفاية ضوابط المخاطر أو التكاليف المتصاعدة أو قيمة الأعمال غير الواضحة. وتعد عواقب استخدام البيانات ذات الجودة الرديئة بعيدة المدى، بما في ذلك فقدان ثقة العملاء وعدم الامتثال التنظيمي والأضرار المالية والأضرار المتعلقة بالسمعة.

إن إدارة جودة البيانات الفعالة أمر بالغ الأهمية للحد من هذه المخاطر. وتعد إستراتيجية هندسة البيانات المصممة بشكل جيد ضرورية لتحقيق هذا الهدف. يوفر نسيج البيانات إطار عمل قويًا لقادة البيانات لتحليل البيانات وتصميم قواعد جودة البيانات وتطبيقها واكتشاف انتهاكات جودة البيانات وتنظيف البيانات وتعزيزها. يضمن هذا النهج أن تحقق مبادرات جودة البيانات الدقة وسهولة الوصول والتوقيت المناسب والملاءمة.

وعلاوة على ذلك، يُمكّن نسيج البيانات من المراقبة المستمرة لمستويات جودة البيانات من خلال قدرات مراقبة البيانات، ما يسمح للمؤسسات بتحديد مشكلات البيانات قبل أن تتفاقم إلى مشكلات أكبر. كما تُمكّن هذه الشفافية في تدفقات البيانات قادة البيانات والذكاء الاصطناعي من تحديد المشكلات المحتملة، ما يضمن استخدام البيانات الصحيحة لصناعة القرارات.

ومن خلال إعطاء الأولوية لجودة البيانات وحوكمتها، يمكن للمؤسسات بناء الثقة في أنظمة الذكاء الاصطناعي الخاصة بها وتقليل المخاطر وتعظيم قيمة بياناتها. من الضروري أن ندرك أن جودة البيانات ليست مجرد مسألة تقنية، بل هي ضرورة حاسمة تتطلب اهتمامًا واستثمارًا. ومن خلال تبني إستراتيجية بنية البيانات الصحيحة، يمكن للمؤسسات إطلاق العنان للإمكانات الكاملة لمبادرات الذكاء الاصطناعي الخاصة بها ودفع نجاح الأعمال.

4. إدارة البيانات وتسليمها للذكاء الاصطناعي

تعد البيانات أمرًا أساسيًا للذكاء الاصطناعي، بدءًا من بناء نماذج الذكاء الاصطناعي باستخدام مجموعات البيانات الصحيحة ومرورًا بضبط نماذج الذكاء الاصطناعي باستخدام بيانات المؤسسة الخاصة بالصناعات ووصولاً إلى استخدام التضمينات المتجهة لبناء تطبيقات الذكاء الاصطناعي للتوليد المعزز بالاسترجاع (RAG) (بما في ذلك روبوتات المحادثة وأنظمة التوصية المخصصة وتطبيقات البحث عن تشابه الصور).

يعد التحكم في البيانات والثقة بها أمرًا ضروريًا لضمان دقة الذكاء الاصطناعي وملاءمته وإحكامه. لإطلاق العنان للقيمة الكاملة للبيانات لأغراض الذكاء الاصطناعي، يجب أن تكون المؤسسات قادرة على التنقل في بيئات تكنولوجيا المعلومات المعقدة لديها لكسر صوامع البيانات وتوحيد بياناتها وإعداد بيانات موثوقة ومحكومة وتقديمها لنماذج وتطبيقات الذكاء الاصطناعي الخاصة بها.

ومع بنية مستودع بحيرة البيانات المفتوحة والمدعومة بتنسيقات مفتوحة للاتصال والوصول إلى البيانات الحيوية من مجموعة البيانات الحالية الخاصة بك (بما في ذلك مستودعات البيانات وبحيرات البيانات وبيئات الكمبيوتر المركزي)، يمكنك استخدام نسخة واحدة من بيانات مؤسستك لبناء نماذج وتطبيقات الذكاء الاصطناعي وضبطها.

وباستخدام طبقة دلالية، يمكنك إنشاء إثراءات للبيانات تمكّن العملاء من العثور على البيانات المهيكلة بشكل فعال والمبهمة سابقًا وفهمها عبر مجموعة البيانات الخاصة بك باللغة الطبيعية من خلال البحث الدلالي لتسريع اكتشاف البيانات وإطلاق العنان للرؤى بشكل أسرع، دون الحاجة إلى SQL.

ومع استخدام قاعدة بيانات متجهة مضمنة مباشرةً داخل مستودع بحيرة البيانات الخاص بك، يمكنك تخزين بياناتك بسلاسة والاستعلام عنها كتضمينات متجهة لحالات استخدام التوليد المعزز بالاسترجاع، ما يحسن من ملاءمة مخرجات الذكاء الاصطناعي الخاصة بك ودقتها.