تاريخ النشر: 6 سبتمبر 2024
المساهم: Matthew Kosinski
إدارة البيانات باستخدام الذكاء الاصطناعي هي ممارسة استخدام الذكاء الاصطناعي والتعلم الآلي في دورة حياة إدارة البيانات. ومن الأمثلة على ذلك تطبيق الذكاء الاصطناعي لأتمتة أو تبسيط جمع البيانات، وتنظيف البيانات، وتحليل البيانات، والحفاظ على أمن البيانات، وغير ذلك من عمليات إدارة البيانات.
ويمكن أن يساعد كل من الذكاء الاصطناعي التقليدي والقائم على القواعد ونماذج الذكاء الاصطناعي التوليدي الأكثر تقدمًا على إدارة البيانات.
تمتلك الشركات الحديثة كميات هائلة من البيانات حول كل شيء بدءًا من المعاملات المالية ومخزون المنتجات إلى سجلات الموظفين وتفضيلات العملاء. والمؤسسات التي تَستخدِم هذه البيانات لتوجيه عملية اتخاذ القرارات ودفع المبادرات التجارية يمكن أن تحقق مزايا كبيرة على منافسيها.
ومع ذلك، يكمن التحدي في ضمان أن تكون هذه المجموعات الكبيرة من البيانات دقيقة وموثوقًا بها ويمكن الوصول إليها بشكل كافٍ ليتمكَّن الأشخاص من استخدامها في الممارسة العملية.
تشير تقارير Data Differentiator الصادرة عن IBM إلى أن 82% من المؤسسات تعاني من صوامع البيانات التي تعيق سير العمل الرئيسي. حيث إنه لا يتم تحليل ما يصل إلى 68% من بيانات المؤسسات أبدًا، ما يعني أن الشركة لا تدرك الفوائد الكاملة لتلك البيانات.
يمكن أن تساعد أدوات الذكاء الاصطناعي والتعلم الآلي المؤسسات على استخدام بياناتها من خلال تحسين المهام مثل دمج مصادر البيانات وتنظيف البيانات واستردادها. نتيجةً لذلك، يمكن للشركات اتخاذ المزيد من القرارات القائمة على البيانات.
كما أن إدارة البيانات باستخدام الذكاء الاصطناعي تساعد المؤسسات على إنشاء أنظمة تدفق البيانات عالية الجودة التي تحتاجها لتدريب نماذج الذكاء الاصطناعي وخوارزميات التعلم الآلي الخاصة بها ونشرها.
تعرَّف على فرص تحسين خدمات البيانات باستخدام الذكاء الاصطناعي التوليدي لدعم المتخصصين في البيانات.
تتضمن العديد من أنواع أدوات إدارة البيانات -مثل حلول تخزين البيانات، وأدوات تكامل البيانات، وأدوات إدارة البيانات الرئيسية، وحلول الحوكمة وغيرها- الآن قدرات التعلم الآلي والذكاء الاصطناعي. ويمكن لهذه الأدوات استخدام خوارزميات الذكاء الاصطناعي التقليدي وأنظمة الذكاء الاصطناعي التوليدي.
تؤدي أنظمة الذكاء الاصطناعي التقليدي مهام محددة قائمة على القواعد، على سبيل المثال، نظام إدارة قواعد البيانات الذي يصنِّف البيانات تلقائيًا بناءً على معايير محددة مسبقًا.
تستجيب أنظمة الذكاء الاصطناعي التوليدي، مثل Microsoft Copilot وLlama من Meta وIBM Granite، للغة الطبيعية وتنشئ محتوى أصليًا. على سبيل المثال، يمكن لنظام إدارة قواعد البيانات مع نموذج لغة كبيرة متكامل إنشاء ملخصات للبيانات وقبول الاستعلامات بلغة إنجليزية بسيطة بدلًا من SQL.
يمكن أن يتناسب الذكاء الاصطناعي والتعلم الآلي مع أي جزء تقريبًا من عملية إدارة البيانات، ولكن من حالات الاستخدام الأكثر شيوعًا ما يلي:
تعمل المؤسسات اليوم مع الكثير من البيانات، والتي تأتي إلى الأعمال من مصادر مختلفة متعددة، بتنسيقات متعددة. يتعامل العديد من المستخدمين مع هذه البيانات وينتهي بها الأمر مبعثرة في السحابة العامة والخاصة وأنظمة التخزين المحلية وحتى نقاط النهاية الشخصية للموظفين.
قد يكون من الصعب تتبُّع وإدارة كل هذه البيانات مركزيًا، ويتسبَّب هذا في حدوث مشكلتين.
أولًا، لا يمكن للمؤسسة استخدام مجموعة البيانات إذا كانت لا تعرف أنها موجودة.
ثانيًا، تشكِّل "البيانات الظلية" غير المكتشفة وغير المُدارة مخاطر أمنية. ووفقًا لتقرير تكلفة خرق البيانات الصادر عن IBM، يشتمل ثلث عمليات اختراق أمن البيانات على بيانات ظلية. وبلغت تكلفة هذه الاختراقات 5.27 ملايين دولار أمريكي في المتوسط، بزيادة 16% عن متوسط التكلفة الإجمالية لعمليات الاختراق.
يمكن للذكاء الاصطناعي والتعلم الآلي أتمتة العديد من جوانب اكتشاف البيانات، ما يمنح المؤسسات مزيدًا من الرؤية والتحكم في جميع أصول البيانات الخاصة بها.
يمكن لأدوات اكتشاف البيانات المدعومة بالذكاء الاصطناعي مسح أجهزة الشبكة ومستودعات تخزين البيانات تلقائيًا، وفهرسة البيانات الجديدة في الوقت الفعلي تقريبًا.
ويمكن لأدوات تصنيف البيانات التلقائية وضع علامة على البيانات الجديدة استنادًا إلى قواعد محددة مسبقًا أو نماذج التعلم الآلي. على سبيل المثال، قد تصنِّف الأداة أي رقم مكون من تسعة أرقام بتنسيق XXX-XX-XXXX كرقم ضمان اجتماعي أمريكي.
يمكن للنماذج اللغوية الكبيرة وأدوات معالجة اللغة الطبيعية الأخرى استخراج البيانات المنظَّمة من مصادر البيانات غير المنظَّمة، مثل سحب تفاصيل التواصل مع المرشحين للوظائف وخبرات العمل السابقة من السير الذاتية المكتوبة بتنسيقات مختلفة.
يمكن أن تتسبَّب البيانات السيئة في حدوث مشكلات بنسبة أكبر مقارنةً بعدم وجود بيانات على الإطلاق. وذلك لأنه إذا كانت بيانات المؤسسة غير كاملة أو غير دقيقة، فستكون مبادرات الأعمال والنماذج الذكاء الاصطناعي المبنية على تلك البيانات دون المستوى أيضًا.
يمكن أن تساعد أدوات الذكاء الاصطناعي والتعلم الآلي على تحديد الأخطاء في البيانات التنظيمية وتصحيحها، ما يعني أن المستخدمين لا يحتاجون إلى القيام بالعمل الذي يستغرق وقتًا طويلًا لتنظيف البيانات يدويًا. ويمكن للذكاء الاصطناعي أيضًا العمل بسرعة أكبر والتعرُّف على المزيد من الأخطاء مقارنةً بالمستخدمين البشريين.
يمكن لأدوات إعداد البيانات المدعومة بالذكاء الاصطناعي إجراء فحوصات التحقق من الصحة ووضع علامة على الأخطاء أو تصحيحها مثل التنسيق غير الصحيح والقيم غير المنتظمة. يمكن لبعض أدوات إعداد البيانات المدعومة بالذكاء الاصطناعي أيضًا تحويل البيانات إلى التنسيق المناسب، مثل تحويل ملاحظات الاجتماع غير المنظَّمة إلى جداول منظَّمة.
تستطيع مولِّدات البيانات الاصطناعية تقديم قيم مفقودة وسد الفجوات الأخرى في مجموعات البيانات. ويمكن لهذه المولِّدات استخدام نماذج التعلم الآلي لتحديد الأنماط في البيانات الموجودة وإنشاء نقاط بيانات اصطناعية عالية الدقة.
يمكن لبعض أدوات إدارة البيانات الرئيسية (MDM) استخدام الذكاء الاصطناعي والتعلم الآلي لاكتشاف الأخطاء والتكرارات في السجلات المهمة وتصحيحها. على سبيل المثال، دمج سجلَّين لعملاء يحملان الاسم والعنوان وتفاصيل التواصل نفسها.
يمكن لأدوات إمكانية ملاحظة البيانات المدعومة بالذكاء الاصطناعي إنشاء سجلات دورة حياة البيانات تلقائيًا لتتمكَّن المؤسسات من تتبُّع من يستخدم البيانات وكيفية تغيُّرها بمرور الوقت.
تمنع صوامع البيانات العديد من المؤسسات من تحقيق القيمة الكاملة لبياناتها. يمكن للذكاء الاصطناعي والتعلم الآلي تبسيط جهود تكامل البيانات، واستبدال المستودعات المنعزلة بنسيج بيانات موحَّد. ويمكن للمستخدمين عبر المؤسسة الوصول إلى أصول البيانات التي يحتاجون إليها عند حاجتهم إليها.
يمكن لأدوات تكامل البيانات المدعومة بالذكاء الاصطناعي اكتشاف العلاقات بين مجموعات البيانات المختلفة تلقائيًا، ما يسمح للمؤسسة بربطها أو دمجها.
يمكن أن تساعد أدوات إدارة البيانات الوصفية المدعومة بالذكاء الاصطناعي على أتمتة إنشاء كتالوجات البيانات من خلال إنشاء أوصاف لأصول البيانات بناءً على العلامات والتصنيف.
يمكن لقواعد البيانات وكتالوجات البيانات التي تحتوي على واجهات مدعومة بالنماذج اللغوية الكبيرة قبول الأوامر باللغة الطبيعية ومعالجتها، ما يُتيح للمستخدمين العثور على أصول البيانات ومنتجاتها دون الحاجة لكتابة رمز مخصص أو استعلامات SQL. ويمكن لبعض الواجهات المدعومة بالنماذج اللغوية الكبيرة أيضًا مساعدة المستخدمين على تحسين الاستعلامات أو إثراء مجموعات البيانات أو اقتراح نقاط البيانات ذات صلة.
يمكن لمحركات الاستعلام المدعومة بالذكاء الاصطناعي استخدام خوارزميات التعلم الآلي لتحسين أداء قاعدة البيانات من خلال تحليل أنماط أعباء العمل وتحسين تنفيذ الاستعلام.
هناك دراسة جدوى يجب إعدادها لتحديد أولويات أمن البيانات. وفقًا لتقرير تكلفة خرق البيانات، يكلِّف اختراق البيانات المؤسسة في المتوسط 4.88 ملايين دولار أمريكي، وتشمل هذه التكلفة خسائر في الأعمال، وتعطل الأنظمة، والأضرار التي تلحق بالسمعة، وتكاليف التعامل مع الحادث.
يمكن للذكاء الاصطناعي وتعلم الآلة المساعدة على فرض سياسات الأمان، واكتشاف الاختراقات وحظر الأنشطة غير المصرَّح بها.
يمكن لأدوات منع فقدان البيانات المستندة إلى الذكاء الاصطناعي اكتشاف معلومات التعريف الشخصية (PII) والبيانات الحساسة الأخرى تلقائيًا، وتطبيق ضوابط الأمان والإبلاغ عن الاستخدام غير المصرَّح به لتلك البيانات أو حظره.
تَستخدِم أدوات الكشف عن التهديدات القائمة على الحالات غير الطبيعية مثل تحليلات سلوك المستخدم والكيانات (UEBA) واكتشاف نقاط النهاية والاستجابة لها (EDR) خوارزميات الذكاء الاصطناعي والتعلم الآلي لمراقبة نشاط الشبكة. وهي تكتشف التغييرات المشبوهة المختلفة عن الأنماط المعتادة، مثل انتقال كمية كبيرة من البيانات فجأة إلى موقع جديد.
يمكن للنماذج اللغوية الكبيرة مساعدة المؤسسات على إنشاء سياسات إدارة البيانات وتنفيذها. على سبيل المثال، في نظام التحكم في الوصول المستند إلى الأدوار (RBAC)، يمكن أن يساعد النموذج اللغوي الكبير فريق الأمن على تحديد الأنواع المختلفة من الأدوار والأذونات ذات الصلة بها. وقد يساعد النموذج اللغوي الكبير أيضًا على تحويل أوصاف الأدوار هذه إلى قواعد لنظام إدارة الهوية والوصول.
يمكن لأدوات الكشف عن الغش المدعومة بالذكاء الاصطناعي استخدام الذكاء الاصطناعي والتعلم الآلي لتحليل الأنماط واكتشاف المعاملات غير الطبيعية.
يمكن أن يساعد الذكاء الاصطناعي على تحويل إدارة البيانات من خلال أتمتة المهام الشاقة مثل اكتشاف البيانات وتنظيفها وفهرستها، مع تبسيط علمية استرجاع البيانات وتحليلها. وتستطيع المؤسسات بناء عمليات إدارة بيانات أكثر كفاءة وأقل عرضة للأخطاء وأكثر ملاءمة لعلم البيانات ومبادرات الذكاء الاصطناعي وخصوصية البيانات.
في تقرير إدارة الذكاء الاصطناعي والمعلومات الصادر عن AvePoint، أفادت 64% من المؤسسات التي شملها الاستطلاع أنها تدير بيتابايت واحدًا على الأقل من البيانات.1 للتوضيح، يعادل ذلك نحو 9 كوادريليون بت من المعلومات. ويأتي الكثير منها بتنسيقات غير منظَّمة، مثل الملفات النصية والصور والفيديو.
يمكن أن تكون كل هذه البيانات مفيدة لعلماء البيانات، لكنها معقدة وضخمة لدرجة يستحيل إدارتها يدويًا. يمكن لأدوات الذكاء الاصطناعي والتعلم الآلي جعل هذه البيانات قابلة للاستخدام من خلال أتمتة المهام الأساسية مثل الاكتشاف والتكامل والتنظيف.
عندما تكون البيانات نظيفة ويمكن الوصول إليها، يمكن للمؤسسات الاستفادة منها في مشاريع تحليلات البيانات المتقدمة، مثل مبادرة التحليلات التنبؤية التي تستخدم البيانات التاريخية للتنبؤ بالتوجهات المستقبلية في إنفاق المستهلكين.
يمكن لتقنيات الذكاء الاصطناعي أيضًا أن تجعل البيانات في متناول المستخدمين الذين لا يمتلكون خلفية عن علم البيانات. تُتيح كتالوجات البيانات سهلة الاستخدام المدعومة بواجهات قواعد بيانات تعتمد على نموذج لغوي كبير وتصورات آلية لعدد أكبر من الموظفين في المؤسسة استخدام البيانات لاتخاذ قرارات مدروسة.
يعتقد 59% من الرؤساء التنفيذيين الذين شملهم الاستطلاع الذي أجراه معهد IBM لقيمة الأعمال أن الميزة التنافسية للمؤسسة في المستقبل تعتمد على امتلاك الذكاء الاصطناعي التوليدي الأكثر تقدمًا. وللتمكُّن من بناء نماذج الذكاء الاصطناعي هذه ونشرها، تحتاج المؤسسات إلى تدفقات ثابتة من البيانات الجيدة والنظيفة.
تُسهم أدوات الذكاء الاصطناعي في تبسيط إدارة البيانات، ما يساعد على إنشاء قنوات تدفق بيانات موثوق بها وعالية الجودة تحتاجها المؤسسات لتدريب نماذج الذكاء الاصطناعي والتعلم الآلي الخاصة بها. ولأنه يمكن تدريب هذه النماذج على بيانات الشركة، يمكن تخصيصها لأداء مهام معينة وحل مشكلات تتعلق بالشركة وعملائها.
تساعد أدوات الأمان والحوكمة المدعومة بالذكاء الاصطناعي على صد الهجمات الإلكترونية واختراقات أمن البيانات، وقد يكون هذا مكلفًا. كما أنها تسمح للمؤسسات باستخدام البيانات المتاحة لديها مع الامتثال للوائح خصوصية البيانات والحماية مثل اللائحة العامة لحماية البيانات ومعيار أمن بيانات صناعة بطاقات الدفع (PCI-DSS).
وفقًا لمعهد قيمة الأعمال، يقول 57% من الرؤساء التنفيذيين إن أمن البيانات يشكِّل عائقًا أمام اعتماد الذكاء الاصطناعي التوليدي. و45% يقولون إن خصوصية البيانات هي أيضًا عائق. ويمكن أن تكون هذه العوائق صعبة بشكل خاص في الصناعات عالية التنظيم، مثل الرعاية الصحية والتمويل.
يمكن أن تساعد إدارة البيانات المدعومة بالذكاء الاصطناعي من خلال تطبيق الحماية والسياسات المناسبة لاستخدام البيانات بشكل تلقائي. بهذه الطريقة، يمكن للمستخدمين المصرَّح لهم فقط الوصول إلى البيانات، ولا يمكنهم استخدامها إلا بالطرق التي تسمح بها لوائح الصناعة وسياسة الشركة.
يمكن أن تساعد مولِّدات البيانات الاصطناعية أيضًا من خلال إنشاء مجموعات بيانات تعكس التوجهات العامة بدقة، مع حذف البيانات الشخصية الحساسة التي قد لا يُسمح للمؤسسة باستخدامها بطرق معينة.
صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.
تخزين عالي الأداء للملفات والكائنات لأعباء عمل الذكاء الاصطناعي والتعلّم الآلي والتحليلات وNVIDIA.
تعرَّف على الاستراتيجية والتقنيات والثقافة التي تُعتبر أساسية لقيادة مؤسسة قائمة على البيانات ومدعومة بالذكاء الاصطناعي.
إدارة البيانات هي ممارسة جمع البيانات ومعالجتها واستخدامها بأمان وكفاءة لتحقيق نتائج أعمال أفضل.
تعرَّف على كيفية تحقيق الاستثمار الأمثل في أساس البيانات المفتوح والموثوق به المناسب لاحتياجاتك.
1 تقرير إدارة الذكاء الاصطناعي والمعلومات لعام 2024، شركة AvePoint، لعام 2024. (الرابط موجود خارج موقع ibm.com).