يجمع ذكاء البيانات (DI) بين مبادئ إدارة البيانات الأساسية وإدارة البيانات الوصفية مع الأدوات المتقدمة—مثل الذكاء الاصطناعي والتعلم الآلي—لمساعدة المؤسسات على فهم كيفية إنتاج بيانات المؤسسة واستخدامها. يمكن أن تعمل رؤى ذكاء البيانات على إطلاق العنان للقيمة التجارية للبيانات وتعزيز عملية اتخاذ القرارات القائمة على البيانات.
وبعبارة أخرى، يساعد ذكاء البيانات المؤسسة على الإجابة عن الأسئلة الأساسية المتعلقة ببياناتها، بما في ذلك:
ما البيانات التي تمتلكها المؤسسة؟ لماذا توجد هذه البيانات؟
من أين أتت البيانات وأين توجد؟
من يستخدم البيانات؟ كيف يستخدمونها—وكيف ينبغي لهم استخدامها للحصول على أفضل النتائج؟
كيف ترتبط مجموعات البيانات المتميزة مع بعضها البعض؟
يجيب ذكاء البيانات على هذه الأسئلة باستخدام مجموعة مترابطة من العمليات والأدوات لأتمتة وتبسيط إدارة البيانات الوصفية واكتشاف البيانات وإدارة البيانات وضمان الجودة وتحليل البيانات وغيرها من الأنشطة.
وفقًا لتقرير IBM Data Differentiator، فإن ما يصل إلى 68% من بيانات المؤسسة لا يتم تحليلها مطلقًا. وبسبب الكم الهائل من البيانات الموجودة في متناول أيديهم، يمكن للمؤسسة أن تواجه صعوبة في تطبيق ضوابط الجودة وإنفاذ سياسات الحوكمة. لا يمكن للمستخدمين دائمًا العثور على البيانات المناسبة لعملهم—وقد لا يعرفون حتى متى تكون موجودة.
وقد ظهر ذكاء البيانات لمعالجة هذه المشكلة من خلال توحيد الأدوات الحالية—مثل كتالوجات البيانات وحلول دورة حياة البيانات وأسواق البيانات والذكاء الاصطناعي (AI) والتعلم الآلي (ML)—في عملية واحدة وشاملة.
تمنح هذه العملية الموحّدة المؤسسة مزيدًا من الرؤى حول بياناتها وكيفية الحصول على أكبر قيمة منها. بهذه الطريقة، يتيح ذكاء البيانات إجراء التحليلات الخدمة الذاتية ويدعم المبادرات الرئيسية مثل ذكاء الأعمال والذكاء الاصطناعي التوليدي.
إدارة البيانات هي تخصص واسع يشرف على دورة حياة البيانات بأكملها من الإنشاء إلى التخلص منها. في حين أن إدارة البيانات تهتم بالجوانب العملية لجمع البيانات وتخزينها ومعالجتها، فإن ذكاء البيانات يتعلق بفهم تلك البيانات.
يكمّل ذكاء البيانات إدارة البيانات من خلال منح المؤسسة الرؤى التي تحتاجها لاتخاذ خيارات أكثر استنارة بشأن التقاط البيانات وتأمينها وتنظيفها ومشاركتها.
منذ بزوغ فجر Web 2.0 وظهور الحوسبة السحابية، كانت المؤسسات تجمع المزيد من البيانات (بيانات العملاء، والبيانات التشغيلية، وبيانات المعاملات) من المزيد من مصادر البيانات (تطبيقات الويب، وأنظمة الأعمال، وأجهزة إنترنت الأشياء). أدى ظهور الذكاء الاصطناعي التوليدي إلى زيادة قيمة—وكمية—كل هذه البيانات.
قد يكون إدارة هذه البيانات—تتبع كيفية استخدامها وكيفية تغيرها، وتخزينها بشكل آمن، وتسهيل الوصول إليها، والحفاظ عليها نظيفة ومحدثة—أمرًا صعبًا. إذا لم تتم إدارة البيانات بشكل صحيح، فقد يكون من الصعب على مستهلكي البيانات العثور على البيانات التي يحتاجون إليها، ناهيك عن استخلاص رؤى قابلة للتنفيذ منها.
لطالما امتلكت المؤسسات القدرات اللازمة لإدارة أدوات دورة حياة البيانات—أدوات لتخطيط دورة حياة البيانات من البداية إلى النهاية، وأدوات الحوكمة لتحديد سياسات الاستخدام، وأدوات تحديد البيانات وتنظيفها وما إلى ذلك. ومع ذلك، كانت هذه القدرات في كثير من الأحيان مجزأة ومبعثرة عبر منتجات ووظائف متباينة.
ويتمثل الابتكار الأساسي في مجال ذكاء البيانات في الجمع بين هذه الأدوات وتقنيات الذكاء الاصطناعي والتعلم الآلي المتقدمة، إما في منصة واحدة أو في مجموعة بيانات متكاملة بإحكام.
وفقاً لـ IDC، تطورت العديد من منصات ذكاء البيانات الحالية من أدوات كتالوج البيانات. منذ عام 2020، قام البائعون بشكل متزايد بتجميع كتالوجاتهم مع حلول تكميلية، مثل دورة حياة البيانات والسوق، أو قاموا ببناء هذه الوظائف مباشرة في كتالوجاتهم.1
يعد ذكاء البيانات مجالًا متطورًا، حيث يقدم البائعون والممارسون المختلفون وجهات نظرهم الخاصة حول هذا التخصص. ومع ذلك، يتفق معظمهم على أن ذكاء البيانات يتضمن خمس وظائف أساسية:
البيانات الوصفية هي معلومات حول نقطة بيانات أو مجموعة بيانات، مثل مؤلف الملف أو حجمه. تعد إدارة البيانات الوصفية أساسية لمبادرات ذكاء البيانات لأن البيانات الوصفية المدارة جيدًا تساعد المستخدمين على التنقل بسهولة في أنظمة البيانات المعقدة.
تساعد إدارة البيانات الوصفية على تنظيم مجموعات البيانات وتصنيفها وتصفيتها وفرزها بحيث يحصل المستخدمون على صورة كاملة للبيانات المتاحة لهم ويمكنهم استرداد المعلومات التي يحتاجون إليها بسرعة.
إدارة البيانات الوصفية النشطة نُُعد مهمة بشكل خاص لذكاء البيانات. في حين أن إدارة البيانات الوصفية التقليدية يدوية إلى حد كبير، تستخدم إدارة البيانات الوصفية النشطة الذكاء الاصطناعي والتعلم الآلي (ML) لأتمتة معالجة البيانات الوصفية.
مع تحويل البيانات واستخدامها، يمكن أن تتغير بياناتها الوصفية. تتعقب إدارة البيانات الوصفية النشطة هذه التغييرات، وتقوم بتحديث البيانات الوصفية تلقائياً وتستخدم البيانات الوصفية لإنشاء توصيات وتنبيهات. وبهذه الطريقة، يمكنها تبسيط اكتشاف البيانات وتحسين الثقة في البيانات وتمكين حماية البيانات وإدارتها على نطاق واسع.
دورة حياة البيانات هي عملية تتبع تدفق البيانات على مدار الوقت. فهي توفر فهمًا واضحًا لمصدر البيانات وكيفية تغيرها ووجهتها النهائية داخل مسار البيانات.
تساعد دورة حياة البيانات المستخدمين على فهم كيفية تغير البيانات طوال دورة حياتها، مما يجعل بيانات المؤسسة أكثر موثوقية. كما أنها تساعد المؤسسات على اكتشاف الأخطاء وتحديد التبعيات وتوقع كيفية تأثير التغييرات في مجموعة البيانات على عمليات المؤسسة الأوسع وأنظمة تكنولوجيا المعلومات.
تساعد إدارة البيانات على ضمان سلامة البيانات وأمن البيانات من خلال تحديد وتنفيذ السياسات والمعايير والإجراءات الخاصة بجمع البيانات وملكيتها وتخزينها ومعالجتها واستخدامها.
تساعد إدارة البيانات في الحفاظ على البيانات آمنة وعالية الجودة يسهل الوصول إليها ومتوافقة مع القواعد واللوائح ذات الصلة. في جهود ذكاء البيانات، تساعد سياسات الحوكمة المستخدمين على فهم كيفية استخدام البيانات وكيف ينبغي استخدامها.
على سبيل المثال، يمكن لسياسات الحوكمة أن تمنع علماء البيانات من تغذية نماذج الذكاء الاصطناعي ببيانات العملاء الحساسة بما ينتهك قوانين خصوصية البيانات.
تساعد أدوات وممارسات جودة البيانات على ضمان دقة مجموعة البيانات واكتمالها وصلاحيتها وتناسقها وتمييزها وحسن توقيتها وملاءمتها للغرض. تعمل جهود جودة البيانات على بناء ثقة المستخدمين في الاستنتاجات والرؤى التي يستخلصونها من بيانات المؤسسة.
غالبًا ما تتضمن مبادرات ذكاء البيانات إدارة البيانات الرئيسية (MDM) أيضًا. البيانات الرئيسية هي بيانات المؤسسة الأساسية حول كيانات الأعمال الرئيسية مثل العملاء والمنتجات والمواقع. تضمن إدارة البيانات الرئيسية أن تكون هذه البيانات نظيفة ومتسقة من خلال التحقق من الصحة والدمج وإلغاء البيانات المكررة والإثراء.
تكامل البيانات هو عملية دمج البيانات من مصادر متعددة لتسهيل استخدامها لأغراض تحليلية وتشغيلية وصنع القرار. يمكن أن يتضمن التكامل توحيد تنسيقات البيانات، وتحويل البيانات إلى تنسيقات أكثر قابلية للاستخدام، وتجميع البيانات من مصادر مختلفة في بحيرات البيانات المشتركة أو مستودعات البيانات أو مستودعات بحيرات البيانات.
يعمل التكامل على تبسيط الوصول إلى البيانات ومشاركة البيانات، مما يسهل على مستهلكي البيانات استرداد البيانات التي يحتاجون إليها والتعاون مع بعضهم البعض.
يقدم بعض البائعين منصات ذكاء البيانات التي تجمع بين الميزات والوظائف المختلفة في حل واحد. يقدم البعض الآخر محافظ متكاملة من الحلول التكميلية. في كلتا الحالتين، تشمل الأدوات التقنية الأساسية وراء معظم مبادرات ذكاء البيانات ما يلي:
يستخدم كتالوج البيانات البيانات الوصفية لإنشاء مخزون تفصيلي وقابل للبحث لجميع الأصول في المؤسسة. وهذا يجعل من السهل على مستهلكي البيانات اكتشاف البيانات الأكثر ملاءمة لأي غرض تحليلي أو تجاري.
إلى جانب جرد البيانات، تتميز العديد من كتالوجات البيانات الحديثة بقدرات مثل:
آليات إدارة البيانات، بما في ذلك القدرة على تعيين وإنفاذ سياسات استخدام البيانات وخصوصية البيانات، مثل تنقيح المعلومات الحساسة تلقائيًا.
إدارة البيانات الوصفية النشطة، باستخدام الذكاء الاصطناعي والتعلم الآلي لإنشاء بيانات وصفية وتحديث السجلات تلقائياً مع تغير البيانات.
مسارد المصطلحات التجارية، والتي تتيح للمؤسسات إنشاء تعريفات قياسية وإطار العمل القياسي للمصطلحات والمفاهيم والكيانات الأساسية الرئيسية عبر المؤسسة.
ضوابط جودة البيانات، مثل توصيف البيانات وتنظيفها والتحقق من صحتها ومقاييس الجودة.
تقوم أدوات دورة حياة البيانات تلقائيًا بتخطيط تدفقات البيانات والتحول والتبعيات، مما يوفر رؤى حول دورات حياة البيانات. تسمح حلول دورة حياة البيانات للمؤسسات بمعرفة مصدر البيانات، وكيفية انتقالها عبر النظام البنائي لتكنولوجيا المعلومات في المؤسسة، وكيفية تغيرها وكيفية استخدام مستهلكي البيانات لها.
أسواق البيانات، والتي تسمى أيضًا مراكز منتجات البيانات، هي منصات رقمية حيث يمكن للمستخدمين الوصول إلى منتجات البيانات ومشاركتها.
منتجات البيانات هي مجموعات من البيانات أو الأصول المرتبطة بالبيانات معدة مسبقًا ومعالجة مسبقًا وقابلة للاستهلاك بسهولة ويمكن للأشخاص استخدامها لدعم جهود ذكاء الأعمال (BI) والتحليلات وعلم البيانات. تشمل أمثلة منتجات البيانات مجموعات البيانات المنسقة ولوحات المعلومات التحليلية ونماذج التعلم الآلي والتطبيقات المتخصصة وعرض مصور للبيانات.
تعمل الأسواق على تركيز وتبسيط إنشاء منتجات البيانات وتنسيقها وإدارتها ومشاركتها. تساعد الأسواق على ضمان جودة البيانات والامتثال لإطار العمل المتكامل. كما أنها تقوم بتفكيك صوامع البيانات من خلال أتمتة تسليم منتجات البيانات وتمكين المشاركة على نطاق واسع لمنتجات البيانات من مصادر متباينة.
تساعد أدوات الذكاء الاصطناعي والتعلم الآلي (ML) وتطبيقات الذكاء الاصطناعي التوليدي الجديدة ونماذج اللغة الكبيرة (LLMs) في الارتقاء بممارسات ذكاء البيانات إلى ما هو أبعد من إدارة البيانات التقليدية. سواء كحلول قائمة بذاتها أو مدمجة في أدوات أخرى، يمكن للذكاء الاصطناعي والتعلم الآلي (ML) أتمتة إثراء البيانات والبيانات الوصفية وتبسيط التنقيب عن البيانات وتمكين إدارة بيانات الذكاء الاصطناعي المتقدمة.
على سبيل المثال، يمكن للنماذج اللغوية الكبيرة المتكاملة إنشاء وتحديث البيانات الوصفية تلقائيًا في كتالوج البيانات، مما يوفر تفسيرات أكثر سهولة في الاستخدام لجعل البيانات في متناول المزيد من الأطراف المعنية. تتيح واجهات اللغة الطبيعية المدعومة بالنماذج اللغوية الكبيرة للمستخدمين الاستعلام عن مجموعات البيانات واستكشاف رؤى البيانات دون الحاجة إلى استخدام لغة الاستعلام المهيكلة (SQL) أو لغات متخصصة أخرى.
يمكن أن تساعد أدوات الذكاء الاصطناعي أيضًا في فرض سياسات الحوكمة وضوابط الجودة، مثل اكتشاف البيانات الحساسة وتصنيفها أو تحديد مجموعات البيانات المكررة.
بحيرات البيانات، ومستودعات البيانات، ومستودعات بحيرات البيانات، هي حلول لإدارة البيانات وتخزينها بميزات ووظائف مختلفة.
تقوم مستودعات البيانات بتجميع، وتنظيف وإعداد البيانات حتى يمكن استخدامها في جهود ذكاء الأعمال وتحليلات البيانات.
تخزن بحيرات البيانات كميات كبيرة من البيانات غير المنسقة بتكلفة منخفضة.
تجمع مستودعات بحيرات البيانات بين تخزين البيانات المرن للبحيرة وقدرات التحليلات عالية الأداء للمستودع في حل واحد.
تدعم المستودعات والبحيرات ومستودعات البحيرات جهود تكامل البيانات من خلال تمكين المؤسسات من جمع البيانات من مصادر مختلفة معًا في مستودعات مركزية. كما أنها تسهّل الوصول إلى تلك البيانات واستخدامها في تطبيقات التحليلات وذكاء الأعمال والذكاء الاصطناعي والتعلم الآلي (ML) وعلم البيانات.
يساعد ذكاء البيانات المؤسسات على:
فهم بياناتهم من خلال كتالوجات البيانات الشاملة وأدوات دورة حياة البيانات وإدارة البيانات الوصفية النشطة.
تيسير الوصول إلى البيانات من خلال كتالوجات البيانات القابلة للبحث، ومخازن البيانات المتكاملة، ومراكز منتجات البيانات المركزية.
ضمان جودة البيانات من خلال البيانات الوصفية المحدثة تلقائيًا وتوصيف البيانات وتنظيفها.
توجيه استخدام البيانات من خلال سياسات حوكمة محددة ومراكز منتجات البيانات التي تستضيف أصولاً منسقة للاستخدامات المحددة.
ونتيجة لذلك، يمكن للمؤسسات جني فوائد مثل:
يعززُ ذكاء البيانات معرفة البيانات ويمكّن من تحليلات الخدمة الذاتية من خلال تزويد المستخدمين بالرؤى التي يحتاجونها لفهم واستخدام بيانات المؤسسة. يمكن للأطراف المعنية على جميع المستويات وفي جميع الأدوار استخدام البيانات لاتخاذ قرارات أكثر استنارة.
تشير تقارير Data Differentiator الصادرة عن IBM إلى أن 82% من المؤسسات تعاني من صوامع البيانات التي تعيق سير العمل الرئيسي. يساعد ذكاء البيانات في القضاء على هذه الصوامع وتقليل تعقيدات البنية التحتية للبيانات من خلال الأسواق وكتالوجات البيانات المركزية والموحدة.
يمكن للمستخدمين في جميع أنحاء المؤسسة العثور على البيانات المناسبة لأغراضهم، مما يؤدي إلى تبسيط الكفاءة التشغيلية وتعزيز التعاون.
وفقًا لشركة Gartner، تخسر المؤسسات ما متوسطه 12,9 مليون دولار أمريكي بسبب ضعف جودة البيانات.2 يحافظ ذكاء البيانات على مستويات عالية من جودة البيانات من خلال دورة حياة البيانات، وتنميط البيانات، وجهود الحوكمة، حتى تتمكن المؤسسة من الحصول على قيمة أكبر من بياناتها.
يدمج ذكاء البيانات أطر العمل في نقاط الوصول إلى البيانات الرئيسية، مثل كتالوجات البيانات وأسواق البيانات. ويساعد ذلك على ضمان استخدام مستهلكي البيانات للأغراض المصرح بها فقط، والحماية من القرصنة والسرقة وإساءة الاستخدام وعدم الامتثال. تُعد الحوكمة مهمة بشكل خاص للصناعات شديدة التنظيم مثل التمويل والرعاية الصحية.
وفقًا لمعهد IBM لقيمة الأعمال، فإن 72% من الرؤساء التنفيذيين ذوي الأداء الأفضل يتفقون على أن امتلاك أدوات الذكاء الاصطناعي الأكثر تقدمًا يمنح المؤسسة ميزة تنافسية. ويتطلب الذكاء الاصطناعي التوليدي المتقدم كميات هائلة من البيانات عالية الجودة والتي يمكن الوصول إليها بسهولة.
يساعد ذكاء البيانات على تحسين جودة البيانات وتسهيل الوصول إليها وتطبيق سياسات الحوكمة لضمان استخدام البيانات للأغراض الصحيحة فقط، وهو جزء أساسي من الذكاء الاصطناعي المسؤول.
واحدة من حالات الاستخدام المحددة لذكاء البيانات هي في مجال ذكاء نماذج الذكاء الاصطناعي. ذكاء النماذج هو ممارسة فهم وإدارة وحوكمة دورات حياة مختلف نماذج الذكاء الاصطناعي والتعلم الآلي في محفظة المؤسسة.
بدلًا من الاعتماد على نموذج واحد، تستخدم العديد من المؤسسات اليوم نماذج مختلفة لغايات مختلفة. توفر مبادرات ذكاء البيانات للمؤسسات الشفافية التي تحتاجها لاختيار البيانات الصحيحة للنماذج الصحيحة للأسباب الصحيحة.
بالتحديد، يمكن لذكاء البيانات أن يساعد المؤسسات على اختيار البيانات الصحيحة من حيث الحوكمة—هل هذه البيانات مصرح باستخدامها في هذا النموذج؟—و الملاءمة—هل هذه البيانات دقيقة وذات صلة بما يكفي لهذا النموذج؟
علاوة على ذلك، يقوم العديد من البائعين بدمج وظائف إدارة النموذج في عروض ذكاء البيانات الخاصة بهم. على سبيل المثال، تقدم بعض كتالوجات البيانات ميزات كتالوج النماذج، مما يسمح لهم بجرد نماذج الذكاء الاصطناعي والتعلم الآلي للمؤسسة بنفس الطريقة التي يقومون بها بجرد بيانات المؤسسة.
ذكاء البيانات هو طريقة لفهم البيانات التي تمتلكها المؤسسة—خصائصها المحددة، وكيفية الوصول إليها وكيفية استخدامها. تعد تحليلات البيانات وعلوم البيانات وذكاء الأعمال طرقًا لاستخدام تلك البيانات.
يقوم تحليل البيانات باستخلاص رؤى قابلة للتنفيذ من البيانات لاتخاذ قرارات أفضل. يمكن أن تتخذ تحليلات البيانات أشكالًا عديدة، مثل التحليلات التنبؤية— استخدام البيانات لإجراء تنبؤات حول المستقبل — والتحليلات الإلزامية— استخدام البيانات لتحديد ما يجب فعله بعد ذلك.
علم البيانات هو تخصص يجمع بين الرياضيات والإحصاء والبرمجة والتحليلات المتقدمة والذكاء الاصطناعي والتعلم الآلي (ML) والخبرة اللازمة.
يشير ذكاء الأعمال (BI) إلى الأدوات والتقنيات التي يستخدمها الأشخاص لجمع بيانات المؤسسة وإدارتها وتحليلها لإثراء العمليات التجارية.
يعمل ذكاء البيانات على تسهيل تحليلات البيانات وعلم البيانات وذكاء الأعمال من خلال مساعدة المستخدمين على فهم بيانات مؤسستهم واستخدامها بشكل أفضل. عندما يعرف المستخدمون نوع البيانات التي تمتلكها المؤسسة وما يمكن استخدامها من أجله، يمكنهم الاتصال بسهولة أكبر بمجموعات البيانات المناسبة لأغراضهم.
على سبيل المثال، يمكن لعلماء البيانات العثور على بيانات عالية الجودة ومتوافقة لتدريب خوارزميات التعلم الآلي؛ ويمكن لمستخدمي ذكاء الأعمال العثور على مجموعات بيانات منسقة مصممة خصيصًا لمجالاتهم المحددة.
تؤدي كل الروابط إلى صفحات خارج ibm.com.
1 IDC MarketScape: Worldwide Data Intelligence Platform Software 2024 Vendor Assessment, IDC, November 2024.
2 Data Quality: Best Practices for Accurate Insights, Gartner.
تم اختيار IBM كشركة رائدة للعام التاسع عشر على التوالي في تقرير Magic Quadrant من Gartner لعام 2024 لأدوات تكامل البيانات.
تعرَّف على أهمية الذكاء الاصطناعي المدعوم بالبيانات ودمج البيانات في تحضير البيانات المنظمة وغير المنظمة وتسريع نتائج الذكاء الاصطناعي.
اكتشف قوة دمج استراتيجية مستودع بحيرة البيانات في بنية بياناتك، بما في ذلك تحسين التكاليف لأعباء العمل وتوسيع نطاق الذكاء الاصطناعي والتحليلات لديك، باستخدام جميع بياناتك وفي أي مكان.
استكشف دليل قائد البيانات لإنشاء مؤسسة قائمة على البيانات وتعزيز ميزة الأعمال.
ابحث في أهم 5 أسباب لتحديث تكامل البيانات على IBM Cloud Pak for Data.
احصل على رؤى فريدة حول تطور مشهد الحلول في مجال التحليلات وذكاء الأعمال (ABI)، مع تسليط الضوء على النتائج الرئيسية، والافتراضات، والتوصيات لقادة البيانات والتحليلات.
تفعيل البيانات للذكاء الاصطناعي والتحليلات من خلال الفهرسة الذكية وإدارة السياسات. يُعَد IBM Knowledge Catalog برنامجًا لإدارة البيانات يوفر كتالوج بيانات يتيح أتمتة اكتشاف البيانات، وإدارة جودة البيانات، وحماية البيانات.
استكشف كيف تُتيح IBM إنشاء أساس بيانات محكوم وجاهز للامتثال. تمكَّن اليوم من تحقيق شفافية البيانات مع IBM Manta Data Lineage، مما يتيح لك رؤية سجل بياناتك، وتدفقها، ونتائجها لضمان الاستفادة منها بشكل كامل.
اكتشف كيف يساعد مركز IBM Data Product Hub على تبسيط مشاركة البيانات وأتمتة تسليم منتجات البيانات إلى مستهلكي البيانات عبر المؤسسة.