ما هو تكامل البيانات في الوقت الفعلي؟

صورة لرجل يحمل جهازًا لوحيًا ويسير عبر مركز بيانات

المؤلفون

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

ما هو تكامل البيانات في الوقت الفعلي؟

تكامل البيانات في الوقت الفعلي يتضمن التقاط ومعالجة البيانات من مصادر متعددة فور توفرها، ومن ثم دمجها فوراً في نظام مستهدف.
 

كما هو الحال مع تكامل البيانات التقليدي، يعمل تكامل البيانات في الوقت الفعلي على دمج ومواءمة البيانات التي قد تكون معزولة أو غير متسقة عبر المؤسسة. تتضمن العملية خطوات من استيعاب البيانات إلى تحليل البيانات. تسمح للمستخدمين باتخاذ قرارات أسرع وأكثر استنارة.

يكمن الاختلاف في سرعة توافر البيانات. يمكّن تكامل البيانات في الوقت الفعلي المستخدمين من استخلاص الرؤى من البيانات بأقل قدر من التأخير—عادةً في غضون بضعة أجزاء من الثانية.

الوصول الفوري إلى البيانات عالية الجودة من مجموعة واسعة من المصادر (مثل قواعد البيانات وجداول البيانات والتطبيقات والخدمات السحابية) والتنسيقات يمنح الشركات القدرة على الاستجابة بسرعة للتغيير. يقود حالات الاستخدام مثل ذكاء الأعمال (BI)، والذكاء الاصطناعي التوليدي (gen AI)، والتخصيص الفائق، والمزيد.

عمليات تكامل البيانات التقليدية، مثل المعالجة الدفعية، لا يمكنها دعم أحجام البيانات المتزايدة واحتياجات البيانات عالية السرعة للمؤسسات الحديثة. تكامل البيانات في الوقت الفعلي يستخدم تقنيات تدفق مختلفة وعمليات بيانات في الوقت الفعلي، تتراوح من الحلول مفتوحة المصدر إلى منصات تكامل البيانات الشاملة، وهي مصممة للعمل بشكل مستمر وعلى نطاق واسع.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

لماذا يعد تكامل البيانات في الوقت الفعلي مهمًا؟

البيانات هي القوة الدافعة وراء الابتكار وأصل حيوي للمؤسسات القائمة على البيانات. لكن أحجام البيانات اليوم تتزايد: من المتوقع أن يصل حجم البيانات العالمي إلى 393.9 زيتابايت بحلول عام 2028. تتزايد البيانات أيضاً في التوزيع والتنوع، ويتم تخزينها عبر أنظمة ومستودعات مختلفة، وبيئات سحابية ومحلية.

تمثل إدارة هذا الكم المتزايد التعقيد من البيانات تحديًا كبيرًا. تتصارع المنظمات مع الصوامع، وتقادم البيانات (الذي يحدث عندما تكون هناك فجوات زمنية لم يتم فيها تحديث البيانات)، وإدارة البيانات، وزمن انتقال الشبكة المرتفع.

ومما يزيد من تحدي إدارة البيانات الحديثة هو الضغط من أجل التحلي بالمرونة والابتكار. تتميز أسواق اليوم بالتقلب، وتدرك المؤسسات أنها بحاجة إلى معالجة البيانات في الوقت الفعلي للاستجابة بسرعة للتغيير. لقد برز الذكاء الاصطناعي التوليدي أيضًا كضرورة تنافسية، ومن المتوقع أن يرفع الناتج المحلي الإجمالي العالمي بنسبة 7% خلال السنوات العشر القادمة.

ومع ذلك، يتطلب الذكاء الاصطناعي التوليدي كميات هائلة من البيانات عالية الجودة لإنتاج نتائج جديرة بالاهتمام. بالنسبة لحالات الاستخدام التي يجب أن تستجيب فيها نماذج الذكاء الاصطناعي التوليدي في الوقت الفعلي (مثل اكتشاف الاحتيال أو اللوجستيات)، من الضروري توفير البيانات بمجرد جمعها. بالوقت الحالي، 16% فقط من قادة التكنولوجيا واثقون من أن قدراتهم السحابية والبيانات الحالية يمكنها دعم الذكاء الاصطناعي التوليدي.1

يساعد تكامل البيانات في الوقت الفعلي على تلبية هذه الحاجة المعاصرة للوصول الفوري إلى البيانات، مع توفير مزايا تكامل البيانات التقليدي أيضًا، ألا وهي تقليل صوامع البيانات وتحسين جودة البيانات. كما يزيد من الكفاءة التشغيلية من خلال تمكين وقت أسرع للوصول إلى الرؤى وصناعة القرار القائمة على البيانات.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

نوعان من البيانات في الوقت الفعلي

غالبًا ما يتم تصنيف البيانات في الوقت الفعلي إلى نوعين: بيانات التدفق وبيانات الحدث. فهم كيفية اختلاف الأنواع وارتباطها أمر حساس للمؤسسات التي تسعى إلى تحقيق التكامل والرؤى في الوقت الفعلي.

البيانات المتدفقة

بيانات التدفق هي بيانات في الوقت الفعلي تتدفق باستمرار من مصادر مختلفة، مثل أجهزة إنترنت الأشياء (IOT)، والأسواق المالية، ونشاط وسائل التواصل الاجتماعي أو معاملات التجارة الإلكترونية. تعد بيانات التدفق أمرًا أساسيًا للبيانات الكبيرة والتحليلات الفورية والذكاء الاصطناعي (AI) والتعلم الآلي. كما أنها أساسية لحالات الاستخدام الأخرى التي تتطلب معلومات مستمرة ومحدثة.

Event Streams

تُعد الأحداث تغييرًا فرديًا أو حدثًا أو إجراءً مهمًا لنظام ما—مثل بيع منتج أو تحويل أموال أو وصول درجة حرارة إلى عتبة محددة. يتم تجميع الأحداث ذات الصلة معًا. يمكن اعتبار التسليم المستمر لهذه الأحداث المجمعة تدفقًا، أو بشكل أكثر تحديدًا، تدفق أحداث (Event Streams). ومع ذلك، لا تحتوي كل حالات تدفق البيانات في الوقت الفعلي على أحداث.

أدوات وأساليب تكامل البيانات في الوقت الفعلي

هناك العديد من أدوات وأساليب تكامل البيانات في الوقت الفعلي، بما في ذلك:

  • تكامل البيانات المتدفقة (SDI)
  • التقاط البيانات المتغيرة (CDC)
  • تكامل التطبيقات
  • المحاكاة الافتراضية للبيانات

تكامل البيانات المتدفقة (SDI)

على عكس التكامل الدفعي الذي يدمج لقطات من البيانات من مصادر مختلفة على فترات زمنية محددة، فإن تكامل البيانات المتدفقة (SDI) يدمج البيانات في الوقت الفعلي عند توفرها. يستهلك باستمرار تدفقات البيانات ويعالجها ويحملها في نظام مستهدف للتحليل. تتيح هذه الإمكانيات تحليلات البيانات المتقدمة، والتعلم الآلي، وحالات الاستخدام الأخرى للبيانات في الوقت الفعلي، مثل الكشف عن الاحتيال وتحليلات إنترنت الأشياء.

يتطلب تطبيق SDI مسارات لتدفق البيانات، والتي تنقل ملايين سجلات البيانات بين أنظمة المؤسسات بزمن انتقال منخفض وسرعة عالية. تساعد هذه المسارات في ضمان سلامة البيانات عن طريق الحد بشكل كبير من مخاطر تلف البيانات أو تكرارها—وهي مشاكل شائعة عند معالجة كميات كبيرة من البيانات بسرعة.

يمكن أن تساعد منصات تكامل البيانات مثل Apache Kafka و IBM StreamSets المؤسسات على بناء مسارات بيانات متدفقة مصممة خصيصًا للأنظمة البنائية لتكنولوجيا المعلومات الفريدة الخاصة بها.

التقاط بيانات المتغيرة (CDC)

يطبق التقاط البيانات المتغيرة (CDC) التغييرات فور حدوثها من مصادر البيانات — مثل قواعد بيانات Microsoft SQL Server أو Oracle أو MongoDB — إلى مستودعات البيانات وحلول ETL ومستودعات البيانات الأخرى أو الأنظمة المستهدفة. قد تشمل التغييرات حذف البيانات وإدخالها وتحديثاتها. خلافًا لأدوات تكرار البيانات، يلتقط CDC التغييرات فقط وينسخها، وليس مجموعة البيانات بأكملها.

بشكل أساسي، يساعد CDC في الحفاظ على تحديث الأنظمة في الوقت الفعلي. من خلال إرسال البيانات التي تغيرت فقط، فإنه يقلل أيضًا من النفقات العامة لمعالجة البيانات وأوقات تحميل البيانات وحركة مرور الشبكة.

تكامل التطبيقات

تستخدم المؤسسة المتوسطة ما يقرب من 1200 تطبيق سحابي للعمل، ويقوم كل تطبيق بتوليد بياناته الخاصة، مما أدى إلى نشوء صوامع البيانات. ومع ذلك، تتطلب مهام سير العمل الحديثة تدفقات البيانات في الوقت الفعلي بين التطبيقات والأنظمة. تكامل التطبيقات، ويسمى أيضًا تكامل البرامج، يعمل على أتمتة وتبسيط عمليات نقل البيانات بين تطبيقات البرامج لتمكين التكامل في زمن شبه فعلي.

غالبًا ما تستخدم الشركات واجهات برمجة التطبيقات (APIs) لبناء وتشغيل مهام سير عمل تكامل التطبيقات. واجهة برمجة التطبيقات هي مجموعة من القواعد أو البروتوكولات التي تمكّن التطبيقات من التواصل بسلاسة مع بعضها البعض وتبادل البيانات.

قد تستخدم الشركات أيضًا خطافات الويب (webhooks) والبرامج الوسيطة لتسهيل تكامل التطبيقات.

المحاكاة الافتراضية للبيانات

تُنشئ المحاكاة الافتراضية للبيانات طبقة افتراضية توفر رؤية موحدة لتدفقات البيانات في الوقت الفعلي من مصادر مختلفة، مثل بيانات أجهزة الاستشعار وسجلات المعدات. تعمل طريقة العرض المجمعة على إلغاء الحاجة إلى نقل البيانات أو تكرارها أو معالجتها على دفعات في مكان آخر. تعمل هذه القدرات على تقليل وقت التكامل والتكاليف بشكل كبير، مع تقليل مخاطر عدم الدقة أو فقدان البيانات.

قد توفر أدوات المحاكاة الافتراضية للبيانات أيضًا طبقة دلالية، وهي واجهة تجربة مستخدم تعمل على تحويل البيانات إلى مصطلحات ذات معنى لاتخاذ قرارات العمل.

بالإضافة إلى ذلك، تُعدّ المحاكاة الافتراضية للبيانات حلًا لدمج البيانات للبيانات في الوقت الفعلي والبيانات التاريخية على حد سواء، مما يخلق رؤية شاملة للنظام البنائي لبيانات العمليات بأكمله للمؤسسة. تعد مجموعة البيانات الغنية هذه مثالية لتدريب النماذج الأساسية وراء الذكاء الاصطناعي التوليدي.

أنواع أخرى من تكامل البيانات

توجد أنواع إضافية من عمليات تكامل البيانات يمكن استخدامها بالتزامن مع تكامل البيانات في الوقت الفعلي، اعتمادًا على احتياجات بيانات المؤسسة.

  • تكامل البيانات الدفعية:  في تكامل الدُفعات، يتم جمع البيانات وتخزينها في مجموعة. بعد ذلك، عند مرور فترة زمنية محددة أو عند جمع كمية بيانات معينة، يتم نقل البيانات ودمجها كدفعة واحدة. هذه الطريقة مثالية لأعباء عمل البيانات كثيفة الحوسبة وعندما لا يكون الوقت عاملاً محفزًا.

  • تكامل البيانات على دفعات متناهية الصغر: غالبًا ما يُعتبر تكامل الدُفعات المصغرة بديلاً شبه فوري للمعالجة الدفعية التقليدية. في هذه الطريقة، تتم معالجة البيانات في أحمال تشغيل أصغر وأكثر تكرارًا، مما يتيح رؤى شبه فورية بزمن انتقال أقل.

  • الاستخراج والتحويل والتحميل (ETL): تقوم عملية تكامل بيانات ETL بدمج البيانات وتنقيحها وتنظيمها من مصادر مختلفة (مثل أنظمة تخطيط موارد المؤسسات وقواعد البيانات) في مجموعة بيانات واحدة متسقة للتخزين في مستودع بيانات أو بحيرة بيانات أو نظام مستهدف آخر. مسارات بيانات ETL يمكن أن تتناسب مع السيناريوهات التي تكون فيها جودة البيانات واتساقها أمرًا بالغ الأهمية، حيث يمكن أن تتضمن عملية تحويل البيانات خطوات صارمة لتنظيف البيانات والتحقق من صحتها.
  • الاستخراج والتحويل والتحميل (ELT): مثل ETL، تعمل عملية تكامل بيانات ELT على نقل البيانات غير المنسقة من نظام المصدر إلى مورد الوجهة. ومع ذلك، بدلاً من تنظيف البيانات مقدمًا، فإنه يقوم بتحميل البيانات الخام مباشرة في تخزين البيانات ليتم تحويلها حسب الحاجة. وهذا يسمح بإدارة البيانات بشكل أكثر مرونة. يتم استخدام ELT عادةً عندما تكون السرعة وقابلية التوسع أمرًا بالغ الأهمية.

ورغم أن هذه الأنواع من تكامل البيانات هي من بين الأنواع الأكثر شيوعًا، إلا أن القائمة ليست شاملة. على سبيل المثال، قد تستخدم بعض المؤسسات أيضًا التكامل الموحد للبيانات والتكامل اليدوي للبيانات وأساليب التكامل الموحد للوصول إلى البيانات.

حالات الاستخدام لتكامل البيانات في الوقت الفعلي

يُعد تكامل البيانات في الوقت الفعلي مفيدًا للعديد من الصناعات والسيناريوهات. بعض حالات الاستخدام الشائعة تشمل ما يلي:

الذكاء التشغيلي

يمكن أن يؤدي تكامل البيانات في الوقت الفعلي من سلسلة التوريد والتصنيع وإدارة المخزون والعمليات التشغيلية الأخرى إلى تعزيز جهود تحسين العمليات. عند دمجها مع أدوات ذكاء الأعمال، يمكن عرض المعلومات الحديثة على لوحات المعلومات والتقارير والتصورات الأخرى للحصول على رؤية ذكية وشفافة للأداء العام.

تخصيص العملاء

يمكن للشركات التي تدمج معلومات العملاء من مديري علاقات العملاء (CRMs) ووسائل التواصل الاجتماعي والمصادر الأخرى في الوقت الفعلي أن تتجاوز التخصيص التقليدي وتجد ميزة تنافسية. تتيح الرؤى في الوقت الفعلي التخصيص الفائق، مما يوفر تجارب أو منتجات أو خدمات مصممة للغاية للعملاء بناءً على سلوك العميل وتفضيلاته الفردية.

الكشف عن الغش

تعمل منصات تكامل البيانات في الوقت الفعلي على تسهيل التجميع السلس لبيانات المعاملات والبيانات السلوكية وبيانات التهديدات الخارجية. يمكن لمحركات التحليلات (Analytics Engine) بعد ذلك استيعاب البيانات واكتشاف المشكلات على نطاق واسع، مما يحمي الشركات من الاحتيال والخسائر المالية، مع تحسين وضع الامتثال التنظيمي.

الذكاء الاصطناعي

من خلال تدفقات البيانات التي يتم تحديثها باستمرار، يمكن لنماذج الذكاء الاصطناعي إجراء تنبؤات أكثر دقة في الوقت الفعلي. يدعم التكامل في الوقت الفعلي أيضًا الأتمتة. على سبيل المثال، كجزء من وظائفها الأساسية، تتخذ روبوتات المحادثة المدعومة بأتمتة العمليات الآلية (RPA) والمركبات ذاتية القيادة قرارات في الوقت الفعلي.

حلول ذات صلة
منصة IBM StreamSets

إنشاء أنظمة تدفق البيانات الذكية وإدارتها من خلال واجهة رسومية سهلة الاستخدام، ما يسهِّل تكامل البيانات بسلاسة عبر البيئات الهجينة ومتعددة السحابة.

استكشف StreamSets
IBM Databand

اكتشف IBM Databand، وهو برنامج متخصص في مراقبة مسارات البيانات. يجمع البيانات الوصفية تلقائيًا لبناء خطوط أساسية تاريخية، واكتشاف حالات الخلل، وإنشاء عمليات سير عمل لمعالجة مشكلات جودة البيانات.

استكشف ®Databand
حلول تكامل البيانات

أنشئ مسارات بيانات مرنة وعالية الأداء ومحسَّنة من حيث التكلفة لمبادرات الذكاء الاصطناعي التوليدي، والتحليلات في الوقت الفعلي، وتحديث مستودعات البيانات، وتلبية احتياجات التشغيل باستخدام حلول تكامل البيانات من IBM.

اكتشف حلول تكامل البيانات
اتخِذ الخطوة التالية

اكتشف IBM DataStage، أداة الاستخراج والتحويل والتحميل (ETL) التي توفر واجهة مرئية لتصميم مسارات البيانات وتطويرها ونشرها. وهي متوفرة على هيئة برمجيات كخدمة (SaaS) مُدارة على IBM Cloud، للاستضافة الذاتية، وكمكون إضافي على IBM Cloud Pak for Data.

استكشف DataStage استكشف خدمات التحليلات
الحواشي

1 "6 نقاط عمياء يجب أن يكشفها قادة التكنولوجيا"، معهد IBM لقيمة الأعمال. 20 أغسطس 2024.