الاستخراج، والتحميل، والتحويل (ELT ) والاستخراج، والتحويل، والتحميل (ETL) هما عمليتان لتكامل البيانات تنقلان البيانات غير المنسقة من نظام المصدر إلى قاعدة البيانات المستهدفة، مثل بحيرة البيانات أو مستودع البيانات. يمكن أن تكون مصادر البيانات هذه في مستودعات متعددة ومختلفة أو في الإرث يتم نقلها بعد ذلك باستخدام ELT أو ETL إلى موقع بيانات مستهدف.
النشرة الإخبارية الخاصة بالمجال
ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.
سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.
باستخدام عملية ELT، يتم استخراج البيانات غير المنظمة من نظام مصدر وتحميلها على نظام مستهدف ليتم تحويلها لاحقًا، حسب الحاجة. تتم إتاحة هذه البيانات غير المنظمة التي تم استخراجها لأنظمة ذكاء الأعمال، ولا تكون هناك حاجة إلى منطقة مرحلية للبيانات. تستفيد عملية ELT من مستودعات البيانات لإجراء تحويلات بيانات أساسية، مثل التحقق من صحة البيانات أو إزالة البيانات المكررة. يتم تحديث هذه العمليات في الوقت الفعلي واستخدامها لكميات كبيرة من البيانات غير المنسَّقة. وتُعدّ ELT عملية أحدث لم تصل إلى كامل إمكاناتها مقارنةً بعملية ETL الأقدم. اعتمدت عملية ELT في الأصل على برامج SQL النصية المشفرة. ومن المرجح أن تحتوي برامج SQL النصية هذه على أخطاء محتملة في البرمجة أكثر من الطرق الأكثر تقدمًا المستخدمة في ETL.
من خلال عملية ETL، يتم استخراج البيانات غير المنظمة من نظام مصدر ويتم تحديد نقاط بيانات محددة و"مفاتيح" محتملة قبل تحميل البيانات إلى الأنظمة المستهدفة. في سيناريو ETL التقليدي، يتم استخراج بيانات المصدر إلى منطقة مرحلية، ومن ثم نقلها إلى النظام المستهدف. في المنطقة المرحلية، تخضع البيانات إلى عملية تحويل تقوم بتنظيم جميع أنواع البيانات وتنظيفها. وتسمح عملية التحول هذه بأن تكون البيانات المنظمة الآن متوافقة مع أنظمة تخزين البيانات المستهدفة. تم تصميم ETL في الأصل للعمل مع قواعد البيانات العلائقية، والتي هيمنت تاريخيًا على السوق. عمل مهندسو البيانات على عمليات ETL منذ سبعينيات القرن الماضي، ما أتاح لهم الوقت لتحسين عمليات ETL لعلم البيانات بشكل كبير.
في الفيديو التالي، يقدم جميل سبين مزيدًا من التعمق في عملية ETL:
يتيح نهج ELT تنفيذًا أسرع من عملية ETL، على الرغم من أن البيانات تكون فوضوية بمجرد نقلها. يحدث التحويل بعد وظيفة التحميل، ما يمنع تباطؤ الترحيل الذي يمكن أن يحدث في أثناء هذه العملية. تقوم ELT بفصل مرحلتَي التحويل والتحميل، ما يضمن أن خطأً في البرمجة (أو خطأً آخر في مرحلة التحويل) لا يوقف جهد الترحيل. بالإضافة إلى ذلك، تتجنب ELT مشكلات توسع الخادم من خلال استخدام قوة المعالجة وحجم مستودع البيانات لتمكين التحويل القابل للتوسع على نطاق واسع. تعمل ELT أيضًا مع حلول مستودع البيانات السحابية لدعم أنواع البيانات المنظمة وغير المنظمة وشبه المنظمة والبيانات غير المنسقة.
يستغرق تنفيذ عملية ETL وقتًا أطول في التنفيذ ولكن ينتج عنها بيانات أنظف. هذه العملية مناسبة تمامًا لمستودعات البيانات المستهدفة الأصغر حجمًا والتي تتطلب تحديثًا بوتيرة أقل. تعمل ETL أيضًا مع مستودعات البيانات السحابية باستخدام منصات SaaS المستندة إلى السحابة ومستودعات البيانات الموجودة في الموقع.
يوجد أيضًا العديد من أدوات ETL مفتوحة المصدر والتجارية ذات قدرات وفوائد تشمل ما يلي:
من الأفضل استخدام عملية ELT في مجموعات البيانات كبيرة الحجم أو بيئات استخدام البيانات في الوقت الفعلي.
تشمل الأمثلة المحددة ما يلي:
من الأفضل استخدام ETL لمزامنة العديد من بيئات استخدام البيانات وترحيل البيانات من الإرث.
فيما يلي بعض الأمثلة المحددة:
تتمثل الاختلافات الرئيسية بين ELT وETL في ترتيب العمليات بين العمليتين التي تجعلهما مناسبتين بشكل فريد لحالات مختلفة. توجد اختلافات أخرى في حجم البيانات وأنواع البيانات التي يمكن لكل عملية التعامل معها. وعلى الرغم من أن ELT وETL تبدوان متشابهتين، فإن تطبيقهما مختلف.
تكون العملية في ELT مبسطة من حيث إنها لا تحتاج إلى "مفاتيح" أو معرّفات أخرى لنقل البيانات واستخدامها. تم تنقيح عملية نقل البيانات إلكترونيًا وهناك العديد من أدوات نقل البيانات إلكترونيًا المتطورة التي يتم استخدامها للمساعدة في ترحيل البيانات. وتكون أوقات التحميل أقصر لأن العملية لا تحتوي على العديد من الخطوات التي يجب أن تمر بها. يأتي حل ELT لأنظمة ذكاء الأعمال من الحاجة إلى القدرة على تحميل البيانات غير المنظمة بسرعة. حل ELT الآلي المستند إلى السحابة يمكن أن يكون أيضًا منخفض الصيانة نسبيًا في الدعم.
توفر بيانات ETL مزيدًا من التعريف منذ البداية، وهو ما يتطلب عادةً مزيدًا من الوقت لنقل البيانات بدقة. وتتطلب هذه العملية تحديثات دورية للمعلومات فقط، وليس تحديثات في الوقت الفعلي. أوقات تحميل ETL أطول من ELT بسبب الخطوات العديدة في مرحلة التحويل التي يجب أن تحدث قبل تحميل البيانات.
تقدِّم IBM خدمات وحلول تكامل بيانات عديدة مُصممة لدعم خط بيانات جاهز للأعمال، وتزويد مؤسستك بالأدوات اللازمة للتوسع بكفاءة.
تمنح IBM، الرائدة في التكامل المحلي والمستند إلى السحابة، للمؤسسات الثقة التي تحتاجها عند إدارة مشاريع البيانات الكبيرة والتطبيقات وتقنيات التعلم الآلي. مع منصات رائدة في الصناعة مثل IBM® Cloud Pak for Data، يمكن للمؤسسات تحديث عمليات البيانات الخاصة بها، مع استخدام أفضل أدوات المحاكاة الافتراضية لتحقيق السرعة وقابلية التوسع التي تحتاجها أعمالها الآن وفي المستقبل.
لمزيد من المعلومات حول كيفية بناء استراتيجية فعّالة لتكامل البيانات وتنفيذها، استكشف مجموعة حلول IBM لتكامل البيانات.
سجل الاشتراك للحصول على IBMid وأنشأ حساب IBM® Cloud.
صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.
يتيح لك watsonx.data توسيع نطاق التحليلات والذكاء الاصطناعي باستخدام جميع بياناتك، أينما كانت، من خلال مخزن بيانات مفتوح وهجين ومُدار.
استفِد من قيمة بيانات المؤسسة باستخدام IBM Consulting، من خلال بناء مؤسسة تعتمد على الرؤى التي تقدِّم ميزة للأعمال.