ما المقصود بتحويل البيانات؟

منظر جوي لموقع بناء Barangaroo

ما المقصود بتحويل البيانات؟

يعد تحويل البيانات جزءًا حساسًا من عملية تكامل البيانات التي تتحول فيها البيانات غير المنسقة إلى تنسيق أو بنية موحدة. يضمن تحويل البيانات التوافق مع الأنظمة المستهدفة ويعزز جودة البيانات وسهولة استخدامها. وهو جانب أساسي من جوانب ممارسات إدارة البيانات بما في ذلك معالجة البيانات وتحليلها وتخزينها.

بينما يستطيع المتخصصون تحويل البيانات يدويًا، تتطلب الكميات الكبيرة من البيانات المطلوبة لتشغيل التطبيقات المؤسسات الحديثة عادةً مستوى معينًا من الأتمتة. قد تكون الأدوات والتقنيات المستخدمة في عملية تحويل البيانات بسيطة أو معقدة.

على سبيل المثال، قد يكون تحويل البيانات بسيطًا مثل تحويل حقل تاريخ (على سبيل المثال: اليوم/الشهر/السنة) إلى حقل آخر، أو تقسيم عمود Excel واحد إلى عمودين. ولكن تحويلات البيانات المعقدة، التي تنظف البيانات وتوحدها من مصادر متعددة متباينة، وتتكون من مهام سير عمل متعددة، قد تتطلب مهارات متقدمة في علم البيانات .

وتتضمن وظائف هندسة البيانات المتقدمة هذه تطبيع البيانات الذي يحدد العلاقات بين نقاط البيانات؛ وإثراء البيانات الذي يكمل المعلومات الموجودة بمجموعات بيانات من جهات خارجية.

في ظل الاقتصاد العالمي الرقمي الأول اليوم، تساعد عمليات تحويل البيانات المؤسسات على الاستفادة من كميات كبيرة من البيانات المأخوذة من مصادر مختلفة لتحسين الخدمة وتدريب نماذج التعلم الآلي ونشر تحليلات البيانات الكبيرة.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

حالات استخدام تحويل البيانات

من خلال توحيد مجموعات البيانات وإعدادها للمعالجة اللاحقة، يجعل تحويل البيانات العديد من الممارسات بالغة الأهمية لبيانات المؤسسة أمرًا ممكنًا. تشمل الأسباب الشائعة لتحويل البيانات في عالم الأعمال ما يلي:

ذكاء الأعمال

تحوّل المؤسسات البيانات لاستخدامها في تطبيقات ذكاء الأعمال مثل لوحات المعلومات في الوقت الفعلي وتقارير التنبؤات، ما يسمح باتخاذ قرارات قائمة على البيانات وتأخذ كميات هائلة من المعلومات في الحسبان.

مستودع البيانات

تعمل عملية تحويل البيانات على إعداد البيانات للتخزين والإدارة في مستودع البيانات أو بحيرة البيانات، ما يسهل الاستعلام والتحليل الفعالين.

التعلم الآلي

تتطلب نماذج التعلم الآلي بيانات نظيفة ومنظمة. إن ضمان موثوقية البيانات وتقديمها بالتنسيق الصحيح يسمح للمؤسسات باستخدامها لتدريب أدوات الذكاء الاصطناعي وضبطها.

تحليلات البيانات الكبيرة

قبل تحليل البيانات الكبيرة لأغراض ذكاء الأعمال أو أبحاث السوق أو غيرها من التطبيقات، يجب تجميعها وتنسيقها بشكل مناسب.

ترحيل البيانات

تحتوي عملية نقل البيانات من أنظمة محلية قديمة إلى منصات حديثة، مثل مستودع البيانات السحابية أو بحيرة البيانات، غالبًا على عمليات تحويل معقدة للبيانات.

عملية تحويل البيانات

تتبع عمليات تحويل البيانات عادة عملية منظمة لإنتاج بيانات قيمة قابلة للاستخدام من حالتها غير المنسقة. وتتضمن الخطوات الشائعة في عملية تحويل البيانات ما يلي:

1. اكتشاف البيانات

تُجمع بيانات المصدر أثناء عملية الاكتشاف. وقد تتضمن هذه العملية استخراج البيانات غير المنسقة من واجهات برمجة التطبيقات أو قاعدة بيانات SQL أو الملفات الداخلية بتنسيقات متباينة. عند تحديد هذه المعلومات واستخراجها، يتأكد متخصصو البيانات من أن المعلومات التي تُجمَّع شاملة وذات صلة بالتطبيق النهائي لها. وخلال عملية الاستكشاف، يبدأ المهندسون أيضًا بفهم خصائص البيانات وهيكلها في عملية تُعرف باسم اكتشاف أنماط البيانات.

2. تنظيف البيانات

يتطلب إعداد البيانات وتنظيفها تحديد الأخطاء والتناقضات وأوجه عدم الدقة في البيانات غير المنسقة وإصلاحها. وتضمن هذه الخطوة جودة البيانات وموثوقيتها من خلال إزالة التكرارات والقيم الخارجية أو معالجة القيم المفقودة.

3. تنظيم البيانات

يتضمن تنظيم البيانات إنشاء مخطط أو عملية توجيهية لتوجيه عملية التحويل. وخلال هذه العملية، يحدد مهندسو البيانات مدى توافق عناصر النظام المصدر مع عناصر محددة في الصيغة المستهدفة.

4. توليد التعليمات البرمجية

تُنْشِئ المؤسسة خلال هذه الخطوة التعليمات البرمجية التي ستقوم بتحويل البيانات، سواء كان ذلك باستخدام أداة خارجية أو عن طريق التوليد الداخلي للتعليمات البرمجية.

5. تنفيذ التعليمات البرمجية والتحقق من صحتها

يحدث التحويل الفعلي خلال هذه المرحلة حيث تطَبَّق التعليمات البرمجية على البيانات غير المنسقة. تُحمَّل البيانات المحوَّلة في نظامها المستهدف لإجراء المزيد من التحليل أو المعالجة. ثم يتم التحقق من صحة البيانات المحوَّلة ونموذج البيانات لضمان الاتساق والصحة.

6. المراجعة

أثناء عملية المراجعة، يراجع محللو البيانات أو المهندسون أو المستخدمون النهائيون بيانات المخرجات، للتأكد من أنها تلبي المتطلبات.

أكاديمية الذكاء الاصطناعي

هل تعد إدارة البيانات هي سر الذكاء الاصطناعي التوليدي؟

استكشف سبب أهمية البيانات عالية الجودة للاستخدام الناجح للذكاء الاصطناعي التوليدي.

مقارنة تحويل بيانات ETL بتحويل بيانات ELT

عملية الاستخراج والتحويل والتحميل (ETL) وعملية الاستخراج والتحميل والتحويل (ELT) هما عمليتان شائعتا الاستخدام لتحويل البيانات، ويقومان بنشر تقنيات مختلفة قليلاً لمسارات البيانات. ولكل منهما مزايا وعيوب اعتمادًا على حجم عملية التحويل وتعقيدها.

استخراج وتحويل وتحميل (ETL): تحويل البيانات في منطقة التخزين

في عملية الاستخراج والتحويل والتحميل (ETL)، تُستخرج مجموعة فرعية محددة سلفًا من البيانات المنظمة من مصدرها، حيث تحوَّل في منطقة تجميع أو خادم معالجة ثانوي قبل تحميلها في النظام المستهدف. وتعد عملية الاستخراج والتحويل والتحميل (ETL) أكثر ملاءمة للتخزين المحلي ومجموعات البيانات الأصغر حجمًا. ومع ذلك، قد تُفضَّل عملية الاستخراج والتحويل والتحميل (ETL) في سيناريوهات ذات احتياجات محددة لجودة البيانات واتساقها، حيث يمكن تقديم خطوات أكثر صرامة لتنظيف البيانات والتحقق من صحتها. وقد تكون عملية الاستخراج والتحويل والتحميل (ETL) ضرورية أيضًا لحماية البيانات الحساسة، مثل المعلومات المحمية بموجب قانون نقل التأمين الصحي والمساءلة (HIPAA) أثناء الترحيل.

استخراج وتحميل وتحويل (ELT): تحويل البيانات في السحابة 

في عملية ELT، تُستَخرَج المعلومات من مصادر البيانات وتُحمَّل في النظام الهدف القائم على السحابة، حيث يتم تحويلها فيه. يسمح هذا النهج عادة، لأنه يستفيد من قوة الحوسبة السحابية، بمعالجة أسرع للبيانات وإدارتها بأسلوب أكثر ذكاءً. ويستخدم أيضًا هذا النهج مع البيانات غير المنظمة مثل الصور. تستفيد عملية ELT من زيادة قابلية التوسع بفضل الحوسبة القائمة على السحابة وقوة التخزين.

أنواع تحويل البيانات

يستخدم علماء البيانات ومهندسوها العديد من التقنيات المتميزة خلال عملية تحويل البيانات. تعتمد الأساليب المتَّبَعة بشكل كامل على المشروع والاستخدام المقصود للبيانات، على الرغم من إمكانية استخدام عدة طرق بشكل متزامن كجزء من عملية معقدة.

  • تنظيف البيانات: تعمل عملية تنظيف البيانات على تحسين جودة البيانات عن طريق تصحيح الأخطاء والتناقضات، مثل التخلص من السجلات المكررة.
  • تجميع البيانات: تعمل عملية تجميع البيانات على تلخيص البيانات من خلال دمج عدة سجلات في قيمة واحدة أو مجموعة بيانات واحدة.
  • تطبيع البيانات: تعمل عملية تطبيع البيانات على توحيد البيانات، ما يجعل جميع القيم في مقياس أو تنسيق مشترك، مثل القيم الرقمية من 1 إلى 10.
  • ترميز البيانات: تعمل عملية ترميز البيانات على تحويل البيانات الفئوية إلى صيغة رقمية، ما يسهل تحليلها. على سبيل المثال، يخصص ترميز البيانات رقمًا فريدًا لكل فئة من فئات البيانات.
  • إثراء البيانات: تعمل عملية إثراء البيانات على تحسين البيانات عن طريق إضافة معلومات ذات صلة من مصادر خارجية، مثل البيانات الديموغرافية للجهات الخارجية أو البيانات الوصفية ذات الصلة.
  • إسناد البيانات: تعمل عملية إسناد البيانات على استبدال قيم معقولة ببيانات مفقودة. على سبيل المثال، تستبدل القيمة الوسيطة أو المتوسطة بالقيم المفقودة.
  • تقسيم البيانات: تقوم هذه العملية بتقسيم البيانات إلى مجموعات فرعية لأغراض مختلفة. على سبيل المثال، يقسم المهندسون مجموعة بيانات لاستخدام إحداها للتدريب والأخرى للاختبار في التعلم الآلي.
  • تجزئة البيانات: في عملية تجزئة البيانات، تحوَّل البيانات إلى مجموعات أو فترات منفصلة في عملية تُعرف أحيانًا بـالتصنيف. على سبيل المثال، تستخدم التجزئة في مجال الرعاية الصحية لترجمة بيانات مثل عمر المريض إلى فئات مثل "رضيع" أو "بالغ".
  • تعميم البيانات: تعمل عملية تعميم البيانات على تجريد مجموعات البيانات الكبيرة إلى نموذج أعلى في المستوى أو أكثر تلخيصًا، ما يقلل من التفاصيل ويجعل فهم البيانات أسهل.
  • تصور البيانات: تساعد عملية تصور البيانات على تقديم البيانات في شكل بياني، كاشفةً عن أنماط أو رؤى قد لا تكون واضحة على الفور.

أدوات تحويل البيانات

في حين أنه من الممكن إجراء تحويل البيانات بواسطة مهندسين داخليين فقط، إلا أن العديد من الخدمات الخارجية تساعد في تسهيل عملية التحويل والترحيل. ومن بين أكثر هذه الخدمات شيوعًا ما يلي:

  • أدوات عملية الاستخراج والتحويل والتحميل (ETL) وعملية الاستخراج والتحميل والتحويل (ELT): تسهل أدوات مثل Apache NiFi وInformatica التوصيل والتشغيل في عملية الاستخراج والتحويل والتحميل (ETL) أو عملية الاستخراج والتحميل والتحويل (ELT).
  • منصات تكامل البيانات: تدعم مجموعة من الأدوات مثل IBM Cloud Pak® for Data تكامل البيانات ومعالجتها في الوقت الفعلي.
  • أدوات data preparation: صُمِمَت هذه الأدوات خصيصًا لتنظيف البيانات وتحويلها قبل تحويل البيانات أو ترحيلها.
  • لغات البرمجة: توفر لغات البرمجة مثل Python وR، المزوَّدة بمكتبات مثل مكتبة pandas مفتوحة المصدر، قدرات قوية لتحويل البيانات.

مزايا تحويل البيانات

يُعد تحويل البيانات خطوة حاسمة في معالجة البيانات. فهو يعمل على تحسين قدرة المؤسسة على التحليل وإعداد التقارير واتخاذ القرارات والتخزين. تشمل الميزات الرئيسية ما يلي:

جودة البيانات المُحسّنة

يتضمن تحويل البيانات عمليات مثل تنظيف البيانات، ما يحسن الجودة الإجمالية لمجموعة البيانات. ومع وجود بيانات أفضل وبنى بيانات محددة جيدًا، تعمل المؤسسات على تحسين الكفاءة التشغيلية في مجالات مثل إدارة المخزون ومعالجة الطلبات. تعمل البيانات الأفضل أيضًا على تحسين تجربة العملاء، ما يوفر رؤية شاملة للمستهلكين الحاليين والمحتملين. 

تحسين توافق البيانات وتكاملها

تعمل عملية تحويل البيانات على توحيد تنسيقات البيانات وهياكلها، مما يسهل دمج المعلومات في مجموعة بيانات متماسكة. من خلال كسر صوامع البيانات وتوحيد المعلومات من إدارات أو أنظمة المتباينة، تعالج المؤسسة التناقضات وتكتسب رؤية موحدة للأعمال.

تحسين تصور البيانات

عادةً ما تكون البيانات المحوَّلة أكثر تنظيمًا وهيكلةً، ما يسهل إنشاء تصورات ذات مغزى تُوصِل الرؤى بشكل فعّال. تساعد التصورات صانعي القرار على تحديد الاتجاهات أو الفرص، ويمكنها تقديم بيانات مهمة، مثل خطوط المبيعات أو الشراء، في الوقت الفعلي تقريبًا.

إمكانية وصول أفضل للبيانات

تعمل عملية تحويل البيانات على تحويل البيانات المعقَّدة أو غير المنظمة إلى تنسيقات يسهل فهمها والوصول إليها وتحليلها. تستخدم المؤسسات هذه البيانات لإنشاء توقعات متقدمة للسوق أو تحديد مجالات التحسين.

تعزيز حلول الأمان وإدارة الامتثال

يمكن أن يشمل تحويل البيانات إخفاء هوية البيانات وتشفيرها وحماية المعلومات الحساسة والامتثال للوائح الخصوصية. ويظل هذا الأمان أمرًا بالغ الأهمية للصناعات شديدة التنظيم، مثل الرعاية الصحية والتمويل، وكذلك للمؤسسات التي تعمل في مناطق جغرافية متعددة ذات قوانين خصوصية مختلفة.

قابلية توسع ومرونة أفضل 

عادةً ما تكون البيانات المحوَّلة أكثر مرونة وسهولة في التنظيم، ما يجعل من السهل التكيف مع حالات الاستخدام الجديدة أو توسيع نطاق معالجة البيانات كلما زادت كمية البيانات. تضمن البيانات القابلة للتوسُّع نمو المؤسسة من دون الحاجة إلى إعادة تنظيم مكلفة أو تطبيقات متعددة لتكنولوجيا المعلومات.

حلول ذات صلة
برمجيات وحلول إدارة البيانات

صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.

استكشف حلول إدارة البيانات
IBM watsonx.data

يتيح لك watsonx.data توسيع نطاق التحليلات والذكاء الاصطناعي باستخدام جميع بياناتك، أينما كانت، من خلال مخزن بيانات مفتوح وهجين ومُدار.

اكتشف watsonx.data
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة باستخدام IBM Consulting، من خلال بناء مؤسسة تعتمد على الرؤى التي تقدِّم ميزة للأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

صمم استراتيجية بيانات تقضي على صوامع البيانات، وتقلل من التعقيدات وتحسّن جودة البيانات للحصول على تجارب استثنائية للعملاء والموظفين.

استكشف حلول إدارة البيانات اكتشف watsonx.data