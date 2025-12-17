الذكاء الاصطناعي أتمتة تكنولوجيا المعلومات

بناء مسارات البيانات ككود: تقديم IBM watsonx.data integration Python SDK.

يمثل التوفر العام لإصدار watsonx.data integration Python SDK خطوة مهمة في رؤية IBM لبنية بيانات جاهزة للذكاء الاصطناعي، ما يُتيح لفِرق البيانات توسيع تطوير مسارات البيانات وتمكين الوكلاء من استخدام بيانات عالية الجودة. 

يقدِّم watsonx.data integration Python SDK نموذجًا يعتمد على الكود أولًا، يستند إلى مهارات Python الموجودة مسبقًا ويوفر للوكلاء واجهة موحَّدة لتوليد الكود والتحقق منه. وبينما تستعد فِرق البيانات للذكاء الاصطناعي الوكيل، يجب أن يوفر تطوير مسارات البيانات خيارًا آخر يكون مناسبًا لتوليد المحتوى عبر النماذج اللغوية الكبيرة.

يُتيح Python SDK هذا التحول من خلال تمكين الفِرق من بناء وإصدار وأتمتة وإدارة مسارات بيانات الدُفعات ومسارات التدفق في الوقت الفعلي ككود - ما يقلل الجهد اليدوي ويدعم تكامل البيانات على نطاق واسع. إلى جانب استثماراتنا المستمرة في تأليف مسارات البيانات الوكيلة (في المعاينة)، يعزز هذا الإصدار التزام IBM بمواكبة عملائها في رحلتهم نحو بناء أساسات بيانات جاهزة للذكاء الاصطناعي.

تلبية متطلبات الذكاء الاصطناعي الوكيل تتطلب تطوير مسارات مرنة

تشعر كل مؤسسة بضغط مشهد البيانات الحالي: حيث تحتاج فِرق الأعمال إلى رؤى أسرع، وتجد فِرق البيانات نفسها مرهقة؛ بسبب أنظمة هشة ومجزأة، ويقلق قادة الامتثال من تسرّب البيانات الحساسة. تزداد هذه الضغوط مع ظهور الذكاء الاصطناعي الوكيل، حيث يعتمد النجاح ليس فقط على قوة النماذج، بل على قوة أساس البيانات التي تقوم عليها.

في صميم هذا الأساس يكمن تكامل البيانات: وهي مسارات البيانات التي تعمل على ربط البيانات وتحويلها وتسليمها بحيث يمكن الوثوق بها واستخدامها. عندما يتعثر التكامل، يفشل الذكاء الاصطناعي. وفقًا لتقرير MIT The GenAI Divide، فإن 95% من تجارب الذكاء الاصطناعي التوليدي تفشل ليس بسبب قصور النماذج؛ بل لأن أساس البيانات غير جاهز. في الوقت نفسه، يُطلب من فِرق البيانات بناء وإدارة عدد أكبر من مسارات البيانات عبر أنواع وبيئات متعددة، حتى أن 77% من المؤسسات تُشير إلى نقص في المهارات المطلوبة.

يوضِّح هذا الفارق المتزايد بين الطلب والقدرة أن تطوير مسارات البيانات يجب أن يكون مرنًا، ويلبي احتياجات المستخدمين حيثما كانوا. لم يَعُد أسلوب التأليف التقليدي كافيًا. يرغب مستخدمو الأعمال في التعبير عن نواياهم من خلال اللغة الطبيعية. ويريد الممارسون الفنيون الحصول على الكود. ويعتمد العديد من الفرق على واجهة مرئية لتصميم سريع.

تستثمر IBM بشكل كبير في هذا النهج متعدد الوسائط، حتى يتمكَّن watsonx.data integration من دعم كل مستخدم وفق أسلوب العمل المفضل لديه.

نهج يركِّز على الكود لبناء مسارات البيانات

يُعَد إصدار IBM watsonx.data integration Python SDK خطوة كبيرة في تلك الرؤية، حيث يمنح المطورين ومهندسي البيانات طريقة قوية تعتمد على الكود أولًا لبناء المسارات وأتمتتها وصيانتها برمجيًا، ما يؤدي إلى تقليل الجهد اليدوي وتسريع الوقت المناسب لتحقيق القيمة.

لطالما قدَّر مهندسو البيانات ومطورو ETL حرية اختيار طريقة بناء مسارات البيانات، سواء باستخدام واجهات مرئية منخفضة أو دون كود، أم عبر البرمجة المباشرة. بغض النظر عن أسلوب التأليف، يمكن تعريف مسارات البيانات مرة واحدة، وإصدار نسخ منها في Git، ونشرها بشكل متسق عبر مهام سير عمل CI/CD. وكل نهج يلبي احتياجات ومهارات مختلفة داخل فِرق البيانات.

الآن، مع Python SDK، يمكن للفِرق تأليف وإدارة مسارات تكامل البيانات باستخدام واحدة من أكثر اللغات اعتمادًا في هندسة البيانات. نظرًا لأن مهندسي البيانات معتادون على قراءة كود Python وكتابته ومراجعته، فإنهم يطبقون المهارات نفسها على IBM watsonx.data integration. سيُسهم التعامل مع مسارات البيانات ككود في فتح آفاق جديدة لإعادة استخدام الكود. بإتاحة إصدار Python SDK هذا، يمكن لفِرق البيانات الاختيار من بين عدة خيارات للتأليف تتوافق مع مهاراتهم وتفضيلاتهم.

مع حزمة تطوير البرامج (SDK)، يمكن للفِرق ما يلي:

1. إنشاء المسارات ككود:

  • تعريف وإعادة استخدام منطق مسارات البيانات في Python عبر البيئات المختلفة.
  • إصدار النسخ، ومراجعة وتدقيق التغييرات عبر طلبات Git وطلبات السحب (Pull Requests).
  • إنشاء الاتصالات وتصميم مسارات البيانات وإدارتها وتنفيذها بالكامل عبر الكود.
  • أتمتة الاختبارات والترقيات والنشر باستخدام التكامل المستمر/التسليم المستمر (CI/CD).
  • تطبيق الحوكمة وضوابط الوصول بشكل متسق برمجيًا.

2. الوصول إلى تجربة موحَّدة لتكامل البيانات عبر مجموعة SDK واحدة

  • استخدام مجموعة SDK واحدة لكلٍّ من مسارات بيانات الدُفعات (ETL/ELT/TETL) ومسارات البيانات المتدفقة في الوقت الفعلي.
  • التخلص من البرامج النصية المخصصة والحِزم الخاصة بالأدوات من خلال نموذج برمجي موحَّد ومتسق.
  • مصمم ليتوسَّع ليشمل أساليب تكامل إضافية، بما في ذلك البيانات غير المنظمة والتكرار والمزيد.
  • تبسيط إدارة المنصة من خلال التحكم البرمجي في المستخدمين والمشاريع وإعدادات الأمان.

3. جسر ثنائي الاتجاه بين التصميم المرئي والكود:

  • تصميم النماذج الأولية لمسارات البيانات في اللوحة المرئية أو تأليفها مباشرةً باستخدام Python.
  • الانتقال بسلاسة بين واجهة المستخدم والكود مع التصدير والاستيراد الفوري عبر مولِّد الكود في Python SDK الخاص بنا.
  • تسريع عمليات الدمج والتدريب مع تمكين الأتمتة والتكامل المستمر/التسليم المستمر (CI/CD) على نطاق واسع.
  • الحفاظ على ترابط قوي بين مهام سير العمل المرئية والبرمجية.

معًا، تمثِّل هذه القدرات الأساس لعصر جديد من تكامل البيانات، حيث تتصرف مسارات البيانات مثل البرمجيات، وتصبح الأتمتة هي الوضع الافتراضي، ويتمكَّن وكلاء الذكاء الاصطناعي المستقبليون من فهم وتطوير وحتى صيانة تدفقات البيانات على نطاق واسع.

أنماط من الواقع العملي: كيف تستخدم الفِرق Python SDK لتوسيع نطاق أعمال التكامل.

بينما تقدِّم SDK نهجًا برمجيًا لتطوير مسارات البيانات، يظهر تأثيرها بشكل أكبر في الطريقة التي تستخدمها بها الفِرق يوميًا. يتجه المستخدمون الأوائل نحو مجموعة من الأنماط الشائعة التي تساعدهم على التوسع بشكل أسرع، وتقليل التكرار، والعمل بمزيد من الاتساق.

حالة الاستخدام الأولى: تحويل مسار واحد إلى قالب قابل لإعادة الاستخدام.

نقطة البداية الشائعة هي مسار بيانات بسيط تم إنشاؤه عبر واجهة مستخدم. على سبيل المثال، استيراد ملف CSV، وتطبيق تحويل عليه، وكتابة النتائج في التخزين السحابي. عندما يتزايد الطلب، تريد فرق أخرى استخدام المنطق نفسه مع مدخلات مختلفة.

باستخدام Python SDK، يمكن تصدير المسار الأصلي إلى Python باستخدام ميزة إنشاء كود Python الجديدة لدينا وتحويله إلى قالب قابل لإعادة الاستخدام ومحدد المَعلمات. تُتيح ميزات SDK الجديدة لمجموعات المعلمات ومجموعات القيم نقل هذه الإعدادات من الواجهة المرئية إلى التحكم بالإصدارات. بدلًا من إدخال القيم يدويًا في النماذج، يمكنك برمجيًا تعريف وإدخال التكوينات لبيئات التطوير والاختبار والإنتاج دفعة واحدة. يتم إنشاء المتغيرات عن طريق تعديل بعض الأسطر في الكود بدلًا من إعادة تصميم المسار من البداية، ما يؤدي إلى تسريع التسليم وتقليل الأخطاء، وإنشاء نمط قابل للتوسع يمكن للفِرق اعتماده كمعيار.

حالة الاستخدام الثانية: تعديل المسارات على نطاق واسع لترحيل البنية التحتية.

تنشأ تحديات أخرى شائعة عندما يجب تحديث مسارات البيانات مع العديد من مصادر البيانات أو البيئات المتأثرة، مثلما يحدث أثناء ترحيل قاعدة بيانات أو مخزن بيانات. بدلًا من تحديث مسارات البيانات عبر واجهة المستخدم، يمكن للفِرق استخدام SDK لتكرار التدفقات برمجيًا، وتحديث الموصِّلات وإعدادات الاتصال، وضبط المَعلمات، ونشر التحديثات في ثوانٍ. ويُعَد هذا مهمًا بشكل خاص في البيئات التي يجب أن تتطور فيها مسارات البيانات بسرعة مع تغيُّر مصادر البيانات.

يمكن لمجموعة SDK الاتصال بأمان ببيئتك الهجينة، سواء على السحابة العامة/البرمجيات كخدمة أم في بيئات البرمجيات المُدارة ذاتيًا. بدلًا من إجراء العشرات من التعديلات اليدوية، يمكن تطبيق تغيير واحد في الكود بشكل متسق في كل مكان.

تشير هذه الأنماط إلى تحول أوسع: من التكوين اليدوي إلى تطوير قابل للتكرار وقائم على البرمجيات. من خلال التعامل مع مسارات البيانات ككود، يمكن للمؤسسات توسيع نطاق تكامل البيانات بشكل أكثر موثوقية وبناء أساس بيانات قوي مطلوب للذكاء الاصطناعي الوكيل.

دمج كل شيء معًا

يُعَد watsonx.data integration Python SDK خطوة أساسية في رؤية IBM لبناء أساس بيانات جاهز للذكاء الاصطناعي. من خلال إدخال الأتمتة البرمجية في watsonx.data integration، يمكن للفِرق بناء وصيانة مسارات البيانات بنفس الدقة وقابلية التوسع المستخدمة في تطوير البرمجيات، مع الاستمرار في تلبية احتياجات المستخدمين وفق أسلوبهم المفضل للمساعدة على سد الفجوة في مهارات هندسة البيانات.

كجزء من محفظة watsonx.data الأوسع، يعمل watsonx.data integration بانسجام مع watsonx.data intelligence لتقديم أساس بيانات موثوق به وشامل من البداية إلى النهاية. معًا، تمكِّن هذه الحلول المؤسسات من نقل البيانات وفهمها وإدارتها وتفعيلها عبر البيئات الهجينة، ما يدعم الذكاء الاصطناعي ومهام سير العمل الوكيلة على نطاق واسع.

