كيفية تطوير إستراتيجية بيانات لدعم تطبيقات الذكاء الاصطناعي التوليدي لديك

جدار منحني ضخم من الشاشات في غرفة مظلمة

الذكاء الاصطناعي التوليدي، المعروف أيضًا باسم gen AI، هو الذكاء الاصطناعي الذي يمكنه إنشاء نصوص، وصور، ومقاطع فيديو، ومقاطع صوتية وحتى التعليمات البرمجية استجابة لطلب المستخدم. في هذه الأيام، تستعد المؤسسات لتطوير تطبيقات ذكاء اصطناعي توليدي جديدة، لكنها غالبًا ما تغفل عن الخطوات اللازمة لصياغة إستراتيجية بيانات فعالة تدعمها.

نماذج الذكاء الاصطناعي التوليدي—وهي برامج الحاسوب التي تدربت على اتخاذ القرارات بطريقة مماثلة للعقل البشري—تتطلب كميات هائلة من البيانات للتدرب عليها. وعلى الرغم من أن المؤسسات قد تكون لديها فكرة رائعة لتطبيق ما، فإنه إذا لم يُجرَ التعامل مع البيانات الأساسية بشكل صحيح، فسيفشل التطبيق.

بدءًا من تكلفة جمع البيانات ومعالجتها، ومرورًا بالبنية التحتية اللازمة لتخزينها بأمان، وحتى المتطلبات المتطورة لحوكمة البيانات، من المهم أن تتبع المؤسسات نهجًا إستراتيجيًا لنجاح التطبيقات.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

ChatGPT والسعي نحو تطبيقات الأعمال الجديدة المدعومة بالذكاء الاصطناعي التوليدي

في عام 2022، كان إطلاق ChatGPT إيذانًا ببدء حقبة جديدة من الابتكار في مجال الذكاء الاصطناعي التوليدي، ما دفع المؤسسات إلى البحث عن طرق للاستفادة من التقنية في تطبيقات الأعمال. كان ChatGPT روبوت محادثة مدعومًا بالذكاء الاصطناعي، ومدربًا على النماذج اللغوية الكبرى (LLMs)، يتفاعل مع المستخدمين بطريقة حوارية. ومنذ إطلاقه، سعت المؤسسات إلى تطبيق التقنية الأساسية على مختلف مشكلات الأعمال، بما في ذلك الأتمتة، وزيادة الإنتاجية، ومعارف العملاء.

وقد أصبحت المخاطر والتحديات المختلفة واضحة أيضًا. في المجال الطبي، على سبيل المثال، بينما ساعد على أتمتة بعض التشخيصات، إلا أنه أثار أيضًا مخاوف تتعلق بالخصوصية والأمان.1 علاوة على ذلك، لا تزال حالة تعرف بهلوسات الذكاء الاصطناعي قائمة، ما يجعل بعض نماذج الذكاء الاصطناعي التوليدي "تخترع" حقائق عندما لا تجد إجابة لسؤال.

ولكن بينما تستمر هذه المشكلات—وغيرها—، تواصل المؤسسات بمختلف أحجامها وعبر مختلف المجالات الاستثمار بشكل كبير في هذا المجال، باحثة عن طرق جديدة للاستفادة من إمكاناته. وفقًا لشركة Menlo Ventures، في الفترة من 2022 إلى 2023، ارتفع استثمار المؤسسات في الذكاء الاصطناعي التوليدي ستة أضعاف، من 2.3 دولار أمريكي إلى 13.8 مليار دولار أمريكي.

أكاديمية الذكاء الاصطناعي

صعود الذكاء الاصطناعي التوليدي في قطاع الأعمال

تعرّف على الصعود التاريخي للذكاء الاصطناعي التوليدي وما يعنيه بالنسبة إلى قطاع الأعمال.

تتسبب تطبيقات الذكاء الاصطناعي التوليدي في ظهور تحديات جديدة متعلقة بالبنية التحتية للذكاء الاصطناعي

بنية الذكاء الاصطناعي التحتية هو مصطلح يصف حلول الأجهزة والبرمجيات المطلوبة لتطوير تطبيقات الذكاء الاصطناعي. في عصر الذكاء الاصطناعي التوليدي، يجب أن تتطور البنية التحتية للذكاء الاصطناعي بحيث تُلبي المتطلبات العالية على موارد الحوسبة، وسعة تخزين البيانات، وعرض النطاق الترددي، وغير ذلك الكثير مما يرتبط بالتقنية. لكن المؤسسات في عجلة من أمرها لنشر تطبيقات الذكاء الاصطناعي التوليدي الجديدة، حتى إنها أحيانًا تغفل عن احتياجات الذكاء الاصطناعي وبنية البيانات التحتية.

بينما تسعى المؤسسات إلى الاستفادة من الذكاء الاصطناعي التوليدي وكل إمكاناته لأغراض الأعمال، يجب عليها إعادة النظر في الجوانب الرئيسية من نهجها المتبع في بنية البيانات وإستراتيجيتها.

تحويل البيانات غير المنظمة إلى بيانات منظمة

لتطوير تطبيق أعمال ناجح ومدعوم بالذكاء الاصطناعي التوليدي، عادة ما تحتاج المؤسسات إلى مزيج من البيانات المنظمة وغير المنظمة. البيانات المنظمة، المعروفة أيضًا بالبيانات الكمية، هي بيانات منسقة مسبقًا بحيث يمكن معالجتها بسهولة باستخدام خوارزميات التعلم الآلي التي تشغل تطبيقات الذكاء الاصطناعي التوليدي.

باستخدام نماذج التعلم الآلي المتقدمة، تحاكي الخوارزميات الطريقة التي يتعلم بها البشر من كميات كبيرة من البيانات (مجموعات البيانات) حتى يتمكنوا من فهم الأسئلة حول البيانات والرد من خلال إنشاء محتوى جديد.

في حين أن بعض البيانات التي تجمعها المؤسسات هي بالفعل منظمة (على سبيل المثال، معلومات العملاء والمعلومات المالية مثل الأسماء والتواريخ ومبالغ المعاملات)، إلا أن هناك قدرًا كبيرًا من البيانات غير منظم. البيانات غير المنظمة، والمعروفة أيضًا باسم البيانات النوعية، هي البيانات التي لا تحتوي على تنسيق محدد مسبقًا. البيانات غير المنظمة واسعة النطاق ويمكن أن تشمل ملفات الفيديو والصوت والنص من البريد الإلكتروني، وصفحات الويب، وحسابات وسائل التواصل الاجتماعي، وأجهزة استشعار إنترنت الأشياء (IOT)

مع توسع الاقتصاد الرقمي، تتزايد كمية البيانات غير المنظمة التي تجمعها المؤسسات بمعدل هائل. ووفقًا لمجلة Forbes، فإن 80% إلى 90% من البيانات التي تجمعها المؤسسات هي بيانات غير منظمة. وتُعد البيانات غير المنظمة غير مناسبة لأغراض التعلم الآلي ويجب تحويلها قبل استخدامها لتدريب نماذج الذكاء الاصطناعي.

يتطلب تحويل البيانات غير المنظمة إلى بيانات يمكن للكمبيوتر معالجتها واستخدامها لأغراض الأعمال استخراج المعلومات ذات الصلة وتنظيمها بتنسيق محدد مسبقًا. يؤدي حجم البيانات وتعقيدها إلى ظهور تحديات، كما أن بيئة إدارة البيانات الصعبة والالتزام بقوانين حوكمة البيانات قد يترتب عليهما تكاليف باهظة.

التعامل مع عالم حوكمة البيانات المعقد

حوكمة البيانات هي ممارسة تساعد على ضمان جودة وأمان وتوافر البيانات التي تخص المؤسسة من خلال مجموعات من السياسات والإجراءات. وقد أدى ظهور الذكاء الاصطناعي التوليدي والبيانات الكبيرة إلى وضع حوكمة البيانات وجميع متطلباتها في مقدمة اهتمامات المؤسسات الحديثة.

يؤدي الذكاء الاصطناعي التوليدي، بقدرته على إنشاء محتوى جديد بناءً على بيانات تدرب عليها، إلى ظهور متطلبات جديدة في جمع البيانات وتخزينها ومعالجتها بشكل آمن وقانوني.

الجودة

نظرًا إلى أن نماذج الذكاء الاصطناعي التوليدي مدربة على مجموعات بيانات هائلة، يجب أن تكون البيانات الموجودة في تلك المجموعات على أعلى مستوى من الجودة، ويجب أن تكون سلامتها لا جدال فيها. تؤدي حوكمة البيانات دورًا مهمًا في المساعدة على ضمان أن مجموعات البيانات التي تتدرب عليها نماذج الذكاء الاصطناعي التوليدي دقيقة وكاملة، وهذا عنصر أساسي في توليد إجابات يمكن الاعتماد عليها.

الامتثال

اعتمادًا على المجال والموقع، تواجه تطبيقات الأعمال المدعومة بالذكاء الاصطناعي التوليدي بيئة امتثال صارمة في كيفية استخدام البيانات. تنظم قواعد اللائحة العامة لحماية البيانات (GDPR)، على سبيل المثال، كيفية استخدام المؤسسات للبيانات الخاصة بسكان دول الاتحاد الأوروبي. وتؤدي الانتهاكات إلى غرامات وعقوبات كبيرة عند اختراق معلومات العميل بأي شكل من الأشكال.

في عام 2021، تكبدت شركة Google وشركات أخرى غرامة تُقدر بأكثر من مليار دولار لانتهاكها قوانين حماية البيانات المنصوص عليها في اللائحة العامة لحماية البيانات.

الشفافية

لكي يكون تطبيق الذكاء الاصطناعي التوليدي فعالاً، يجب أن يكون مصدر بياناته وكيفية تحويلها للاستخدام في الأعمال واضحًا ومرئيًا. تساعد حوكمة البيانات على ضمان وجود الوثائق—وأنها شفافة للمستخدمين—في كل خطوة من دورة حياة البيانات، بدءًا من الجمع ومرورًا بالتخزين والمعالجة والإخراج، حتى يفهم المستخدمون كيفية توليد الإجابات.

أفضل الممارسات لتطوير إستراتيجية بيانات تدعم تطبيقات الذكاء الاصطناعي التوليدي

يعتمد نجاح تطبيقات الذكاء الاصطناعي التوليدي على وجود إستراتيجية بيانات وبنية تحتية مناسبة لدعمها. وفيما يلي بعض أفضل الممارسات للمساعدة على ضمان النجاح.

ابدأ بطرح سؤال عمل محدد تحتاج مؤسستك إلى إجابة عنه

ونظرًا إلى طبيعة البيانات غير المنظمة—مصدرها وكيفية جمعها وتخزينها—تميل المؤسسات إلى جمع الكثير منها.

لكن هذا لا يعني أن كل ذلك سيكون مفيدًا لتطبيقات الذكاء الاصطناعي التوليدي. "ابدأ بطرح سؤال"، كما تنصح Margaret Graves، الباحثة الكبيرة في The IBM Center for the Business of Government. "ليس من الضروري أن يكون سؤالاً واحدًا فقط، بل يمكن أن يكون عدة أسئلة، ولكن حاول التركيز على الطرق المحددة التي سيؤدي من خلالها التطبيق الذي تريد إنشاءه إلى تعزيز ودعم مهمتك."

منذ إطلاق ChatGPT في عام 2022، كانت المؤسسات في عجلة من أمرها لتطبيق الذكاء الاصطناعي التوليدي على مجموعة من مشكلات الأعمال، بما في ذلك زيادة الإنتاجية، وتحديد المعارف، وتسريع التحول الرقمي. وبينما يمكن للتقنية معالجة هذه المجالات بالتأكيد، إلا أنها واسعة وقد تؤدي إلى تطوير المؤسسة لتطبيق يفتقر إلى التحديد.

كلما كانت مشكلة العمل أكثر تحديدًا، كان من الأسهل تحديد مجموعات البيانات ذات الصلة التي ستحتاج إلى تدريب نموذج الذكاء الاصطناعي التوليدي عليها، ونوع البنية التحتية للذكاء الاصطناعي التي ستحتاجها لدعم العملية.

صمم إستراتيجية تساعد على ضمان أن التطبيقات لديك تحتوي على البيانات التي تحتاجها

بمجرد أن تحدد المؤسسة أسئلة العمل التي تريد التركيز عليها في تطبيق الذكاء الاصطناعي التوليدي، يمكنها البدء في النظر في مجموعات البيانات ذات الصلة بتدريب نماذج الذكاء الاصطناعي. تشبه Graves هذا الجزء من العملية بالنظر إلى الطيف. وتضيف: "من ناحية، لديك بيانات داخلية خاصة سرية للغاية تحتاج إلى تدريب نموذجك عليها. ومن ناحية أخرى، لديك بيانات أكثر عمومية غير خاصة ولكن ستساعد تطبيقك على العمل بشكل أفضل."

يُعد عالم طلبات تقديم العروض (RFPs) مثالاً جيدًا على ذلك، حيث إنه أحد أكثر حالات استخدام الذكاء الاصطناعي التوليدي التي ظهرت في السنوات القليلة الماضية إلحاحًا. ستحتاج مؤسسات العلاقات بين الشركات التي تتطلع إلى إنشاء تطبيق ذكاء اصطناعي توليدي للمساعدة على أتمتة جوانب من عملية طلب تقديم العروض إلى التدريب على البيانات الداخلية وإلا فلن تتمكن من تقديم إمكانات الشركة الفريدة. لكن نموذج الذكاء الاصطناعي التوليدي نفسه سيحتاج أيضًا إلى التدريب على بيانات أكثر عمومية، مثل كيفية صياغة جملة وتنظيم إجاباته نحويًا، وإلا فلن تكون ردوده منطقية.

تقول Graves: "يجب الجمع بين كلا الجانبين في إستراتيجية البيانات لديك—مجموعات البيانات العامة والواسعة ومجموعات البيانات الداخلية الأكثر خصوصية أيضًا. وإلا فأنت تبني أداة وتلقي بالكثير من البيانات عليها وتنتظر ماذا سيحدث وهو ما يُعد مضيعة للمال والوقت."

الاستفادة من البيانات الخاصة بالمجال عند الحاجة

يمكن أن يساعد استخدام البيانات الخاصة بالمجال، والتي تتعلق بقطاع أو مجال معين، الشركات على إنشاء نماذج الذكاء الاصطناعي التي تركز أكثر على متطلبات العمل الخاصة بها. يقول Jason Prow، الشريك الأول في IBM Consulting: "يوجد تركيز على البيانات الخاصة بالمجال في الوقت الحالي عندما يتعلق الأمر بتدريب نماذج الذكاء الاصطناعي، على سبيل المثال في المجالات المالية أو الموارد البشرية. ومع توافر كل تلك البيانات، أصبح تنظيم نموذجك حول مجال معين أمرًا حساسًا."

تساعد الاستفادة من بيانات المجال في إنشاء نماذج الذكاء الاصطناعي على تخصيص النماذج بطرق تجعلها أكثر ملاءمة لاحتياجات العمل المحددة. وتُعد النماذج الخاصة بالمجال أكثر دقة وملاءمة لاحتياجات المستخدم ويمكن أن تؤدي إلى أداء عام أفضل لتطبيقات الذكاء الاصطناعي التوليدي ذات الصلة.

يمكن أن تكون البيانات الخاصة بالمجال تقنية ومعقدة، لذا تحتاج المؤسسات التي تسعى للاستفادة منها إلى التفكير في إضافة طبقة "دلالية"، وهي طبقة تجريدية في نماذج الذكاء الاصطناعي تساعد على ترجمتها. يقول Anthony Vachino، الشريك المساعد، IBM Consulting: "مجال الأدوية على وجه الخصوص يحتاج إلى الكثير من الوصف الدلالي." "تُجري الشركات المختلفة تجارب مختلفة، وتصفها الطبقة الدلالية بطرق يمكن أن تساعد على جعل البحث قابلاً للتطبيق على الشركات الأخرى حتى لا تضطر إلى تكراره.

تحديد موقع البنية التحتية لبياناتك بشكل إستراتيجي

سواء كانوا يستعدون للتحولات الجيوسياسية التي قد تعطل سلاسل التوريد أو الكوارث الطبيعية التي تهدد البنية التحتية الحيوية، بدأ قادة البيانات المعاصرون يأخذون في الحسبان أكثر من مجرد المواهب والتكلفة عند اختيار مكان التخزين وصلاحيات الوصول إلى البيانات. ووفقًا إلى IBM Institute of Business Value، يعتقد 60% من قادة الحكومات أن تكرار مشكلات سلسلة التوريد والبنية التحتية سيزداد في المستقبل، بينما يعتقد 70% أنها ستزداد في شدتها.

تتمتع المناطق المختلفة بمزايا مختلفة، ويجب أخذ أمور مثل المواهب ومنظومة البيانات والبنية التحتية والحوكمة والعوامل الجيوسياسية في الحسبان. المديرون التنفيذيون يلاحظون أنه: في العام الماضي، وفقًا لتقرير IBV نفسه، قال ما يقرب من 70% من المديرين التنفيذيين الذين شملهم الاستطلاع إنهم يتوقعون أن يغير الذكاء الاصطناعي أماكن تخصيص الموارد الرئيسية، بينما ارتفعت هذه النسبة هذا العام إلى 96%.

Dan Chenok، المدير التنفيذي في IBM Center for the Business of Government، مهتم بإمكانية استخدام البيانات الموزعة في تدريب نماذج الذكاء الاصطناعي التوليدي لأنها تسمح بتخزين البيانات والوصول إليها من أكثر من موقع. ويقول: "تسمح لك البيانات الموزعة بتدريب النموذج على البيانات الموجودة في مواقع متعددة، بينما يمكن الحفاظ على الأمن واللوائح من خلال ضوابط الوصول."

يتطلب دعم تطبيقات الذكاء الاصطناعي التوليدي نهجًا مفتوحًا وهجينًا

تساعد الحلول الحديثة والهجينة المؤسسات على إنشاء نماذج الذكاء الاصطناعي التي تناسب حل مشكلات أعمال محددة، ما يوفر المال والوقت والموارد الحساسة الأخرى. ويضيف Chenok: "عندما تدمجها عبر منصات متعددة، يمكنك توفير خدمات أفضل، خاصة إذا كنت مؤسسة تعمل في مواقع متعددة. وأفضل الحلول هي التي تساعدك على التوفيق بين كل شيء حتى يؤدي تطبيقك عمله." 

تتيح مستودعات بحيرات البيانات الهجينة المفتوحة للمستخدمين إمكانية مشاركة البيانات عبر البنية التحتية السحابية والمحلية—أينما كانت البيانات—بحيث يمكن الوصول إليها عبر تطبيقات الذكاء الاصطناعي التوليدي. مستودعات بحيرات البيانات هي منصات تدمج جوانب من مستودعات البيانات و بحيرات البيانات في حل موحد لإدارة البيانات.

بحيرات البيانات هي حلول منخفضة التكلفة لتخزين البيانات وهي مصممة للتعامل مع كميات هائلة من البيانات المنظمة وغير المنظمة، ومستودعات البيانات هي أنظمة تجمع البيانات من مصادر متعددة في موقع واحد لتحليلها. وعلى الرغم من أنها غير قابلة للتوسع مثل البحيرات أو المستودعات، فإن مستودعات بحيرات البيانات تميل لأن تكون أكثر انسيابية وأعلى أداءً وتتمكن من دعم مجموعة أوسع من أحمال التشغيل.

بالنسبة إلى المؤسسات التي تبحث عن حل أكثر شمولية، أصبحت منصات مثل Databricks وSnowflake وAmazon RedShift أكثر شهرة بسبب تعقيد عملية إعداد البيانات من أجل الذكاء الاصطناعي التوليدي وتطوير ونشر التطبيقات. تساعد الحلول الشاملة على إدارة البيانات، وتدريب النماذج، ونشر الحلول، ما يسمح للمؤسسات بطرح تطبيقات الذكاء الاصطناعي التوليدي مع قابلية التوسع والحوكمة المدمجين لمختلف حالات الاستخدام.

IBM watsonx.data هو مخزن بيانات مناسب لأغراض معينة ومبني على مستودع بحيرة بيانات مفتوح يزيد من قابلية توسع أحمال تشغيل الذكاء الاصطناعي التوليدي. يؤدي النهج المفتوح والهجين والمبني لغرض معين إلى تحسين التكامل مع أنواع قواعد البيانات المختلفة، ما يُمكّن المؤسسات من الاستفادة من البيانات المنتشرة عبر النظم البنائية والبيئات المختلفة، وعدم الانحصار في منطقة واحدة أو مجموعة واحدة من القواعد.

 

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
خدمات الذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا