اعتمادًا على الغرض منها وأجهزة الاستشعار المتوفرة، يمكن لأنظمة الذكاء الاصطناعي إدراك العالم من خلال الرؤية، والصوت، والنص، والعوامل البيئية، والتحليل التنبؤي.
تُتيح هذه الأنواع المختلفة من الإدراك لوكلاء الذكاء الاصطناعي التفاعل مع العالم من حولهم، ما يؤدي إلى تحسين مهام سير العمل، وتعزيز الأتمتة وغيرها.
الإدراك البصري
يمكِّن الإدراك البصري الوكلاء من تفسير العالم والاستجابة له من خلال الصور ومقاطع الفيديو والبيانات المرئية الأخرى. تُحاكي هذه القدرة الرؤية البشرية، ما يمكِّن الذكاء الاصطناعي من التعرُّف على الأشياء وفهم البيئات المحيطة.
أدّت التطورات في رؤية الكمبيوتر والتعلُّم العميق إلى تعزيز الإدراك البصري في الذكاء الاصطناعي، ما أدى إلى إنجازات في مجالات متعددة مثل المركبات ذاتية القيادة، والرعاية الصحية، والتشغيل الآلي.
ومع تطوُّر نماذج الذكاء الاصطناعي، سيُظهر وكلاء الذكاء الاصطناعي فهمًا بصريًا يشبه الفهم البشري، ما يمكِّنهم من العمل بشكل مستقل وآمن في السيناريوهات الواقعية المعقدة.
الإدراك السمعي
يُتيح الإدراك السمعي للوكلاء معالجة الصوت وفهمه. تُتيح هذه القدرة للذكاء الاصطناعي تفسير الكلام والتعرُّف على الأصوات المحيطة والتفاعل مع المستخدمين من خلال التواصل الصوتي.
وقد ساهمت التطورات في معالجة اللغة الطبيعية (NLP) والتعلُّم العميق في تحسُّن الإدراك السمعي للذكاء الاصطناعي بشكل كبير، ما أدى إلى تطبيقات واسعة للذكاء الاصطناعي في المساعدين الافتراضيين، وأدوات إمكانية الوصول، وأنظمة المراقبة.
تُعَد تقنية التعرف التلقائي على الكلام (ASR) إحدى التقنيات الأساسية وراء الإدراك السمعي للذكاء الاصطناعي. تعمل أنظمة التعرُّف التلقائي على الكلام (ASR) على تحويل الحديث إلى نص مكتوب، ما يمكِّن المساعدين الصوتيين مثل Siri وAlexa وGoogle Assistant من فهم الأوامر وتنفيذها.
تعتمد هذه الأنظمة على الشبكات العصبية ومجموعات البيانات الكبيرة لتحسين الدقة، حتى في البيئات الصاخبة أو مع اختلاف اللهجات.
إلى جانب الكلام، يمكن للذكاء الاصطناعي تحليل أصوات أخرى، مثل تشخيص الحالات الطبية من خلال تحليل أصوات الجهاز التنفسي، أو اكتشاف الحالات الشاذة في معدات المصانع.
الإدراك النصي
يُتيح الإدراك النصي للوكلاء معالجة النصوص وتفسيرها وإنشاءَها. يستخدم الوكلاء تقنية معالجة اللغة الطبيعية لاستخراج المعنى من النص وتسهيل التواصل في التطبيقات المختلفة، مثل روبوت المحادثة ومحركات البحث وأدوات التلخيص المؤتمتة . وقد أسهم التقدم في النماذج اللغوية الكبيرة القائمة على المحولات، مثل GPT-4، في تحسين قدرة الذكاء الاصطناعي على فهم النصوص والاستدلال بها.
يُعَد الفهم الدلالي أحد المكونات الأساسية للإدراك النصي، إذ يمكِّن الذكاء الاصطناعي من تجاوز التعرُّف على الكلمات إلى فهم معناها ضمن سياق محدد. وهذا أمر ضروري في حالات الاستخدام مثل الترجمة الآلية، وتحليل المشاعر، وتحليل المستندات القانونية أو الطبية.
بالإضافة إلى ذلك، تُتيح تقنية التعرُّف على الكيانات المُسمّاة (NER) للذكاء الاصطناعي تحديد أشخاص وأماكن ومؤسسات محددة، ما يعزز قدرته على استخراج رؤى قيّمة من مجموعات البيانات الكبيرة، وهي قدرة مهمة في مجالات مثل التسويق وتجربة العملاء.
الإدراك البيئي
يختلف الإدراك البيئي في وكلاء الذكاء الاصطناعي عن الإدراك السمعي والبصري، لأنه يتضمن فهمًا أوسع ومتعدد الوسائط للبيئة المحيطة، من خلال دمج بيانات من أجهزة استشعار متنوعة تتجاوز الرؤية والصوت فقط.
لقد حسَّنت التطورات في رؤية الكمبيوتر، ودمج المستشعرات، والتعلُّم الآلي قدرة الذكاء الاصطناعي بشكل كبير على إدراك العالم المادي والتفاعل معه.
وعلى عكس الرؤية أو السمع وحدهما، فإن الإدراك البيئي يُدمج عدة مدخلات حسية (الرؤية، والصوت، وLiDAR، واللمس) لتكوين فهم شامل للبيئة. ويُتيح ذلك لوكلاء الذكاء الاصطناعي رسم خرائط لمحيطهم والتنقل فيه بالاستناد إلى فيزياء العالم الحقيقي، بينما يركِّز الإدراك البصري والسمعي أكثر على التعرُّف السلبي.
وفي حين تُحاكي الرؤية والسمع قدرات البشر، يمتد الإدراك البيئي إلى ما هو أبعد من ذلك من خلال دمج الرادار، وأجهزة استشعار الحرارة، وكشف الضغط، ما يمكِّن الذكاء الاصطناعي من إدراك أشياء يعجز البشر عن ملاحظتها.
الإدراك التنبؤي
يُتيح الإدراك التنبؤي للوكلاء توقُّع الأحداث المستقبلية استنادًا إلى البيانات التي تمت ملاحظتها. وعلى عكس الإدراك التقليدي، الذي يركِّز على تفسير البيئة الحالية، يمكِّن الإدراك التنبؤي الذكاء الاصطناعي من التنبؤ بالتغيرات، واستنتاج النوايا، وضبط السلوك بشكل استباقي.
تقع القدرات التنبؤية في الذكاء الاصطناعي غالبًا ضمن نطاق التحليل أو التنبؤ أو الاستدلال، وليس الإدراك بالمعنى التقليدي. ومع ذلك، يمكن اعتبار "الإدراك التنبؤي" فئة مميزة، حيث لا يكتفي الذكاء الاصطناعي برصد البيئة، بل يتوقّع كيف ستتغير، ما يدمج الإدراك مع التفكير الاستشرافيّ.
في جوهر الإدراك التنبؤي توجد نماذج التعلُّم الآلي (ML)، والتعلُّم العميق، والنمذجة الاحتمالية، والتعلُّم المعزز. تعمل أنظمة الذكاء الاصطناعي على تحليل البيانات التاريخية والبيانات في الوقت الفعلي للتعرُّف على الأنماط وإجراء التنبؤات.
بينما تعتمد التحليلات التنبؤية على البيانات التاريخية والنماذج الإحصائية، فإن الإدراك التنبؤي يجمع بين الرصد في الوقت الفعلي والتنبؤ، ما يجعله أكثر ديناميكية واستجابةً للبيئة المحيطة. وعلى الرغم من كونه مفهومًا هجينًا، فإن الإدراك التنبؤي يربط بين الرصد والرؤية المستقبلية، ما يُتيح لوكلاء الذكاء الاصطناعي فهم الحاضر، والاستعداد للمستقبل أيضًا في الوقت الفعلي.