قد تكون نماذج التضمين المستقلة عروضًا مُدرَّبة مسبقًا أو مُدرَّبة من الصفر على مهام أو بيانات تدريب محددة. وعادةً ما يستفيد كل شكل من أشكال البيانات من بنية شبكة عصبية معينة، ولكن استخدام خوارزمية معينة لمهمة معينة غالبًا ما يكون "أفضل الممارسات" وليس قاعدة صريحة.
في بعض السيناريوهات، تكون عملية التضمين جزءًا من شبكة عصبية أكبر. على سبيل المثال، في الشبكات العصبية التلافيفية للتشفير وفك التشفير (CNNs) المستخدمة لمهام مثل تقسيم الصور، فإن عملية تحسين الشبكة بأكملها لتقديم تنبؤات دقيقة تستلزم تدريب طبقات التشفير لإخراج تضمينات متجهات فعَّالة للصور المُدخلة.
النماذج المدربة مسبقًا
بالنسبة للعديد من حالات الاستخدام ومجالات الدراسة، يمكن للنماذج المدربة مسبقًا توفير تضمينات مفيدة يمكن أن تعمل كمدخلات للنماذج المخصصة أو قواعد بيانات المتجه. يتم تدريب نماذج المصدر المفتوح هذه عادةً على مجموعة ضخمة وواسعة من بيانات التدريب لتعلم التضمينات المفيدة للعديد من المهام اللاحقة مثل التعلم قليل الأمثلة أو التعلم بدون أمثلة.
بالنسبة للبيانات النصية، يمكن تدريب نماذج تضمين الكلمات الأساسية مفتوحة المصدر مثل Word2Vec من Google أو Global Vectors (GloVe) من جامعة ستانفورد من البداية، ولكن يتم تقديمها أيضًا في متغيرات تم تدريبها مسبقًا على بيانات النص العام مثل Wikipedia و Common Crawl. وبالمثل، فإن النماذج اللغوية الكبيرة (LLMs) للتشفير-فك التشفير التي تُستخدم غالبًا للتضمينات، مثل BERT ومتغيراته العديدة، يتم تدريبها مسبقًا على كمية هائلة من البيانات النصية.
بالنسبة لمهام رؤية الكمبيوتر، يمكن تكييف نماذج تصنيف الصور المدربة مسبقًا مثل ImageNet أو ResNet أو VGG لتضمين المخرجات ببساطة عن طريق إزالة طبقة التنبؤ النهائية المتصلة بالكامل.
نماذج التضمين المخصصة
تستفيد بعض حالات الاستخدام، لا سيما تلك التي تنطوي على مفاهيم غامضة أو فئات جديدة من البيانات، من الضبط الدقيق للنماذج المدربة مسبقًا أو تدريب نماذج التضمين المخصصة بالكامل.
المجالات القانونية والطبية هي أمثلة بارزة على المجالات التي غالبًا ما تعتمد على المفردات الغامضة والمتخصصة للغاية أو قواعد المعرفة أو الصور التي من غير المحتمل أن تكون قد أدرجت في بيانات التدريب للنماذج الأكثر عمومية. يمكن أن يساعد استكمال المعرفة الأساسية للنماذج المدربة مسبقًا من خلال مزيد من التدريب على أمثلة خاصة بالمجال في مساعدة النموذج على إخراج تضمينات أكثر فعالية.
في حين يمكن تحقيق ذلك أيضاً من خلال تصميم بنية شبكة عصبية مخصصة أو تدريب بنية معروفة من الصفر، إلا أن القيام بذلك يتطلب موارد ومعرفة مؤسسية قد تكون بعيدة المنال بالنسبة لمعظم المؤسسات أو الهواة.