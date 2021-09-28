في حين أنه عادةً ما يتم الخلط بين التعرف على الكلام والتعرف على الصوت، إلا إن التعرف على الكلام يركز على ترجمة الكلام من صيغة لفظية إلى صيغة نصية، بينما يسعى التعرف على الصوت إلى التعرف على صوت المستخدم فقط.

كان لشركة IBM دور بارز في مجال التعرُّف على الكلام منذ بداياتها، حيث أطلقت "Shoebox" في عام 1962. كان لدى هذه الآلة القدرة على التعرُّف على 16 كلمة مختلفة، ما أدى إلى تطوير العمل الأوَّلي من Bell Labs من الخمسينيات. ومع ذلك، لم تتوقف شركة IBM عند هذا الحد، بل واصلت الابتكار على مر السنين، حيث أطلقت تطبيق VoiceType Simply Speaking في عام 1996. يحتوي برنامج التعرُّف على الكلام هذا على مفردات مكوَّنة من 42,000 كلمة، ويدعم الإنجليزية والإسبانية، ويتضمن قاموسًا إملائيًا من 100,000 كلمة.

بينما كان لدى تقنيات الكلام مفردات محدودة في بداياتها، فإنها تُستخدم اليوم في عدد واسع من الصناعات، مثل السيارات والتكنولوجيا والرعاية الصحية. لم يتوقف اعتمادها عن التسارع في السنوات الأخيرة، وذلك بفضل التطورات في التعلم العميق والبيانات الكبيرة. تُظهر الأبحاث أنه من المتوقع أن تبلغ قيمة هذه السوق نحو 24.9 مليار دولار أمريكي بحلول عام 2025.