بمجرد تقليل أبعاد النموذج من خلال SVD، تقارن خوارزمية LSA المستندات في مساحة دلالية ذات أبعاد أقل باستخدام تشابه جيب التمام. تتضمن الخطوة الأولى في مرحلة المقارنة هذه تعيين المستندات في مساحة المتجه. هنا، تعامل LSA النصوص باعتبارها نموذجًا bag of words . وتقوم الخوارزمية برسم كل نص من مجموعة النصوص أو المجموعات النصية على هيئة متجه مستند، مع الكلمات الفردية من المصفوفة المختصرة كأبعاد لهذا المتجه. يتجاهل التخطيط ترتيب الكلمات والسياق، مع التركيز بدلًا من ذلك على عدد مرات حدوث الكلمات وعدد مرات وجودها عبر المستندات.5
مع نماذج Bag of words القياسية، يمكن أن يكون للكلمات غير ذات الصلة دلاليًا (على سبيل المثال، كلمات مثل the وsome، وكلمات أخرى مماثلة) أعلى تردد للمصطلح، وبالتالي أكبر وزن في النموذج. تكرار المصطلح مع عكس تكرار المستند (TF-IDF) هو إحدى التقنيات لتصحيح هذا الأمر. يقوم بذلك من خلال أخذ انتشار الكلمة في جميع المستندات في مجموعة النصوص في الاعتبار، ومن ثم وزن الكلمات في كل مستند وفقًا لانتشارها عبر كامل المجموعة.6
بمجرد رسم المستندات في مساحة المتجهات، تستخدم خوارزمية LSA مقياس تشابه جيب التمام لمقارنتها. يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين في الفضاء الاتجاهي. يمكن أن تكون أي قيمة بين -1 و1. كلما ارتفعت درجة جيب التمام، زاد تشابه الوثيقتين. يتم تمثيل تشابه جيب التمام بهذه الصيغة، حيث a و b يشيران إلى متجهين للمستند:7