تحجب أنظمة استرجاع المستندات المنطقية أي شكل من أشكال التطابق الجزئي. تعالج النماذج الجبرية والاحتمالية هذه المشكلة من خلال تحديد أوزان غير ثنائية لمصطلحات الفهرس.
من النماذج الجبرية التمثيلية نموذج فضاء المتجهات. في هذا النهج، يمثل نظام استرجاع المعلومات المستندات والاستعلامات كمتجهات في فضاء متجهات متعدد الأبعاد. في هذا الفضاء، من المرجح أن تكون مصطلحات الفهرس هي عناصر فضاء المتجهات، وتُرسم الاستعلامات والمستندات في هذا الفضاء وفقًا لمعدل وجود مصطلحات الفهرس وتكرارها. يحسب نظام استرجاع المعلومات مقدار التشابه بين استعلام البحث والمستندات على حسب مدى قربها في فضاء المتجهات.
يوجد عدد من المقاييس المستخدمة لتحديد درجة القرب في نموذج فضاء المتجهات، مثل مقياس Jaccard والضرب القياسي. لكن أكثر هذه المقاييس انتشارًا تشابه جيب التمام، الذي تمثِّله الصيغة التالية:
في هذا المقياس، تُشير A وB إلى متجهين في فضاء المتجهات. حيث يمكن أن تكون درجة تشابه جيب التمام أي قيمة بين -1 و1. فكلما زادت درجة جيب التمام، دلّ ذلك على زيادة التشابه بين العنصرين.
يعرض نموذج فضاء المتجهات بنظام استرجاع المعلومات المستندات بالترتيب على حسب درجة التشابه المُقدرة. وبهذه الطريقة، تسمح أنظمة استرجاع المعلومات الجبرية، مثل نموذج فضاء المتجهات، بالتطابق الجزئي، ما قد يوفر شكلاً أكثر دقة أو وضوحًا لاسترجاع المعلومات.13