Die boolesche Dokumentensuche verhindert jede Form von Teilübereinstimmung. Algebraische und probabilistische Modelle lösen dieses Problem, indem sie den Indexbegriffen nicht-binäre Gewichte zuweisen.
Ein repräsentatives algebraisches Modell ist das Vektorraummodell. Bei diesem Ansatz stellt das IR-System Dokumente und Abfragen als Vektoren in einem mehrdimensionalen Vektorraum dar. In diesem Raum sind Indexbegriffe wahrscheinlich Merkmale des Vektorraums, und Abfragen und Dokumente werden entsprechend der Präsenz und Häufigkeit, mit der sie Indexbegriffe enthalten, in diesem Raum dargestellt. Das IR-System berechnet die Ähnlichkeit zwischen einer Suchanfrage und Dokumenten anhand ihrer Nähe im Vektorraum.
Es gibt eine Reihe von Metriken zur Bestimmung der Nähe in einem Vektorraummodell, wie z. B. Jaccard und das Skalarprodukt. Einer der häufigsten ist jedoch die Kosinus-Ähnlichkeit, die durch die folgende Formel dargestellt wird:
Hierbei stehen x und y für zwei Vektoren im Vektorraum. Der Kosinus-Ähnlichkeitswert kann einen beliebigen Wert zwischen -1 und 1 annehmen. Je höher der Kosinus-Wert, desto ähnlicher sind sich zwei Elemente.
Das IR-Vektorraummodell gibt Dokumente in der Reihenfolge ihres gemessenen Ähnlichkeitsgrades zurück. Auf diese Weise ermöglichen algebraische IR-Systeme wie das Vektorraummodell einen partiellen Abgleich, der möglicherweise eine präzisere oder nuanciertere Form des Informationsabrufs darstellt.13