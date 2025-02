Boolesche Modelle sind vielleicht die einfachsten, ja sogar die simpelsten IR-Modelle. Sie verwenden, wie zuvor beschrieben, eine Wörterbuchstruktur von Indexbegriffen. Vorhandensein von Wörtern aus der Suchanfrage eines Benutzers in den abgerufenen Dokumenten. Wenn ein Benutzer z. B. die Anfrage „Jazz AND Dancing“ stellt, ruft das boolesche Modell nur die Dokumente ab, die die Wörter Jazz AND Dancing in Kombination enthalten. Boolesche Modelle berücksichtigen dabei nur das Vorhandensein oder Fehlen von Wörtern in einem Dokument; partielle Übereinstimmungen gibt es in booleschen Retrievalsystemen nicht. Textvorverarbeitungstechniken wie Stemming und Lemmatization können dieses Problem morphologischer Varianten lösen – wie z. B. Dokumente, die dance, dances, oder dancer enthalten, anstatt nur die Abfrage dancing des Benutzers.

Wie bereits erwähnt, berücksichtigen Boolesche Modelle nur das Vorhandensein und Fehlen von Wörtern. Bei diesem binären Entscheidungskriterium fehlt eine Bewertungsskala, um zu bestimmen, welche Dokumente für die Anfrage eines Benutzers am relevantesten sind. Eine mögliche Lösung besteht darin, Dokumente anhand der Häufigkeit der darin enthaltenen Suchbegriffe zu bewerten. Mit anderen Worten: Je häufiger in einem Dokument die Begriffe Jazz und Tanzen vorkommen, desto relevanter ist das Modell für die Suchanfrage des Benutzers. Eine höhere Häufigkeit der Begriffe bedeutet jedoch nicht unbedingt eine größere Relevanz. Trotz dieses potenziellen Nachteils wurden Boolesche Modelle aufgrund ihrer einfachen Implementierung in vielen IR-Systemen verwendet.12