Tipps für die Kategorieerstellung

Um Sie dabei zu unterstützen, bessere Kategorien zu erstellen, finden Sie hier einige Tipps, die Ihnen helfen, Entscheidungen zu Ihrem Ansatz zu treffen.

Tipps zum Verhältnis zwischen Kategorien und Dokumenten

Die Kategorien, denen Dokumente und Datensätze zugewiesen werden, schließen sich bei der qualitativen Textanalyse nicht oft gegenseitig aus. Dafür gibt es mindestens zwei Gründe:

  • Zunächst gilt eine allgemeine Faustregel, die besagt: Je länger das Textdokument bzw. der Datensatz, desto eindeutiger sind die darin ausgedrückten Ideen und Meinungen. Dadurch wird die Wahrscheinlichkeit, dass ein Dokument oder Datensatz mehreren Kategorien zugewiesen werden kann, stark erhöht.
  • Zum anderen gibt es häufig verschiedene Möglichkeiten zur Gruppierung und Interpretation von Textdokumenten oder Datensätzen, die nicht logisch getrennt sind. Bei einer Umfrage mit offenen Fragen zur politischen Haltung des Befragten können wir Kategorien wie liberal und konservativ oder links und rechts sowie speziellere Kategorien wie sozialliberal, fiskalkonservativ usw. erstellen. Diese Kategorien müssen sich nicht gegenseitig ausschließen und brauchen nicht erschöpfend zu sein.

Tipps zur Anzahl der zu erstellenden Kategorien

Die Kategorieerstellung sollte sich direkt aus den Daten ergeben: Wenn Sie interessante Aspekte in Bezug auf Ihre Daten feststellen, können Sie eine Kategorie erstellen, die diese Informationen widerspiegelt. Im Allgemeinen gibt es keine empfohlene Obergrenze für die Anzahl der zu erstellenden Kategorien. Es ist jedoch durchaus möglich, so viele Kategorien zu erstellen, dass sie nicht mehr handhabbar sind. Es gelten zwei Prinzipien:

  • Kategoriehäufigkeit. Damit eine Kategorie sinnvoll eingesetzt werden kann, muss sie eine Mindestanzahl an Dokumenten bzw. Datensätzen enthalten. Ein oder zwei Dokumente können sehr interessante Aspekte enthalten, doch wenn es sich dabei um ein oder zwei von 1.000 Dokumenten handelt, sind die darin enthaltenen Informationen mit großer Wahrscheinlichkeit nicht häufig genug in der Grundgesamtheit vorhanden, um von praktischem Nutzen zu sein.
  • Komplexität. Je mehr Kategorien Sie erstellen, desto mehr Informationen müssen Sie nach Abschluss der Analyse überprüfen und zusammenfassen. Sehr viele Kategorien vergrößern zwar die Komplexität, führen jedoch nicht unbedingt zu zusätzlichen nützlichen Details.

Leider gibt es keine Regeln zur Ermittlung, ab wann zu viele Kategorien vorliegen oder wie viele Datensätze mindestens pro Kategorie vorhanden sein sollen. Sie müssen diese Festlegungen je nach den Anforderungen der jeweiligen Situation treffen.

Wir können jedoch einige Ratschläge für den Anfang geben. Die Anzahl der Kategorien sollte zwar nicht übermäßig hoch sein, in den frühen Phasen einer Analyse ist es jedoch besser, eher zu viele als zu wenige Kategorien zu verwenden. Es ist einfacher, Kategorien, die sich relativ ähnlich sind, zusammenzufassen, als Fälle in neue Kategorien abzuspalten. Daher ist eine Strategie, die von relativ vielen Kategorien ausgeht und zu einer Verringerung ihrer Zahl führt, normalerweise die beste Vorgehensweise. Angesichts des iterativen Charakters des Textminings und der Leichtigkeit, mit der es mithilfe dieses Softwareprogramms durchgeführt werden kann, stellt eine hohe Kategorienzahl für den Anfang kein Problem dar.