CRISP-DM-Hilfe - Übersicht

CRISP-DM steht für Cross-Industry Standard Process for Data-Mining und ist eine in der Branche bewährte Methode zur Anleitung Ihrer Data-Mining-Arbeit.

  • Als Methodologie umfasst CRISP-DM Beschreibungen der typischen Phasen eines Projekts, die in jeder Phase auszuführenden Arbeiten und eine Erläuterung der Beziehungen zwischen diesen Aufgaben.
  • Als Prozessmodell bietet CRISP-DM einen Überblick über den Data-Mining-Lebenszyklus.
Abbildung 1. Data-Mining-Lebenszyklus
Data-Mining-Lebenszyklus

Das Lebenszyklusmodell setzt sich aus sechs Phasen zusammen. Mit Pfeilen werden die wichtigsten und häufigsten Abhängigkeiten zwischen den Phasen dargestellt. Die Reihenfolge der Phasen ist variabel. Es ist sogar so, dass in den meisten Projekten bei Bedarf zwischen den einzelnen Phasen vor- und zurückgewechselt wird.

Das CRISP-DM-Modell ist flexibel und kann einfach an die jeweiligen Bedürfnisse angepasst werden. Wenn Ihr Unternehmen beispielsweise Geldwäsche aufdecken möchte, ist es sehr wahrscheinlich, dass Sie große Datenmengen ohne spezifisches Modellierungsziel durchsuchen. Statt auf die Modellierung konzentriert sich Ihre Arbeit auf die Exploration und Visualisierung von Daten, um verdächtige Muster bei Finanzdaten aufzudecken. Mit CRISP-DM können Sie ein Data-Mining-Modell erstellen, das Ihre spezifischen Anforderungen erfüllt.

In solchen Fällen sind die Modellierungs-, Evaluierungs- und Bereitstellungsphasen möglicherweise weniger relevant als die Phasen zur Aufbereitung und Interpretation von Daten. Es ist jedoch nach wie vor wichtig, einige der in späteren Phasen aufgeworfenen Fragen für die langfristige Planung und zukünftige Data-Mining-Ziele zu berücksichtigen.