Data-Mining-Prozess
Der Data-Mining-Prozess umfasst unterschiedliche Schritte wie die Erzeugung und der Test der Mining-Modelle oder die Arbeit mit den Mining-Modellen.
Sie beginnen ein Data-Mining-Projekt mit einem klar strukturierten Business-Intelligence-Projektplan. Die Geschäftsanalytiker in Ihrem Unternehmen definieren ein Problem, das sie lösen wollen, und ein endgültiges Business-Intelligence-Ziel, das sie erreichen wollen. Je besser die ursprüngliche Formulierung ist, desto klarer lauten Ihre Richtlinien dazu, welche Daten und welche Mining-Funktionen Sie zum Erreichen des gewünschten Ergebnisses einsetzen.
- Datenauswahl und -aufbereitung
- Erzeugung des Data-Mining-Modells (auch als Trainingsphase bezeichnet)Sie erzeugen ein Data-Mining-Modell auf der Grundlage einer bestimmten Menge von
Eingabedaten.Beim Modellerstellungsprozess geben Sie nach der Datenaufbereitung Ihre Entscheidungen zu folgenden Fragen an:
- Wo befinden sich die Eingabedaten?
- Welche Felder in den Eingabedaten sind relevant?
- Welche Einstellungen sollen für die jeweilige eingesetzte Mining-Funktion verwendet werden?
- Wo soll das endgültige Modell gespeichert werden?
- Benutzerdefinierte Methoden
- Gespeicherte Prozeduren
- Benutzerdefinierte Funktionen
- Testen eines Modells und Analyse seiner Qualität
Sie können ein Klassifikations- oder Regressionsmodell testen. Anschließend können Sie die Qualität des Modells analysieren.
- Aus der Arbeit mit einem Modell gewonnene Informationen:
- Visualisierung der Ergebnisse
Sie können die Data-Mining-Ergebnisse anzeigen, um sie zu analysieren und zu interpretieren. Mit Intelligent Miner Visualizer können Sie die Ergebnisse anzeigen und analysieren.
- Scoring-Datensätze
Sie wenden ein Modell auf andere Daten der Anwendungsphase des Data-Mining an. Verwenden Sie Intelligent Miner , um die Datensätze zu bewerten.
- Analyse eines Modells und Vorbereitung für weitere Verarbeitungsschritte
Sie können mit verschiedenen Funktionen Informationen zum Modell in Tabellen abrufen, die Sie mit anderen Anwendungsprogrammen weiterverarbeiten können.
- Visualisierung der Ergebnisse