状态监测(神经网络/C5.0)
本示例涉及监测机器的状态信息以及与识别和预测故障状态相关的问题。其中的数据通过虚构模拟创建得到并包括大量按时间测量的连续序列。每个记录都是与计算机的以下方面相关的快照报告:
- 时间。整数。
- 功率。整数。
- 温度。整数。
- 压力。0 表示正常,1 表示瞬时压力报警。
- 正常运行时间。上次运行时间。
- 状态。正常情况下是 0,发生错误时更改为错误代码(101、202 或 303)。
- 结果。在此时间序列中显示的错误代码,或者为 0(如果未发生错误)。(提供这些代码唯一的好处是可在事后了解出现的错误。)
此示例使用名为 condplot.str 和 condlearn.str 的流,这些流引用名为 COND1n 和 COND2n 的数据文件。这些文件可在任何 IBM® SPSS® Modeler 安装的 Demos 目录中找到。此目录可通过 WindowsIBM SPSS Modeler 程序组进行访问。文件 condplot.str 和 condlearn.str 都位于目录 streams 下。
对于每个时间序列,都会对应一列正常运行期间产生的记录,后跟一列非正常运行期间产生的故障记录,如下表所示:
| 时间 | 幂 | 温度 | 压力 | 正常工作时间 | 状态 | 结果 |
|---|---|---|---|---|---|---|
| 0 | 1059 | 259 | 0 | 404 | 0 | 0 |
| 1 | 1059 | 259 | 0 | 404 | 0 | 0 |
| ... | ||||||
| 51 | 1059 | 259 | 0 | 404 | 0 | 0 |
| 52 | 1059 | 259 | 0 | 404 | 0 | 0 |
| 53 | 1007 | 259 | 0 | 404 | 0 | 303 |
| 54 | 998 | 259 | 0 | 404 | 0 | 303 |
| ... | ||||||
| 89 | 839 | 259 | 0 | 404 | 0 | 303 |
| 90 | 834 | 259 | 0 | 404 | 303 | 303 |
| 0 | 965 | 251 | 0 | 209 | 0 | 0 |
| 1 | 965 | 251 | 0 | 209 | 0 | 0 |
| ... | ||||||
| 51 | 965 | 251 | 0 | 209 | 0 | 0 |
| 52 | 965 | 251 | 0 | 209 | 0 | 0 |
| 53 | 938 | 251 | 0 | 209 | 0 | 101 |
| 54 | 936 | 251 | 0 | 209 | 0 | 101 |
| ... | ||||||
| 208 | 644 | 251 | 0 | 209 | 0 | 101 |
| 209 | 640 | 251 | 0 | 209 | 101 | 101 |
通常,大多数数据挖掘工程都会经历以下过程:
- 检查数据以确定哪些属性可能与相关状态的预测或识别有关。
- 保留这些属性(如果已存在),或者在必要时导出这些属性并将其添加到数据中。
- 使用结果数据训练规则和神经网络。
- 使用独立测试数据测试经过训练的系统。