数据准备简介

随着计算系统能力的提高,对信息的需要成比例增长,导致收集的数据中出现更多的个案、更多的变量以及更多的数据输入错误。这些错误会损害作为数据仓储最终目标的预测模型的预测,因此您需要使数据保持“干净”。不过,数据仓储中的数据量的增长已经大大超出了手动验证个案的能力,而这对于实现自动化的数据验证过程来说十分关键。

“数据准备”附加模块允许您标识活动数据集中的异常个案和无效个案、变量和数据值,并准备建模数据。