SVM 如何运行

SVM 的工作原理是将数据映射到高维特征空间,这样即使数据不是线性可分,也可以对该数据点进行分类。找到类别之间的分隔符,然后以将分隔符绘制成超平面的方式变换数据。之后,可用新数据的特征预测新记录所属的组。

例如,请考虑下图,图中的数据点落在两个不同的类别中。

图 1. 原始数据集
原始数据集

可以使用一条曲线分隔这两个类别,如下图所示。

图 2. 添加了分隔符的数据
添加了分隔符的数据

转换后,可以使用超平面定义这两个类别之间的边界,如下图所示。

图 3. 转换后的数据
转换后的数据

用于变换的数学函数称为 函数。IBM® SPSS® Modeler 中的 SVM 支持下列核类型:

  • 线性
  • 多项式
  • 径向基函数 (RBF)
  • Sigmoid

如果数据的线性分隔比较简单,那么建议使用线性核函数。在其他情况下,应当使用其他函数。在所有情况下,您都需要尝试使用不同的函数才能获得最佳模型,因为每一个函数均使用不同的算法和参数。