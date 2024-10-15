分类传统上是一种 监督式机器学习 ，这意味着它使用 带标签的数据 来训练模型。在监督学习中，训练数据中的每个数据点都包含输入变量（也称为自变量或特征）和输出变量或标签。

在分类训练中，模型的任务是理解特征与类标签之间的关系，然后将这些标准应用于未来的数据集。分类模型使用每个数据点的特征及其类标签来解读每个类的特征。用数学术语来说，该模型将每个数据点视为一个元组 x。元组是一种有序的数值序列，表示为 x = (x1, x2, x3…xn)。

元组中的每个值都是数据点的特征。通过使用该方程对训练数据进行映射，模型能够学习哪些特征与每个类标签相关联。

训练的目的是尽量减少预测建模过程中的误差。 梯度下降 算法通过最小化预测结果与实际结果之间的差异来训练模型。之后模型可以通过更多训练进行 微调 ，以执行更具体的任务。

无监督学习 方法在分类问题上一直是近期研究的重点。无监督学习方法使模型能够自主发现未标记数据中的模式。标签的缺失是 无监督学习与监督学习 的主要区别。