数据库内机器学习
借助机器学习,您可以使用 Db2® 数据库中的数据来创建统计模型。 机器学习是用于解决复杂问题的功能强大的解决方案。
注: 此功能从 Db2 V 11.5.4开始可用。
机器学习解决方案的用例包括:
- 现有解决方案需要很长的规则列表的问题 - 机器学习算法通常可以简化问题,胜过传统方法。
- 传统方法未提供满意解决方案的问题。
- 波动很大的环境。
- 分析大量复杂数据以获取洞察。
- 学习和利用数据中的“潜在”或“隐藏”特征,否则人类和传统统计方法将无法发现这些特征。
通常,机器学习分为三类:
- 监督学习
- 使用您事先就已了解输出值将是什么的“参考标准”来执行监督学习。 这些参考标准值称为“标签”或“目标”。 例如,当尝试预测信用卡欺诈时,训练数据将包括过去的交易,这些交易肯定具有欺诈性(目标)。
- 强化学习
- 通过强化学习,机器或“代理”观察环境,执行“操作”,获得“奖励”,然后学习根据将产生最大“奖励”的结果来决定要进一步执行的操作。 强化学习与监督学习不同,因为强化学习具有与特定“操作”相关的“奖励”概念的先验知识。 此外,此方法不依赖于带标签数据。
- 无监督学习
- 对于无监督学习,训练数据不包含任何标签。 由于没有带标签的输出,因此模型需要推断共有数据点的自然结构。 正因为如此,无监督学习任务通常涉及到在数据中查找可能不明显的底层结构或模式。
典型的机器学习任务包括:
- 分类
- 将实例划分到多个类别中的一个类别。 例如,将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。
- 回归
- 预测目标数值。 例如,估算房屋价格。
- 集群
- 检测数据中的组。 例如,检测 Web 站点的相似访问者组
通常需要大量数据才能生成强大且准确的预测模型。 通过针对 Db2的机器学习,用户可以创建机器学习模型,而无需从 Db2移动数据。 这就增强了安全性,因为任何时候都不会从安全数据库中移动数据。 同时还提高了速度,因为无需进行数据传输。