贝叶斯网络节点
通过 贝叶斯网络 节点,您可以利用对真实世界认知的判断力并结合所观察和记录的证据,通过使用看似不相关的属性建立事件发生的几率,从而构建概率模型。该节点侧重于树扩展朴素贝叶斯 (TAN) 网络和马尔可夫覆盖网络,这些网络主要用于分类。
贝叶斯网络可用于在许多不同的情况下进行预测,示例如下:
- 选择违约风险较低的贷款时机。
- 根据传感器输入数据和现有记录,估算设备是否需要维修、增加零配件或更换。
- 借助在线故障排除工具解决客户问题。
- 实时诊断并排除移动电话网络故障。
- 评估研发项目的潜在风险和回报,以在最佳时机集中资源。
贝叶斯网络是一种图形模型,可显示数据集中的变量(通常称之为 节点 )以及概率,还可以显示这些变量之间的条件和独立性。贝叶斯网络可呈现节点之间的因果关系;但是,网络中的链接(也称为 arcs )没有必要呈现直接因果关系。例如,如果图形中所显示的症状和疾病之间的概率独立性成立,贝叶斯网络可根据特定症状和其他相关数据是否存在,计算患者患有某种特殊疾病的几率。这种网络非常稳健,即使在信息缺失时,也可以利用现有的任何信息作出最佳预测。
标准的基础贝叶斯网络示例由 Lauritzen 和 Spiegelhalter 于 1988 年创建。该网络示例是一种简化的网络版本,通常称作“Asia”模型,医生可用它来诊断新患者的病情,所有链接的方向可大体指示因果关系。每个节点代表与患者状况相关的一个方面,例如“吸烟”表示这些患者确为吸烟者,而“VisitAsia”表示他们最近是否去过亚洲。概率关系由所有节点之间的链接指示,例如,吸烟会增大患者患有支气管炎和肺癌的几率,而年龄仅与肺癌的患病率相关。同样地,肺部 x 光检查出的异常可能由肺结核或肺癌引起。同时,如果患者本身患有支气管炎或肺癌,那么他们更有可能出现呼吸急促(呼吸困难)的症状。

以下是您有可能决定使用贝叶斯网络的几点原因:
- 它可帮助您了解因果关系。由此,您可以了解出现问题的地方并可预测任何干涉可能引发的后果。
- 该网络可提供避免数据过度拟合的有效方法。
- 可以轻松地观测到所涉及关系的清晰视图。
需求。目标字段必须为分类且测量级别为名义、有序或标志。输入内容可以为任何类型的字段。连续(数值范围)输入字段将自动分级;但是,如果分布出现不对称,则可使用贝叶斯网络节点之前的分级节点对字段进行手动分级,从而获得更佳的效果。例如,在主管字段与贝叶斯网络节点目标字段相同的位置处,使用最优分级。
示例。银行分析师希望可以预测可能拖欠偿还贷款的客户或潜在客户。您可使用贝叶斯网络模型来标识最有可能拖欠还款的客户的特征,并构建几种不同类型的模型,以确定哪种模型可以最好地预测潜在的贷款拖欠者。
示例。一位电信运营商希望减少中断服务(又称为“流失”)的客户数量,并使用上一个月的数据对模型每月进行更新。您可以使用贝叶斯网络模型确定最有可能流失的客户的特征,然后每月使用新数据继续训练该模型。