什么是故障树分析 (FTA)?

2023 年 6 月 30 日

什么是 FTA?

故障树分析 (FTA) 是一种根本原因分析方法,可在设备发生故障之前发现并分析资产问题的根本原因。在制造设施中,了解系统故障的潜在原因对于预防故障至关重要,而 FTA 可提供帮助。

故障树分析是一种由上往下的演绎式分析法,用于确定复杂系统中特定意外事件的成因。它将故障的根本原因分解为多个促成因素,然后通过一种称为“故障树”的图形模型来表示,协助管理人员和工程师找出潜在的故障模式以及每种故障模式的发生概率,以便进行安全性和可靠性分析。

FTA 最初于 20 世纪 60 年代初由贝尔实验室开发,用于帮助美国空军了解民兵导弹系统的潜在缺陷,现已广泛应用于航空航天、核电、化工、汽车等众多行业。

维护管理员可以利用故障树分析来完成以下工作:

  • 设计和/或安装新系统。
  • 更改现有系统。
  • 调查系统安全性或系统可靠性。
  • 评估法规一致性。
  • 优化维护预算。

随着制造环境不断发展、日趋复杂,FTA 等有效的风险管理工具变得越来越重要。将故障树分析纳入组织的安全分析和可靠性工程实践中,可以帮助您的组织更深入地洞察系统故障的潜在原因。FTA 还可以帮助提高整体性能并降低潜藏的代价高昂的灾难性事件发生的可能性。

小球在轨道上滚动的三维设计

最新的 AI 新闻 + 洞察分析

在每周的 Think 时事通讯中,发现专家精选的有关 AI、云等的洞察分析和新闻。 

执行故障树分析

故障树分析的执行过程很复杂,可分为七个关键步骤。

第 1 步:详细说明意外事件

在运行分析之前,应该明确定义要分析的意外事件。此事件应该是具体且可衡量的,例如组件故障或系统故障。以清晰、一致的术语定义事件也很重要,因为它是故障树图的起点。

第 2 步:确定促成事件和促成因素

定义意外事件后,应该开始确定可能导致其发生的因素和事件。促成因素往往分为两大类:基本事件和中间事件。

基本事件(即无法进一步分解为更简单事件的事件)是故障树中最基础的事件,表示可以分析的最下级事件。例如,车祸故障树中的一个基本事件可能是“司机失去对车辆的控制”。

中间事件位于下级基本事件与顶事件(要分析的主要意外事件)之间。中间事件由故障树中的其他事件引起,进而又引发另一些事件。其所代表的是可以进一步分析的较上级事件。还以车祸为例,故障树的中间事件可能是“车轮爆胎”。

请务必兼顾内部和外部事件,例如组件故障、人为错误和环境条件。在这一分析阶段中,您可能需要咨询主题专家和/或查阅历史数据、事件报告和维护记录。

第 3 步:构建故障树

使用标准门形符号和事件符号构建意外(或输出)事件与促成因素(亦称“输入事件”)之间的关系图示。故障树应逐层递进,最上面是意外事件,其下方分解出各种促进因素。

布置基本事件很简单,因为基本事件不能产生其他事件。但添加中间事件却有点复杂,因为中间事件需要使用布尔逻辑门来表示顶事件、中间事件和基本事件之间的关系。

故障树中使用的逻辑门主要有两种类型:与门或门

  • 与门:当所有促成事件必须同时发生才能导致意外事件发生时,使用与门。例如,如果组件故障和操作员出错同时发生后出现系统故障,则使用与门来连接故障树中的事件。
  • 或门:当任何一个输入事件都能引发输出事件时,使用或门。换言之,或门连接的多个输入事件中只要有一个发生,输出事件就会发生。例如,如果系统故障可能是由组件故障或操作员出错引起的,则使用或门来连接事件。

非门异或门表决门虽然不太常用,但也有助于确定输入事件与输出事件的特定关系。

  • 非门:非门表示输入事件的逆事件。如果输入事件发生,输出事件就会发生。此类逻辑门模拟的是不存在某事件或发生了某补充事件,因此在故障树分析中不太常见。

  • 异或门:当只有一个输入事件发生才能引发输出事件时,使用异或门。如果没有发生任何输入事件或发生了多个输入事件,输出事件都不会发生。

  • 表决门:表决门也称为阈值门,当所有可能发生的输入事件 (N) 中有特定数量 (K) 的事件发生后才能引发输出事件时,使用表决门。表决门有助于在故障树分析中说明更复杂的关系。

  • 禁门:禁门类似于与门,表示如果输入事件和条件事件(可应用于任何逻辑门的条件或限制)同时发生,则将导致输出事件发生。

中间事件还包括未探明事件,即尚未彻底了解或尚未全面分析的事件。

在各种逻辑门的协助下,您可以构建一个全面的故障树,捕获促使意外事件发生的各种事件和因素之间的复杂相互作用。

构建故障树是一个迭代式过程,因此要继续将促成事件分解为基本子事件,直至事件无法进一步分解为止。在获得新信息和/或系统条件发生变化时,您可能需要通过多次调整来完善故障树。

第 4 步:收集故障数据

为了量化与意外事件相关的风险,您需要(从历史记录、行业数据库、专家意见等资料中)收集故障树基本事件的故障数据。故障数据应该用故障概率或故障率来表示,具体视要执行的分析类型而定。

第 5 步:分析

构建故障树并收集故障数据后,您将进行分析,计算意外事件的发生概率,确定最关键的促成因素。运用定性或定量数据分析法。

定性分析侧重于了解故障树的结构和事件之间的关系,确定关键路径和最小割集(可以产生意外事件的最小事件集)。定性分析有助于划分补救操作的优先顺序,还有助于发现需要进一步调查的地方。

而定量法则是根据基本事件的故障概率计算出意外事件的发生概率。定量分析有助于为风险管理决策提供信息,还有助于评估拟议改进措施的效果。

第 6 步:解释结果

执行分析后,您应该解释分析结果并将相关信息传达给必要的利益相关者。

事件树分析的结果取决于输入数据的质量和分析过程中所做的假设。因此,您应该将结果看作是进一步调查和验证的起点,而不是最终结论。

第 7 步:实施改进措施并监测进展情况

根据故障树分析的结果,您根据需要实施预防措施和改进措施,以消除或降低意外事件发生的可能性。因此,务必监测这些改进措施的实施情况,通过不断更新故障树来反映系统设计、操作条件或组件性能的任何变化,从而使故障树保持准确并对组织有用。

AI 学院

面向企业的生成式 AI 的兴起

了解生成式 AI 的历史兴起及其对企业的意义。

故障树分析的优点

  • FTA 可直观显示可能导致系统故障的促成因素和促成事件,使您轻松了解系统组件之间的复杂相互作用。

  • 借助 FTA,您可以计算出故障事件的发生概率,从而更有效地管理风险并做出决策,协助团队主动采取纠正措施。

  • 由于一次只能分析一个输出事件,因此故障树分析可以助团队一臂之力,让他们在评估系统级别时保持条理清晰,有条不紊地进行影响分析。

  • 与故障模式及影响分析 (FMEA) 的其他方法不同,FTA 考虑到了人为错误,有助于团队了解问题是否与标准操作程序的偏差有关。

  • FTA 可确定哪些故障最有可能发生,从而协助团队判定哪些问题亟待关注。

故障树分析的局限性

  • FTA 的准确性和效果在很大程度上取决于分析人员的专业知识、识别相关故障原因的能力以及对故障树复杂性的了解。
  • FTA 最适合用于规模较小的系统分析。复杂的大型系统通常需要使用复杂的大型故障树,这样会使分析变得费时又费力。
  • 故障数据的可用性和质量将决定故障树中概率计算结果的精确度。
  • 故障树分析每次只能检查一个顶事件。
相关解决方案
使用 IBM Maximo Application Suite 进行制造运营管理

以制造流程中的零缺陷和零停机时间为目标,踏上卓越资产管理之旅。

探索 IBM Maximo Application Suite
业务运营咨询服务

借助 IBM 利用丰富的数据和强大的 AI 技术来集成优化流程,从而实现业务运营转型。

深入了解业务运营服务
业务运营解决方案

利用面向智能资产管理和供应链的人工智能驱动解决方案,构建更具弹性的业务。

深入了解运营解决方案
采取下一步行动

IBM® Maximo Application Suite 可帮助制造商优化高价值生产,以提高产量并最大限度地降低成本,同时进行转型,如机器人流程自动化 (RPA) 和行业 4.0。

深入了解 Maximo Application Suite 查看产品导览