制造工厂要预防系统故障,就必须了解系统故障的潜在原因。故障树分析 (FTA) 是一种根本原因分析方法,可在设备发生故障之前发现并分析资产问题的根本原因。
故障树分析是一种由上往下的演绎式分析法,用于确定复杂系统中特定意外事件的成因。它将故障的根本原因分解为多个促成因素,然后通过一种称为“故障树”的图形模型来表示,协助管理人员和工程师找出潜在的故障模式以及每种故障模式的发生概率,以便进行安全性和可靠性分析。
FTA 最初于 20 世纪 60 年代初由贝尔实验室开发用于帮助美国空军了解民兵导弹系统的潜在缺陷,现已广泛应用于航空航天、核电、化工、汽车等众多行业。
维护管理员可以利用故障树分析来完成以下工作:
随着制造环境不断发展、日趋复杂,FTA 等有效的风险管理工具变得越来越重要。在组织的安全性分析和可靠性工程实践中运用故障树分析法,可助组织一臂之力,使其深入了解系统故障的潜在原因,提高整体性能,降低代价高昂且可能产生灾难性后果的事件的发生可能性。
探索 IBM Maximo,了解 IoT 数据、分析和 AI 如何帮助简化企业的资产运营。
订阅 IBM 时事通讯
故障树分析的执行过程很复杂,可分为七个关键步骤。
进行分析之前应明确要分析的意外事件。该事件应该是具体的、可测量的,例如组件故障或系统故障。由于该事件是故障树图的起点,您还必须用清晰一致的术语详细说明它。
详细说明意外事件之后应着手确定可能导致该事件发生的因素和事件。促成因素往往分为两大类:基本事件和中间事件。
基本事件(即无法进一步分解为更简单事件的事件)是故障树中最基础的事件,表示可以分析的最下级事件。例如,车祸故障树的基本事件可能是“驾驶员失去对车辆的控制”。
中间事件位于下级基本事件与顶事件(要分析的主要意外事件)之间。中间事件由故障树中的其他事件引起,进而引发其他事件。其所代表的是可以进一步分析的上级事件。同样以车祸为例,故障树的中间事件可能是“车轮爆胎”。
请务必兼顾内部和外部事件,例如组件故障、人为错误和环境条件。在这一分析阶段中,您可能需要咨询主题专家和/或查阅历史数据、事件报告和维护记录。
使用标准门形符号和事件符号构建意外(或输出)事件与促成因素(亦称“输入事件”)之间的关系图示。故障树应逐层递进,最上面是意外事件,其下方分解出各种促进因素。
摆放基本事件很简单,因为基本事件不能产生其他事件。但添加中间事件却有点复杂,因为中间事件需要使用布尔逻辑门来表示顶事件、中间事件和基本事件之间的关系。
故障树中使用的逻辑门主要有两种类型:与门和或门。
或门:当任何一个输入事件都能引发输出事件时,使用或门。换言之,或门连接的多个输入事件中只要有一个发生,输出事件就会发生。例如,如果系统故障可能是由组件故障或操作员出错引起的,则使用或门来连接事件。
非门、异或门、表决门和禁门虽然不太常用,但也有助于确定输入事件与输出事件的特定关系。
非门:非门表示输入事件的逆事件。如果输入事件不发生,输出事件就会发生。此类逻辑门模拟的是不存在某事件或发生了某补充事件,因此在故障树分析中不太常见。
异或门:当只有一个输入事件发生才能引发输出事件时,使用异或门。如果没有发生任何输入事件或发生了多个输入事件,输出事件都不会发生。
表决门:表决门也称为阈值门,当所有可能发生的输入事件 (N) 中有特定数量 (K) 的事件发生后才能引发输出事件时,使用表决门。表决门有助于在故障树分析中说明更复杂的关系。
禁门:禁门类似于与门,表示如果输入事件和条件事件(可应用于任何逻辑门的条件或限制)同时发生,则将导致输出事件发生。
中间事件还包括未探明事件,即尚未彻底了解或尚未全面分析的事件。
在各种逻辑门的协助下,您可以构建一个全面的故障树,捕获促使意外事件发生的各种事件和因素之间的复杂相互作用。
请务必记住,构建故障树是一个迭代式过程,因此要继续将促成事件分解为基本子事件,直至事件无法进一步分解为止。在获得新信息和/或系统条件发生变化时,您可能需要通过多次调整来完善故障树。
为了量化与意外事件相关的风险,您需要(从历史记录、行业数据库、专家意见等资料中)收集故障树基本事件的故障数据。故障数据应该用故障概率或故障率来表示,具体视要执行的分析类型而定。
构建故障树并收集故障数据后,您将进行分析,计算意外事件的发生概率,确定最关键的促成因素。运用定性或定量数据分析法。
定性分析侧重于了解故障树的结构和事件之间的关系,确定关键路径和最小割集(可以产生意外事件的最小事件集)。定性分析有助于划分补救操作的优先顺序,还有助于发现需要进一步调查的地方。
而定量法则是根据基本事件的故障概率计算出意外事件的发生概率。定量分析有助于为风险管理决策提供信息,还有助于评估拟议改进措施的效果。
执行分析后,您应该解释分析结果并将相关信息传达给必要的利益相关者。
请务必记住,故障树分析的结果取决于输入数据的质量和分析过程中所做的假设。因此,您应该将结果看作是进一步调查和验证的起点,而不是最终结论。
您可以根据故障树分析的结果,实施预防措施和/或改进措施来消除或降低意外事件发生的可能性。请务必监测这些改进措施的实施情况,通过不断更新故障树来反映系统设计、操作条件或组件性能的任何变化,从而使故障树保持准确,对组织有用。
FTA 可直观显示可能导致系统故障的促成因素和促成事件,使您轻松了解系统组件之间的复杂相互作用。
借助 FTA,您可以计算出故障事件的发生概率,从而更有效地管理风险并做出决策,协助团队主动采取纠正措施。
由于一次只能分析一个输出事件,因此故障树分析可以助团队一臂之力,让他们在评估系统级别时保持条理清晰,有条不紊地进行影响分析。
与故障模式及影响分析 (FMEA) 的其他方法不同,FTA 考虑到了人为错误,有助于团队了解问题是否与标准操作程序的偏差有关。
FTA 可确定哪些故障最有可能发生,从而协助团队判定哪些问题亟待关注。