Aspera群集管理器(概述)

Aspera集群管理器(ACM)是一个软件模块,负责根据 Orchestrator 节点的当前状态(激活或被动)在该节点上启动正确的服务。 它还负责监控活动节点,以确定何时进行故障切换active/passive服务从主动节点转移到被动节点(当主动节点无响应时)。
注意: ACM 必须以root.

它是如何工作的?

两个 Orchestrator 节点上都安装了 ACM。 ACM 的两个实例首先通过检查存储在 ACM 专用共享空间上的通用状态文件来确定运行节点的状态。 为了避免在访问共同状态文件时出现竞赛条件,我们使用了一种特定的锁定机制--aslockfile--来同步两个实例。

一旦确定了节点的状态,在活动节点上运行的 ACM 实例就会验证所有服务是否都在运行,并启动任何未运行的服务。 一旦完成此操作,实例就会更新状态文件,使其最后修改日期保持最新。

被动节点上运行的 ACM 实例会检查状态文件是否当前,即最后修改日期不超过 2 分钟)。 如果文件是最新的,ACM 会检查active/passive然后启动所有当前未运行但应该运行的服务。 如果公共状态文件不再是最新的,那么就会出现故障切换情况,ACM 会启动所有服务,接管新的活动节点。

故障切换过程需要多长时间?

如果被动节点发生故障,则 ACM 不会做任何事情。 负载平衡器会检测到被动节点没有响应,并相应地重定向流量。 有关详细信息,请参阅 负载平衡器行为。 这一过程通常只需一分钟或更短时间。

如果活动节点发生故障,那么 ACM 最终会检测到状态文件不再是最新的,并触发故障切换。 此外,负载平衡器检测到活动节点宕机后,会将所有流量重定向到健康节点。 这一过程通常需要 5 分钟。