动态处理器释放

AIX®可以检测并自动停止使用故障处理器。

自机器类型 7044 的 270 型开始,带有两个或更多处理器的所有系统的硬件都能够检测可更正的错误,这些错误由固件收集。 这些错误都不是致命的错误,并且只要保持它们极少发生,忽略这些错误也是安全的。 但是,当故障模式看上去在特定的处理器上发展时,此模式可能指示此组件可能会在不久的将来出现致命的故障。 这是固件基于故障率和阈值分析所作出的预测。

在这些系统上, AIX 实施持续的硬件监控,并定期轮询固件以查找硬件错误。 当处理器错误的数量达到阈值并且固件认识到此系统组件很可能会发生故障时,固件将返回错误报告。 在所有情况下,错误将被记录在系统错误日志中。 此外,在多处理器系统上,根据故障类型, AIX 会尝试停止使用不值得信任的处理器并将其取消分配。 此功能称为 动态处理器释放

此时,为了持久释放给后续重新引导,固件还将标志该处理器,直到维护人员替换该处理器为止。