排除故障 Db2

关于 Db2 故障排除的主题提供了各种信息,当您遇到与 Db2 for z/OS® 产品相关的问题时,这些信息将为您提供帮助。 IBM® 支持人员在帮助您解决具体问题时,可能会要求您参考故障排除信息。

许可诊断信息: 更改开始
Db2 诊断指南和参考》 可作为 Db2 早期版本的授权出版物提供,但 Db2 12 不提供。 不过,这些内容仍然可用:
  • Db2 诊断指南和参考资料 中的大部分信息现在可以在 排除故障 Db2 (本部分)中不受限制地获取,也可以在 Db2 产品文档中获取,或者下载PDF手册: PDF文件图标 故障排除 Db2
  • 其余信息仅适用于 Db2 for z/OS 许可证与 IBMid 关联的客户。 请参阅 Db2 12 for z/OS 许可的诊断信息
更改结束

故障诊断是解决问题的系统化方法。 故障诊断的目的是确定为什么某些部件不能正常工作以及如何解决问题。

故障诊断过程的第一步是完整地描述问题。 问题描述有助于您和 IBM 技术支持代表了解从何处着手查找问题的原因。 此步骤包括一些对您自己提出的基本问题:
  • 问题有什么症状?
  • 问题在何处发生?
  • 问题在何时发生?
  • 问题在何种情况下发生?
  • 问题能否重现?

这些疑问的答案通常会形成对问题的准确描述,此描述可帮助您获取问题的解决方法。

问题有什么症状?

开始描述问题时,最明显的问题是“发生了什么问题?”。 此提问看起来比较简单;但是,您可以将它细分为多个更有针对性的提问,从而更详细地描述所发生的问题。 这些问题包括:
  • 谁或哪个组件报告该问题?
  • 错误码和消息是什么?
  • 系统如何出现故障? 例如,是循环、挂起、崩溃、性能下降,还是结果错误?

问题在何处发生?

确定问题发生的位置并不总是那么容易,但它是解决问题的一个最重要步骤。 报告组件和失败组件之间可能存在多层技术。 网络、磁盘和驱动程序仅仅是调查问题时需要考虑的一小部分组件。

以下提问有助于您重点了解发生问题的位置以确定问题层:
  • 问题是特定于一个平台或操作系统,还是在多个平台或操作系统上普遍存在?
  • 是否支持当前环境和配置?

即使一个层报告问题,该问题也不一定源于该层。 要确认问题的产生位置,就要了解问题所处的环境。 您应该花一些时间来全面描述问题环境,其中包括操作系统和版本、所有相应的软件和版本以及硬件信息。 确认运行环境的配置受支持;许多问题可以归因于软件级别不兼容,这些软件无法同时运行或者尚未进行全面的协同测试。

问题在何时发生?

针对发生故障前的事件建立详细的时间线,尤其是仅发生一次的情况。 通过倒推法最容易制定时间线:从报告错误的时间(尽可能精确,甚至精确到毫秒)开始,通过可用的日志和信息进行倒推。 有时,你只需要查看诊断日志中第一个可疑事件。

要制定事件的详细时间线,请回答下列提问:
  • 此问题是否只在白天或晚上的某个特定时间发生?
  • 此问题的发生频率如何?
  • 在报告此问题之前,所发生的一系列事件是什么?
  • 该问题是否发生在环境更改(如升级或安装软件/硬件)之后?

回答这些类型的提问可让您获取用于调查该问题的参考标准。

问题在何种情况下发生?

了解发生问题时有哪些系统和应用程序正在运行是故障诊断的重要组成部分。 以下关于环境的提问可以帮助您确定问题的根本原因:
  • 此问题是否始终在执行同一任务时发生?
  • 事件是否要按一定顺序发生,问题才会再现?
  • 在同一时间是否有任何其他应用程序发生故障?

回答这些类型的提问可帮助您说明问题发生时的环境并关联所有依赖项。 请记住,仅仅因为多个问题几乎在同一时间发生,并不意味着这些问题一定相互关联。

问题能否重现?

从故障诊断的角度来说,理想的问题是可以再现的问题。 通常,当问题可再现时,您具有较大的一组工具或过程可用来帮助您进行调查。 因此,可以再现的问题通常更加易于调试和解决。 但是,可再现的问题会具有以下缺点:当问题对业务有重大影响时,您不希望它重现。 如有可能,请在测试或开发环境中重现该问题,这通常使您在调查期间更具灵活性和控制能力。
  • 此问题能否在测试系统上重现?
  • 是否多个用户或应用程序都遇到同一类型的问题?
  • 此问题能否通过运行单个命令、一组命令或某个特定应用程序来重现?