对 Failed Event Manager 进行故障诊断
本主题讨论您在使用 Failed Event Manager 时可能会遇到的问题。
注: 本主题不讨论如何使用 Failed Event Manager 来查找、修改、重新提交或删除系统上的失败事件。 有关管理失败事件的信息,请参阅在 IBM Business Process Manager 中处理失败事件。 其他信息位于主题收集 WebSphere Process Server 中失败事件解决办法问题的故障诊断数据。
从下表中选择您正在遇到的问题:
| 问题 | 参阅以下内容 |
|---|---|
| 我难以在“搜索”页面的截止日期选项卡中输入值 | 如果输入不正确,那么“截止日期”和“起始日期”字段中的值会自动更改为缺省值 |
| 我难以删除已到期事件 | 使用“删除已到期事件”功能看似会暂挂 Failed Event Manager |
| 我难以处理未在创建的失败事件 | 未在创建失败事件 |
| 我难以检索或删除大量失败事件 | 服务器在检索或删除大量失败事件时发生故障 |
| 我在清除大量失败事件时遇到困难 | 清除大量失败事件时,服务器发生故障 |
| 在卸载关联的应用程序后,我无法删除失败事件。 | 在卸载关联的应用程序后删除失败事件 |
如果输入不正确,那么“截止日期”和“起始日期”字段中的值会自动更改为缺省值
“搜索”页面的起始日期和终止日期字段需要正确格式化的与语言环境有关的值。 值格式中的任何不一致(例如,在年份中包含四位数字而不是两位数字,或者省略时间)都将导致 Failed Event Manager 发出以下警告并替换字段中的缺省值:
CWMAN0017E: 无法正确解析输入的日期:your_incorrectly_formatted_date。 正在使用日期 default_date。
起始日期字段的缺省值定义为 January
1, 1970, 00:00:00 GMT。
要点: 在您 Failed Event Manager 实施中显示的实际缺省值将根据您的语言环境和时区而异。 例如,“起始日期”字段针对东部标准时间 (EST) 时区中语言环境为 en_US 的工作站缺省为 12/31/69 7:00 PM。
终止日期字段的缺省值始终是针对您语言环境和时区格式化的当前日期和时间。要避免此问题,请总是按照以上各字段提供的示例仔细输入日期和时间。
使用“删除已到期事件”功能看似会暂挂 Failed Event Manager
如果在当前搜索字段中有许多失败事件或者这些事件包含大量业务数据的情况下使用“删除已到期事件”按钮,那么 Failed Event Manager 可能看似会无限期暂挂。
在此情况下,未暂挂 Failed Event Manager:它正在通过大数据集工作,并且命令一完成就将刷新结果集。
未在创建失败事件
如果“恢复”子系统未在创建失败事件,请检查以下潜在原因核对表:
- 确保 wpsFEMgr 应用程序正在运行。 如有必要,请将其重新启动。
- 确保已创建 Failed Event Manager 的数据库,并且已测试连接。
- 确保已在 SCA 系统总线上创建必要的失败事件目标。 各部署目标应有一个失败事件目标。
- 确保针对参与您希望“恢复”服务处理的事件的任何服务组件体系结构 (SCA)、接口或合作伙伴引用,已将服务质量 (QoS) Reliability 限定词设置为 Assured。
服务器在检索或删除大量失败事件时发生故障
如果您使用 Failed Event Manager 来一次性检索或删除大量失败事件,那么服务器可能会发生故障。 要防止此问题,请确保在执行搜索或删除操作之前检查 Failed Event Manager 主页上的失败事件计数总数。 如果您具有大量事件,请勿尝试立即对其全部进行检索或删除。 而是,使用搜索失败事件选项返回与特定条件匹配的失败事件的子集。
然后,可以删除已过滤结果集中的所有事件而不会导致服务器故障。
注: 在您环境中存在若干会影响服务器在单个请求中可返回或删除的失败事件数的因素,包括在与服务器相同的机器上运行的其他进程和可用内存量。
清除大量失败事件时,服务器发生故障
如果您尝试使用全部清除选项来清除大量失败事件,那么服务器会发生故障。 要防止发生这种情况,请使用 JVM 属性 failedEventLimit 为可清除的失败事件数量设置限制。 如果失败事件计数高于此限制,那么全部清除选项会返回错误,您必须一次删除一个失败事件(直至达到指定的限制)。
在卸载关联的应用程序后删除失败事件
在卸载与大量失败事件相关联的应用程序后,您不再能够使用 Failed Event Manager 删除失败事件。 Failed Event Manager 无法装入失败事件详细信息,因为其找不到应用程序定义、相关队列以及与消息相关的数据对象。 在此情况下,您可以使用公共数据库中的以下表来标识并手动除去失败事件:
- FAILEDEVENTBOTYPES
- FAILEDEVENTDETAIL
- FAILEDEVENTMESSAGE
- FAILEDEVENTS
在 FAILEDEVENTDETAIL 表的 APPLICATIONNAME 列中标识要删除的失败事件消息。 使用 MSGID 值以关联所有表中已标识的消息,然后从所有指定的表中删除所有相关记录。