レベル: 初級 Abdi Salahshour (abdis@us.ibm.com), Problem Determination Architect, IBM Kalpana Doraisamy (kdoraisa@in.ibm.com), Staff Software Engineer, IBM Mike Wamboldt (wamboldt@us.ibm.com), Senior Software Engineer, IBM
2007年 8月 21日 この 4 回シリーズでは、Log and Trace Analyzer for Java™ Desktop の概要、インストール・プロセスについてのアドバイス、ツールを正しく構成する方法などについて包括的に説明します。また、パフォーマンス向上のヒント、統合方法、ハンズオン・シナリオに加え、IBM Tivoli Monitoring 6.1 Events Tool に関する情報も紹介します。シリーズ最後の今回は、IBM Tivoli Monitoring 6.1 から LTA-JD を実行する方法を説明します。
Log and Trace Analyzer for Java Desktop を紹介する全 4 回のシリーズの内容をまとめると次のとおりです。
- テクノロジーの概要
- ツールのインストール方法と構成方法の詳細
- ツールのカスタマイズについてのヒント
- トラブルシューティングとパフォーマンス向上のためのガイドの使用
- 実践的シナリオ
- IBM Tivoli Monitoring (ITM) 6.1 Events Tool について
このシリーズ記事では、データの利用を最大限に高めるために参考となる一連の情報を 1 カ所にまとめ、問題判別と保守のコストを削減する方法を示すことを目的としています。
第 1 回では、現在、効果的なデータ収集を阻む以下の 3 つの主要な阻害要因の解決を試みました。
-
e-ビジネス・システムの複雑さ。今日のビジネス・システムは、分散環境にある異種のソフトウェア/ハードウェア・コンポーネントから構成されています。
-
多種多様なデータとコレクター/アダプター。コレクターの多様さと収集データの膨大さのために、いくつかの問題が引き起こされます。例えば、独自のデータ・フォーマットをどのように使用して公開するのか、異なる設計や標準をどのように共存させるのか、臨時のコードや製品固有のコードをどのように統合するのか、さまざまなシステムの構成・保守・調整に必要となる各種スキル・セットをどのように統合するのか、企業間の問題診断を相関させることの困難さをどのように克服するのかといった問題が存在します。
-
インスツルメンテーションの違いの克服。インスツルメンテーションの違いにより、標準への準拠、お客様の利便性、所有コストなどが問題となっています。さらに、標準化が欠如している場合は、やり取りする管理対象リソース (プロデューサー) ごとに管理ツール (コンシューマー) を準備する必要があります。これではコストもかかり、効率も悪くなります。
第 2 回では、LTA-JD の概要、ならびにこのツールのインストールと構成のガイド、および全般的機能の一覧表を示しました。
第 3 回では、LTA-JD の詳細をビジュアル・ツアーで紹介するとともに、パフォーマンスとトラブルシューティングに関するヒントを示しました。
それでは、これよりLTA-JD の IBM Tivoli Monitoring Events Tool ビューの説明に移ります。
ITM 6.1 with Fixpack3
IBM Tivoli Monitoring 6.1 with Fixpack3 には、Event Details ワークスペースを利用してイベントを管理する機能があります。Event Details ワークスペースでは、オーナーへのイベント割り当て、イベントのライフ・サイクル管理、および他のツールやタスクへのイベントの関連付け (Event Tool ビューを使用) が可能です。この記事では、イベント管理のために、リソースへカスタマイズ可能なリンクを設定できる Event Tool ビューを中心に解説します (図 1 参照)。
図 1. Event Tool ビュー
Event Tools ビューには、ハイパーリンクを追加できます。このハイパーリンクは Web サイトへのポインタになるほか、クライアント・マシン上のアプリケーションを起動するメカニズムとしても使用できます。以下で述べる ITM/LTA 統合シナリオでは、LTA-JDにより供給されるオートノミック・イベント・マネージメント機能を利用して詳細なイベントおよび問題の分析機能をIBM6.1に追加するためにこの機能を利用します。
詳細イベント分析のシナリオ
詳細イベント分析のシナリオには、あるイベントに関連する問題や状態の詳細な診断を実行する機能があり、障害回復だけでなく、問題解決も可能です。
- 障害回復は、問題のシンプトン (症状) に対処して、システムを望ましい状態へと速やかに復帰させるために行われます。通常は、イベントなど、確認された状態に対する対応として実行します。障害の発生したデータベース・サーバーを再起動する、などが障害回復の例です。
- 問題解決は、問題の根本原因に目を向け、問題の再発を防ぐことに重点を置きます。問題に対処するために、根本原因を特定し、適切なシステム変更を行うには、通常、詳細な問題分析が必要になります。データベース・サーバー内のソフトウェアに欠陥がある場合にフィックス・パックを適用する、などが問題解決アクションの一例です。
図 2 は、ITM に LTA を連携して詳細なイベント/問題分析を実行する仕組みを示しています。
図 2. 管理者がさらに詳細な分析を行う場合
この場合の手順は次のとおりです。
- システム管理者が、ITM のイベント・ビューで発生した 1 つ以上のイベントを通じて状態/障害を検知する。
- システム管理者は、システムを通常運用に復帰させるため、一連の回復操作を実施する (イベントおよびその影響度合いによる)。
- システム管理者は、特定のイベントまたは状態がさらに詳細な分析を要するかどうかを決定し (関連する問題がシステムに特に重大な影響を及ぼす場合など) 、システム・アナリスト (システム・プログラマー) にイベントの発生を通知する (可能であれば、Event Details ビューを用いてシステム・アナリストにイベントの「割り当て」を行う)。
- システム・アナリストは、直ちに問題の「オフライン」分析を開始する。このとき、初期のイベント分析と優先順位付けを実施するため、Event Tools ビューより LTA ツールを起動する。LTA ツールは、システム・アナリストによって事前に適切な場所にインストール済み (『LTA-JD リンクの設定』を参照)。
- システム・アナリストは、対象のイベントに関連するリソースからその他の診断データ (ログ・ファイル) を収集し、この情報を LTA-JD ツールにインポートして診断に使用する。
- システム・アナリストは、 LTA-JD のイベント診断機能を使用して、下記の手順で、障害の優先順位付け、障害の発生しているコンポーネントの特定、および可能であれば障害の根本原因の特定を行う。
- (既知の問題の定義が記載されている) 既存のシンプトン・カタログをインポートして、問題 (およびその解決策) がすでに文書化されていないかどうかを確認する。
- LTA-JD のイベント・ビューとハイライト機能を利用して、現在の問題との関連が疑われるシンプトン (関連) ・イベントを特定する。
- これらのイベントで報告されている状態、および他のイベントとの関連性を調査する。
- システム・アナリストは、これらのツールを使用して、障害イベントおよびリソース/コンポーネントを含む初期障害に、問題を絞り込む。
- アナリストが問題の根本原因を特定できた場合は、アナリストが、問題を修正する処置をとる (システム管理者に特定の変更要求/更新を適用するように通知するなど)。
- 問題によっては、アナリストから、障害の発生しているリソース/コンポーネントの専門家 (ベンダーのサポート・チームや変更担当チームなど) へ、問題の受け渡しが必要になる。LTA-JD ツールには、イベントの優先順位付け/分析の結果を LTA ファミリーの他の製品へ受け渡す機能がある。例えば、LTA-Eclipse ツールを使用すると、Eclipse ワークベンチ内で特定のエラー状態の詳細な分析を実行できる。
次に、ITM 6.1 の Event Tools ビューから LTA-JD を実行する操作を説明します。
LTA-JD を ITM 6.1 の Event Tools ビューから実行
ITM 6.1 の Event Tools ビューは、Event Details ワークスペースの一部となっています。LTA-JD の構成とカスタマイズを行うことにより、Windows® Event ログや WebSphere® Application Server など、ITM の監視対象となっている環境またはアプリケーションの特定のイベント・ソースより LTA-JD を起動できます (図 3 を参照)。
図 3. LTA-JD を ITM から起動
簡易リンクが作成されています。LTA-JD を起動して、対象のログで詳細なメッセージを確認できることがわかります。図 4 は、このシナリオに各種コンポーネントの関連や接続の様子を示しています。
図 4. 連携トポロジー
LTA-JD リンクの設定
LTA-JD リンクは、<ITM install dir>cnb内にある eventtools.htm ファイルで定義されています。図 5 には、リンク先が記述されています。
図 5. リンクの設定
カスタマイズの詳細
イベント管理の機能は、Tivoli Enterprise Portal にも拡張できます。新たに、個々のイベントに詳細な注釈を追加したり、ファイルを添付したりできるようになりました。ユーザーがファイルを添付できるように、新たなユーザー権限が追加されています。また、イベントの通知方法も改善されています (Online Portal のヘルプでは、これら新機能の使い方の詳細が説明されています)。
シリーズのまとめ
以上で、問題判別を目的としたシンプトン・イベント視覚化のための、Log and Trace Analyzer - Java Desktop と IBM Tivoli Monitor の活用方法をご理解いただけたのではないでしょうか。これらのツールの活用に役立てていただくため、このシリーズでは、次のような情報を提供してきました。
-
第 1 回では、データ収集における課題を指摘し、共通のイベント・フォーマットとシンプトン・リポジトリーがこうした課題への解決に役立つことを説明しました。
-
第 2 回では、LTA-JD の概要、アーキテクチャーの紹介、ツールのインストール/構成のガイド、および全体的な機能について説明しました。
-
第 3 回では、LTA-JD のテクノロジーを紹介するビジュアル・ツアーを提供し、トラブルシューティングと最高のパフォーマンスを引き出す方法について解説しました。
- 第 4 回では、LTA-JD を IBM Tivoli Monitoring 6.1 から実行する方法を説明しました。
参考文献 学ぶために
製品や技術を入手するために
議論するために
著者について  | |  | Abdi Salahshour は IBM Autonomic Computing Technology and Development のシニア・ソフトウェア・エンジニアであり、問題判別のアーキテクトやMaster Inventor でもあります。現在は Plug and Manage アーキテクチャーのアーキテクトとして活躍しています。1982年に IBM に入社して以来、データベース診断ツールの設計開発からシステム管理自己修復アーキテクチャー、そして異種分散環境でのイネーブルメントまでさまざまな職務を経験してきました。彼は IBM Problem Determination Council のメンバーで、IBM Common Base Event 仕様の作成にも参加しています。また、Generic Log Adapter の主任設計者およびインプリメンターの一員、Log and Trace Analyzer for Java Desktop のアーキテクト兼設計者でもあります。 |
 | |  | Kalpana Doraisamy は、IBM のスタッフ・ソフトウェア・エンジニアであり、現在は主に Lightweight Infrastructure for Systems Management に取り組んでいます。以前の任務では、2年以上にわたって Log and Trace Analyzer for Autonomic Computing を担当していました。また、Log and Trace Analyzer for Java Desktop の上級開発者の 1 人であり、インドのコインバトールにある Government College of Technology で情報工学の学士号を取得しました。
|
 | |  | Mike Wamboldtはシニア・ソフトウェア・エンジニアで問題判別のスペシャリストでもありソフトウェアのサービスの可用性のアーキテクチャー・ボードを共同でリードし、ソフトウェアのサービス可用性とベストプラクティスの共同オーナーでもあります。 現在は、オートノミック・コンピューティングの自己修復と問題判別の機能をIBM製品とオファリンに統合するデプロイメント・マネージャーです。1981年にIBMに入社し、ネットワーク・コンピューティング、ソフトウェア、zOS、分散システム、ソフトウェアのサービス可用性にも参画しています。 |
記事の評価
|