組織がアプリケーションのヘルス監視プロセスを適切に測定する方法

機械の前に立ってタブレットを分析する女性エンジニア

今日の組織では、すべての従業員、アプリケーション、プロセスが連携して価値を生み出すことが求められています。組織は、エンド・ユーザーに一貫したサービスを提供するために、ネットワーク・インターフェース、CPU、仮想マシン、オペレーティング・システム情報、インストールされているアプリケーションなど全体で構成されるテクノロジー・スタックへの依存度が高まっています。これは、企業が 競争優位性の源泉となることが多い ため、ソフトウェアアプリケーションが最適に機能する必要があることを意味します。

アプリケーションのヘルス監視とは

これが、現代の組織にとってアプリケーションのヘルス監視が非常にクリティカルである理由でもあります。アプリケーションのヘルス監視は、アプリケーションのヘルス問題を特定し、それが組織にとってより大きな問題になる前に解決計画を作成するための診断プロセスです。

組織は、アプリケーションの障害やパフォーマンスの低下を理由に、不必要な計画外のダウンタイムやレイテンシーの増加をリスクにさらすことはできません。アプリケーション固有の依存関係により、1つの障害がサービス提供全体に連鎖的な影響を与える可能性があります。そのため、アプリケーションのヘルス監視に投資し、アプリケーションが組織の日常要件の要求に対応できるようにすることが重要です。この流れの混乱は、企業の収益とカスタマー・リレーションシップに重大な影響を与える可能性があるため、組織内ではアプリケーションの監視を優先することが重要です。

アプリケーションのヘルスの監視は、読み込み時間、応答時間、アップタイムと可用性などのデジタル・エクスペリエンスを監視するアプリケーションのパフォーマンス監視といくつかの類似点があります。どちらもエンドユーザーにとってのアプリケーションの動作を改善しますが、アプリケーションヘルスモニタリングは主にアプリケーションの動作に関係し、アプリケーションパフォーマンスモニタリングはユーザーエクスペリエンスの向上にも重点を置いています。

アプリケーションのヘルス監視プロセスの相対的な成功を識別する 7 つのメトリクス

組織はアプリケーションのヘルスを確保するための包括的な計画を立てる必要がありますが、アプリケーションのヘルスを監視するプロセスの重要なコンポーネントの1つはデータ収集です。アプリケーションが失敗したり、パフォーマンスが低下したりする理由はさまざまです。その結果、パフォーマンスの問題の発見が遅すぎないように、いくつかの主要なヘルス状態とパフォーマンス・メトリクスを追跡することが重要です。そのため、多くの組織は、高度なヘルスレポートを通じてアプリケーションのヘルスを管理し、主要なメトリクスを追跡しようとしています。

アプリケーションのヘルス監視プロセスの相対的な成功を識別する7つの重要なメトリクスです。

  1. アプリケーションの可用性とアップタイム:これは、エンドポイント (モバイル デバイス、コンピューター、仮想マシンなど) がアプリケーションにアクセスして使用できる時間の長さです。ソフトウェアのダウンタイムは、顧客満足度を低下させ、エンドユーザーとのサービスレベル契約に違反する可能性があるため、組織にとって大きなリスクとなります。最近では、複数のアプリケーションが接続され、多くのアプリケーションがプロバイダーAPIから外部リソースを取得するようになったため、アプリケーションの稼働時間を維持することがさらに困難になっています。組織は、パフォーマンス上の問題がいつ発生するか、およびそのトラブルシューティングを行う方法を知っておく必要があります。
  2. アプリの起動時間と応答時間: これは、アプリケーションの初期読み込み時間と、リクエストやユーザーのクエリに対する応答時間に関係します。例えば、ユーザーがアプリケーションを開くと、サーバーにクエリーを実行してアプリケーションのホーム画面を表示します。開くのに時間がかかるアプリは顧客満足度を低下させ、より大きな問題の兆候である可能性があります。そのため、組織はアプリの応答しきい値が許容範囲を下回った場合に機能に適切な変更を加えることができるように、アプリのパフォーマンスにかかる時間を自動化したリアルタイムのヘルスチェックが必要です。応答時間を把握している組織は、アプリケーションに障害が発生する前に、プロアクティブな修復ストラテジーを策定できる可能性が高くなります。
  3. リソース使用量: アプリケーションが特定の時点で使用している利用可能なリソースの割合を測定します。リソースを大量に消費する特定のアプリケーションは、他の場所の性能に影響を与える可能性があります。複数のアプリケーションを開いている場合や、1つのアプリケーションが過負荷になっている場合(何十ものタブを開いているブラウザなど)など、コンピューターの速度が低下している場合、このような経験をしたことがあるかもしれません。
  4. インスタンスと問題の数と深刻度: また、各インシデントがどの程度深刻で、その障害やパフォーマンス不足がシステム全体にどのような影響を与えるかを特定することも重要である。アプリケーションのヘルス監視は、インシデント管理や問題管理に影響を与えることが多く、アプリケーションのヘルス監視によって発見された問題の修復が含まれます。
  5. 平均検出時間(MTTD): アプリケーションが障害を起こしたか、許容範囲を超えてパフォーマンスが低下し始めたと検知するまでに、1ミリ秒から数日までかかる場合があります。MTTD(平均検出時間と呼ばれることもあります)は、アプリケーションまたはITシステムの一部に障害が発生したことを特定するまでにかかる平均時間を測定します。理想的には、組織は自動通知またはデータの可視化グラフとワークフローを確立して、人間の介入によって問題を迅速に特定できるようにする必要があります。
  6. 平均修復時間 (MTTR): MTTR は、システムまたは設備が故障した後に修復するまでにかかる平均時間を測定します。MTTRは、障害が発生してからアプリケーションが再び適切に機能するまでの時間を追跡します。MTTRは、アプリケーションの可用性の重要なコンポーネントである修復作業の有効性を追跡するため、監視すべき重要なメトリクスです。
  7. サイバーセキュリティー インシデントの数: IBM の研究によると、データ侵害の世界的な平均コストは 2023 年に 445 万ドルとなり、3 年間で 15% 増加しています。パンデミックが始まって以来、スピア・フィッシング攻撃が7倍近く増加している。アプリケーションが失敗したり、パフォーマンスが低下したりする理由は多数ありますが、最も懸念される理由の 1 つは、外部のサイバーセキュリティー脅威によってアプリケーションが失敗することです。監視ツールを使用して、マルウェア・インジェクション、分散型サービス拒否(DDoS)などの潜在的なセキュリティー問題を検知することで、アプリケーションのヘルスを向上できます。

組織は、オペレーションの効率を高め、顧客にサービスを提供するために、アプリケーションが動作することに依存しています。アプリケーションのヘルスを向上させる最善の方法は、個々のアプリケーションのパフォーマンスを明らかにし、システム全体の全体像を提供する主要なメトリクスを特定して追跡する、統制されたプロセスを通じたものです。

IBM Instanaでインシデントのより迅速な解決に必要なコンテキストを取得

IBM Instana Observabilityを使用することで、アプリケーションによるユーザーのニーズへの対応力を高めることができます。CI/CDパイプラインを加速して、アプリケーションのオブザーバビリティーとコンテキストにより、アプリケーションをより迅速に提供し、コストを削減して、インテリジェントなアクションを実行し、アプリケーションの性能を確保します。

著者

Keith O'Brien

Writer

IBM Consulting

関連ソリューション

IBM Cloud無料利用枠

無料のIBM Cloudアカウントを作成して、IBM Watson APIを含む40以上の常時無料の製品にアクセスしましょう。

アカウントの作成
IBM Cloud  

IBM Cloudは、規制の多い業種・業務向けに設計されたエンタープライズ・クラウド・プラットフォームであり、オープンでAI対応のセキュアなハイブリッド・ソリューションです。

MDMソリューションを探索する
クラウド・コンサルティング・サービス

IBMのクラウド・コンサルティング・サービスで新しい機能にアクセスし、ビジネスの俊敏性を高めましょう。ハイブリッドクラウド戦略や専門家とのパートナーシップを通じて、ソリューションを共創し、デジタル・トランスフォーメーションを加速させ、パフォーマンスを最適化する方法をご覧ください。

クラウド・サービス
次のステップ

IBMの安全でスケーラブルなプラットフォームは、AIとハイブリッドクラウドの可能性を解き放ちます。IBMのAI対応ソリューションをお試しいただくか、無料アカウントを作成して常時無料の製品とサービスをご利用ください。

IBM Cloud AIソリューションはこちら IBM Cloud の無料アカウントを作成する