昨今、企業は旧来の事業を維持するのみでなく、市場変化や顧客ニーズに対応し、迅速かつ柔軟な意思決定を迫られています。その中でビジネス上の意思決定を支える、より効率的なシステム運用・リソース配分を目指し、クラウドの活用やクラウドネイティブへの対応を検討される企業が増えてきています。一方で、先進的なシステムの導入が進むほど、旧来のシステムとの混在等仕組みが複雑になり、監視対象が増えることで、システム全体を監視するには多大な労力を伴います。同時に、障害発生時の原因特定も困難になるため、問題解決までに時間を要してしまい、「効率的なシステム」のはずが、結果的に現場を疲弊させてしまうといったお悩みを抱えている企業も多いのではないでしょうか?
当ブログでは、そんなお悩みを解決するフルスタック監視ソリューションをご紹介いたします。
ビジネスニーズに応じ、迅速に意思決定を進めようとした時、システムには柔軟性を求められます。
既存サービスの改修、新しい仕組みの開発等、事業側の判断にタイムリーに応えるには先進的かつ複雑なシステムの形をとらざるを得ません。大多数の企業はオンプレミス、パブリッククラウド環境が混在しており、異なるOS、その上の無数のアプリケーション等、運用・監視の対象は年々増えているような状況にあります。
従来の監視ツールでは、仮想基盤やOSのログやイベントログの監視、性能監視を行うことができますが、アプリケーションの監視はできません。もしくは、APM(Application Performance Management)の仕組みだけでは、アプリケーションの監視を行うことができますが、仮想基盤やOSの監視は十分ではありません。
このような状況では、お客様へ影響を与えるようなシステム障害が発生した場合に、個々の監視ツールを突き合わせすることにより障害の原因特定を行う必要があるため、問題解決までに時間を要してしまう可能性があります。
これではお客様からの信用を失い、事業機会の損失に繋がりかねません。
そこで、複雑化したシステムの障害の原因特定や問題解決を迅速に行うためには、仮想基盤やOSからアプリケーションまでフルスタックで監視できる仕組みが必要です。
複雑化したシステムの監視に課題を抱えている企業は業界を問わず多く存在します。
ユースケースの一例として「オンラインバンキングシステムの監視」をご紹介いたします。
例えば、利用者がオンラインで振込手続きを行う際に、システムのレスポンスが悪いとストレスに感じ利用者が離れていくリスクがあります。また、”503 Service Temporarily Unavailable”のエラーが発生すると処理中のトランザクションがどこまで保証されるのかといったシステムの品質問題に発展してしまいます。
このようなシステムに本ソリューションを適用することで、システムを構成するアプリケーションの呼び出し数が通常よりも多い場合、検出されたアラートを契機に、どの仮想サーバでCPUやメモリなどのリソースが不足しているか、当該サーバの設置場所を確認することが可能です。これにより、迅速な原因特定および対処の検討が可能となり、被害を最小限に留めることができます。
また、システム全体を網羅的に監視することは、デジタルチャネル上のビジネスにおいては、ビジネス全体の姿を捉えることでもあります。各アプリケーションの利用状況(どの時間帯に何人のユーザーが利用しているか)を可視化できれば、利用頻度の高いサービスをさらに伸ばすための施策を検討しやすくなるという声をお客様からいただいております。障害時の迅速な原因特定および対処の検討だけでなく、売上のトップラインを伸ばす施策にも十分活かせるものと考えます。
その他ユースケース(抜粋)