IT Operations Analyticsとは```

データセンターのサーバーで作業しながらノートPCを見るITプロフェッショナル

近年、ITシステムの複雑さは大幅に増加しており、ITチームがオペレーションのヘルスを常に把握することが急務となっています。個々のアプリケーションに接続するデバイスの増加、 クラウド・コンピューティング の台頭、新製品の開発により、企業は顧客のニーズを満たすためにデジタル・サービスへの投資を行っています。

例えば、マッキンゼーが調査した99%の組織は、2020年以降に大規模なテクノロジー変革を推進していると回答している。2023年のガートナーの調査によると、CIOは、デジタルイニシアチブの59%が完了までに時間がかかりすぎ、52%が価値を実現するまでに時間がかかりすぎると考えています。

複雑さが増すにつれ、あらゆる組織のITサービスのヘルスと最適化を確保するための体系的なアプローチの必要性が高まっています。IT運用分析(ITOA)は、組織がITサービスによって生成されたデータを収集、保管、分析するためのデータ駆動型プロセスであり、その重要性が高まっています。

ITOAは運用データをリアルタイムの洞察に変換します。これは多くの場合、人工知能(AI )と 機械学習を 使用して組織全体の DevOpsを改善し、組織がより良いサービスを提供できるようにするAIOpsの一部です。オートメーションおよび機械学習の機能を使用すると、運用ワークフローが迅速化され、洞察がすぐに作成され、潜在的な人的エラーが方程式から排除されます。

ITOAは、テクノロジーを利用して大規模なデータ・セットを分析し、適切なIT戦略を特定することで、ITOpsの意思決定プロセスの合理化を支援します。

ITシステムの複雑化に伴い、組織はデータをより適切に監視および分析して、より多くの情報に基づいた意思決定を行う必要性が生じています。各組織には独自の技術スタックがありますが、通常はネイティブ・ソフトウェアとクラウド・プラットフォームで構成されています。現代の組織のITインフラストラクチャーは、大規模で相互依存するエコシステムで構成されており、1つのインシデントやエラーの問題がシステム全体を危険にさらす可能性があります。

組織のソフトウェア、インフラストラクチャー、ネットワーク・サービスの技術スタックにより、企業は顧客により多くのサービスを提供できるようになりますが、複雑さが増すため問題が発生する可能性が増え、それらのエラーは指数関数的な影響を与える可能性があります。ダウンタイムがサービスを中断し、顧客やパートナーとの評判を危険にさらす可能性があるため、組織はダウンタイムを最小限に抑えるよう努めています。IT部門は、新たな問題に対処し、稼働時間を増やし、組織のIT運用管理(ITOM)を円滑に実行するために、リソースを最適に配分する方法を知る必要があります。

ありがたいことに、ITシステムは独自のデータを生成するだけでなく、顧客、パートナー、従業員からさらに多くのデータを収集します。組織はこれらすべてのデータを使用して、IT Operations Analyticsを通じてシステム全体のヘルスを把握できます。

IT Operations Analytics(ITOA)とオブザーバビリティーの比較

ITOAとオブザーバビリティーは、IT オペレーションデータを使ってシステムがどのように機能しているかを追跡・分析し、運用の効率性と有効性を向上させるという共通の目標を共有する。どちらも、組織がIT運用上の問題をより迅速に解決できるようにすることでBusiness Intelligenceを支援し、将来の問題のトリアージ戦略に情報を提供し、新しいテクノロジーの導入を支援します。

オブザーバビリティーは、外部のアウトプットの知識のみに基づいて、複雑なシステムの内部状態を理解することに関係しています。メトリクス、イベント、ログ、トレース(MELT)という4つの重要な柱を追跡し、クラウドインフラやアプリの動作、性能、その他の側面を理解する。外部データを調査することで、システム内で何が起きているかを理解することを目的としている。ITOAは、データ・マイニングとビッグデータの原則を使用してシステム内のノイズの多いデータ・セットを分析し、それらの意味のある洞察を使用してシステム全体をよりスムーズに実行するフレームワークを作成します。ITオペレーションにおけるインシデントの根本原因分析に関係しており、ITチームは再発する可能性のある問題を修正プログラムできます。その目標は、他のソフトウェアやシステムも障害のリスクにさらされているかどうかを判断しながら、根本的な問題に対処することです。

IT Operations Analyticsテクノロジー

IT Operations Analytics(ITOA)には複数の主要なツールやプロセス、テクノロジーが含まれており、これらすべてが連携して組織で価値を生み出します。ここでは、最も一般的なテクノロジーとユースケースをいくつかご紹介します。

  • アプリケーション・パフォーマンス管理(APM): アプリケーション・パフォーマンス管理はITOAの重要な要素であり、マッキンゼーはその事業規模を 118億米ドルと見積もっています。これには、テレメトリー・データと監視ツールを使用してソフトウェア・アプリケーションの性能メトリクスを追跡し、リソースの割り当てとプログラムの使用状況を特定し、ボトルネックを解決し、異常を検知することを支援することが含まれます。APM(アプリケーション・パフォーマンス管理)の例には、読み込みが遅いWebページ、トランザクション処理時間、レイテンシーの問題などがあります。
  • インシデント管理: 組織は、インシデントを特定し、それに対処するための合理化されたアプローチを持つ必要があります。インシデント管理により、DevOps チームは、サーバーのクラッシュやその他のサービス品質の問題などの予期しないイベントに可能な限り迅速に対処できます。
  • ワークフローのオートメーション:ワークフローのオートメーションには、Eメールによる通知やデータ入力とアーカイブの自動化など、人間が行うタスクと自動化されたタスクの調整が含まれる。
  • 予測分析: 予測分析ソリューションは、過去のデータとリアルタイムのデータを使用して、ソフトウェアやITサービスが将来問題に遭遇するかどうかを予測し、組織に問題が発生する前に改善したりバグを修正したりする能力を提供する。予測分析は、インシデントの発生前に介入することで、ITオペレーションの最適化を支援します。予測分析は、サーバーの問題やトラフィックの急増の特定に役立ち、組織が防御の準備をしたり、問題を修正したりするのに役立ちます。
  • イベント相関とアラート:アプリケーションやホストのログ・データを分析してパターンを検知し、あるアプリケーションやシステムが他のアプリケーションやシステムに与える影響をよりよく理解し、複数のシステムに影響を与える可能性のある潜在的な問題についてDevOpsエンジニアに警告します。イベント相関は、異常なトラフィック・パターンや複数のログイン失敗などの問題がセキュリティー上の大きな懸念事項の一部であるかどうかを検知するために特に役立ちます。
  • クラウドの監視と保守 組織は、パブリッククラウド、マルチクラウド環境、またはオンプレミスアプローチのいずれを使用しているかにかかわらず、データセンターの信頼性を把握する必要がある。クラウドがダウンした場合、組織はそれがサービスの提供能力にどのような影響を与えるかを理解する必要があります。

IT Operations Analyticsの段階

IT Operations Analytics (ITOA) は、組織がシステム全体の大量の構造化および非構造化運用データを次の 3 つの主要な段階を通じて解析するのに役立ちます。

  1. 検索: ITオペレーションシステムは、事業オペレーション、顧客とのやり取り、ログ・ファイルによって生成されたビッグデータをキャプチャーして保管し、組織がシステム全体のヘルスをよりよく理解および管理するために使用できるようにします。ITOAでは、データを検索して現在のステータスを評価し、既存または将来の問題を特定し、問題があればITオペレーションチームに警告します。
  2. 視覚化:システムの動作を一元的に把握できるため、組織のビジネス上の意思決定に役立ちます。IT Operations Analyticsはビッグデータを消費し、使用可能なグラフ、チャート、スプレッドシートに変えます。視覚化は、対話型ダッシュボードまたはその他の管理パネルを通じて行うことができます。ライセンス、セキュリティー・アプリケーション、新しい設備やソフトウェアの購入など、組織がどこに投資する必要があるかを理解するのに役立ちます。
  3. 分析: 組織は、可視化されたデータ分析を使用して、システム性能とIT環境における異常なアクティビティーを検知し、それらの問題を解決するためのアクションを推奨できます。

IT Operations Analytics KPI

組織は、いくつかの主要業績評価指標(KPI)によって、IT Operations Analytics(ITOA)プログラムの成功を判断できます。

  • 平均修復時間(MTTR): IT Operations Analyticsは、ITチームが規律によって発見された問題を修復し、MTTRを改善するのに役立ちます。シームレスなITOAとインシデント管理プログラムを備えた組織は、問題を迅速に解決できます。
  • 誤検知率:自動化への依存度が高まっているITOAは、時として誤検知を生み出す可能性があり、サイト信頼性エンジニアやその他のIT従業員にとって不必要なトリアージや疲労につながる可能性があります。誤検知の増加は、ITOAプロセスやITオペレーションが意図したとおりに機能していないことを示している可能性があります。
  • サービスの可用性:これは、サービスの稼働時間(つまり、サービスが期待どおりに実行され、エンドユーザーがアクセスできる時間)の割合です。組織がサービスの可用性を追跡して、顧客の期待に応え、サービス・レベル契約(SLA)に関連して良好な状況にあることを確認することが重要です。
  • キャパシティー使用率:ITOAは、組織がITシステムがキャパシティーで稼働しているか、あるいは十分に活用されていないかを把握するのにも役立ちます。クラウドを使用して使用量を基準化し、不必要なコストを削減する組織のため、後者を知ることはますます重要です。

IT IT Operations Analyticsの主なメリット

IT Operations Analytics(ITOA)をしっかりと実践している組織には、次のようなメリットがあります。

  • コスト削減:組織がITOAを使用することで、運用効率の向上、ダウンタイムや停止の削減、コストのかかるデータ侵害やその他の外部脅威の最小化などのいくつかのコスト上のメリットを得ることができます。
  • 顧客体験の向上:顧客は、購入するサービスや製品が必要なときに機能することに大きな期待を寄せています。優れたカスタマー・サービスの提供を計画している組織は、不必要な中断を回避するためにITOAを利用して、顧客がそれらの組織の製品やソリューションにオンデマンドでアクセスできるようにしています。
  • セキュリティーとコンプライアンスの強化:ITOAは、脆弱なエンドポイントやエンド・デバイスによって引き起こされる潜在的なセキュリティー問題を検知する上で重要な役割を果たします。ITOAは、準拠していないシステム構成や機能しない監査ログなど、コンプライアンス上の問題を検知することもできます。
  • データ駆動型 意思決定:ITOAは、多くの場合、データおよび分析ツールに重点を置く大規模な組織の一部です。ITOAは、組織がよりスマートにIT投資を行い、参考情報をより適切に割り当て、将来の課題に備えるのに役立ちます。

IT自動化を受け入れましょう

IBM AIOps InsightsIBM Cloud Pak for AIOpsIBM Turbonomic、IBM InstanaなどのIT自動化ツールは、インシデントを予測、検出、修復するための観察可能性とリソース管理機能を提供し、すべてのシステムを稼働させ続けます。また、ITチーム内やITチーム間のイノベーションと管理の自動化にも役立ちます。

 

著者

Keith O'Brien

Writer

IBM Consulting

関連ソリューション
IBM Instana Observability

AIとオートメーションの力を活用することで、問題がアプリケーション・スタック全体でプロアクティブに解決します。

IBM Instana Observabilityの詳細はこちら
オートメーション・コンサルティング・サービス

単純なタスクの自動化だけではなく、注目度が高く、顧客と接し、収益を生み出すプロセスを、組み込み型の導入とスケーリングで処理しましょう。

オートメーション・コンサルティング・サービスの詳細はこちら
AIOpsソリューション

ITオペレーション用AIを活用して、優れた業績を実現するための洞察を得られる方法をご紹介します。

AIOpsソリューションの詳細はこちら
次のステップ

ITオペレーション用AIを活用して、優れた業績を実現するための洞察を得られる方法をご紹介します。

Instana Observabilityはこちら Instanaを試す