Gartnerによる造語である「AIOps」、つまりIT 運用のための人工知能は、自然言語処理や機械学習モデルなどの人工知能(AI) 機能を応用して、運用ワークフローを自動化および合理化するものです。
具体的には、AIOpsはビッグデータ、分析、機械学習機能を使用して次のことを行います。
AIOpsは、複数の個別の手動 IT運用 ツールを、インテリジェントで自動化された単一のIT運用プラットフォームに統合することで、IT運用チームがエンドツーエンドの可視性とコンテキストを備え、速度低下や障害に対してより迅速に、さらにはプロアクティブに対応できるようにします。
多様化、ダイナミック化し、監視が難しくなっているIT環境とサイロ化したチーム、そしてアプリケーションのパフォーマンスと可用性をほとんど、あるいはまったく中断させないというユーザーの期待とのギャップを埋めます。AIOpsが IT 運用管理の未来であると考えている専門家が多く、ビジネスがデジタル・トランスフォーメーション・イニシアチブに重点を置くようになるにつれて、需要は高まるばかりです。
AIOpsへの道のりは組織ごとに異なります。AIOpsへの取り組みのどの段階にあるのかを評価したら、チームがIT運用上の問題を観察、予測し、迅速に対処できるようにするツールの組み込みを開始できます。組織内で AIOps を改善するツールを検討するときは、それらのツールに次の機能があることを確認する必要があります。
オブザーバビリティー: オブザーバビリティーとは 、分散アプリケーションとその上で実行されるハードウェアから定常的に流れるパフォーマンス・データを取り込み、集約し、分析するためのソフトウェア・ツールおよびプラクティスのことで、顧客体験の期待、サービス・レベル・アグリーメント(SLA)、およびその他のビジネス要件を満たすために、アプリケーションをより効果的に監視、トラブルシューティング、およびデバッグすることを目的としています。これらのソリューションは、データの集約と統合を通じてアプリケーション、インフラストラクチャ、ネットワーク全体の全体的なビューを提供しますが、ITの問題に対処するための是正措置は講じません。ITの問題に対処するための是正措置はとりませんが、ITドメインにまたがるさまざまなデータソースからITデータを収集・集約し、エンドユーザーに潜在的な問題を警告し、ITサービスチームによる必要な是正措置の実施を期待するものです。これらのツールからのデータとそれに対応する視覚化は貴重ですが、意思決定を行ったり、技術的な問題に適切に対応したりするにはIT組織への依存が生じます。オペレーターが運用システムを手動で更新する必要があるリソースの最適化は、動的な需要状況では利点が見られない可能性があります。
予測分析: AIOpsソリューションは、より優れた洞察と自動化されたアクションのためにデータを分析・相関化し、ITチームが複雑化するIT環境の制御を維持し、アプリケーション・パフォーマンスを保証できるようにします。問題を関連付けて分離できることは、IT運用チームにとって大きな一歩です。これにより、組織内で発見できなかった問題を検出する時間が短縮されます。組織は、自動異常検出、アラート、解決策のレコメンドのメリットを享受し、全体のダウンタイムだけでなく、インシデントやチケットの数も削減されます。動的リソースの最適化は、予測分析を使用して自動化できます。これにより、需要の変動が大きい場合でも、リソース・コストを安全に削減しながら、アプリケーションのパフォーマンスを保証できます。
プロアクティブな対応: 一部のAIOpsソリューションは、速度低下や停止などの意図しないイベントに事前に対応し、アプリケーションのパフォーマンスとリソース管理をリアルタイムで統合します。アプリケーションのパフォーマンス指標を予測アルゴリズムに入力することで、さまざまな IT 問題と一致するパターンや傾向を特定できます。ITの問題を発生前に予測する機能を備えたAIOpsツールは、それに応じて関連する自動プロセスを起動し、問題を迅速に修正できます。組織は、平均検出時間(MTTD)の改善など、インテリジェントな自動化によるメリットを実感できるようになります。
このタイプのテクノロジーは、ビジネスにおける従業員と顧客の両方のエクスペリエンスの向上に役立つため、IT運用管理の未来となります。AIOpsシステムは、ITサービスの問題がタイムリーに解決されることを保証するだけでなく、IT運用チームにセーフティネットを提供し、組織のサイロ化やリソース不足のチームなど、人為的な見落としが原因で発生する可能性のある問題に対処します。
AIOpsの包括的なメリットは、IT運用が複数のIT運用ツールからのアラートを手動で選別するよりも早く、速度低下や停止を特定し、対処し、解決できることです。これにより、いくつかの主要なメリットが得られます。
リアクティブからプロアクティブ、そして予測管理へ: 組み込みの予測分析機能により、AIOpsは継続的に学習して最も緊急性の高いアラートを特定し、優先順位を付けることで、IT チームは潜在的な問題がスローダウンや停止につながる前に対処できるようになります。Electrolux社は、平均検出時間(MTTD)の短縮によりIT問題の解決を3週間から1時間に短縮し、修復タスクを自動化することで年間1,000時間以上を節約しました。
AIOpsには、ビッグデータ、高度な分析、機械学習機能が組み込まれており、次のユースケースに取り組みます。
AIOpsの仕組みを理解する最も簡単な方法は、AIOpsの各コンポーネント・テクノロジー(ビッグデータ、機械学習、自動化)がプロセスで果たす役割を確認することです。
AIOpsは、ビッグデータ・プラットフォームを使用して、サイロ化されたIT運用データ、チーム、ツールを1か所に集約します。このデータには、次のものが含まれます。
次に、AIOpsは、焦点を絞った分析と機械学習機能を適用します。
また、重要なアクションをリアルタイムかつ人間の介入なしで継続的に自動化し、スタックのあらゆる層でコンピューティング、ストレージ、ネットワークのリソースを最も効率的な形でアプリケーションに事前に割り振ります。
アプリケーションのパフォーマンス監視を強化して、誤動作をより迅速に解決するために必要なコンテキストを提供します。
AIOps Insights は、AIを活用したイベントおよびインシデント管理で企業のITリソースの可用性を管理する際に、中心となるIT運用チームが直面する問題に対応し、解決するためのSaaSソリューションです。
メインフレーム上の人工知能を使用して、システム管理、IT 運用、アプリケーションのパフォーマンス、および運用の回復力を向上させます。