IBM® Live Webセミナー - 今すぐ登録 APM(アプリケーション・性能管理)とオブザーバビリティーの未来とは。

AIOpsとは?

大手クリエイティブ・エージェンシーで打ち合わせをするビジネスマンたち

AIOpsとは?

ITオペレーションのための人工知能(AIOps)は、自然言語処理機械学習モデルなどの人工知能(AI)機能を応用して、ITサービス管理と運用ワークフローを自動化、合理化、最適化します。

AIOpsは、ビッグデータ、分析、ML機能を活用して、次のことを実現します。

  • コンポーネント、アプリケーション・デマンド、性能監視ツール、サービス・チケット・システムによって生成された膨大な(そして増え続ける)データを、エンタープライズ技術スタックに収集して集約します。
  • 「ノイズ」から「シグナル」をインテリジェントにシフトして、アプリケーションの性能と可用性の問題に関連する重要なイベントとパターンを特定します。
  • 根本原因を診断し、迅速なインシデント対応と修復のためにITおよびDevOpsに報告します。場合によっては、人の介入なしにこれらの問題を自動的に解決します。

AIOpsは、複数の個別の手動ITオペレーション・ツールを、インテリジェントで自動化された単一のITオペレーション・プラットフォームに統合することで、ITオペレーション・チームがエンド・ツー・エンドの可視性とコンテキストを備え、速度低下や障害に対してより迅速に、さらには積極的に対応できるようにします。

多様でダイナミック、かつ監視が困難なITランドスケープとサイロ化したITチーム、そしてアプリの性能と可用性に対するユーザーの期待とのギャップを埋めることができます。ビジネス分野全体でのデジタル・トランスフォーメーション・イニシアチブの普及に伴い、多くの専門家はAIOpsがITオペレーション管理の未来であると考えています。

AIOpsコンポーネント

AIOpsには、データのアウトプットや集約、アルゴリズム、オーケストレーション、視覚化など、さまざまなAIのストラテジーと主要な機能を組み込むことができます。

アルゴリズムはITの専門知識、ビジネス・ロジック、目標を体系化し、AIOpsプラットフォームがセキュリティー・イベントに優先順位を付け、性能を決定できるようにします。アルゴリズムは機械学習(ML)の基礎を形成し、プラットフォームがベースラインを確立し、環境データの変化に応じて適応することを可能にします。

機械学習では、教師あり学習、教師なし学習、強化学習、ディープラーニングなどのアルゴリズムと手法を使用して、システムが大規模なデータセットから学習し、新しい情報に適応できるようにします。AIOpsでは、MLは異常検知、根本原因分析(RCA)、イベント相関、予測分析に役立ちます。

AIOpsプログラムは、さまざまなネットワーク・コンポーネントやデータ・ソースからデータを収集します。分析は未加工データを解釈して新しいデータとメタデータを生成します。これにより、システムとチームの両方が傾向を特定し、問題を切り分け、キャパシティ需要を予測し、イベントを管理できるようになります。

AIOpsツール内のオートメーション機能により、AIOpsシステムはリアルタイムの洞察に基づいて動作できるようになります。例えば、予測分析ではデータ・トラフィックの増加を予測し、(アルゴリズム・ルールに準拠しながら)必要に応じて追加のストレージを割り当てるオートメーション・ワークフローをトリガーすることができます。

AIOpsのデータの可視化ツールは、ダッシュボード、レポート、グラフィックスを通じてデータを表示するため、ITチームはAIOpsソフトウェアの機能を超えて変化を監視し、意思決定を行うことができます。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

AIOpsの仕組みは?

AIOpsは、ビッグデータ・プラットフォームを使用して、サイロ化したITOpsデータ、チーム、ツールを一箇所に集約します。このデータには以下が含まれます。

  • 過去のパフォーマンスとイベントデータ
  • リアルタイム・オペレーション・イベント
  • システムログとメトリクス
  • パケット・データを含むネットワーク・データ
  • インシデント関連データとチケット発行
  • アプリケーション需要データ
  • インフラストラクチャー・データ

AIOpsプラットフォームは、次に集中分析とMLツールを適用して以下を行います。

  • 重要なイベントアラートを「ノイズ」から切り離します。AIOpsはITOpsのデータを精査して信号を分離し、異常なイベントとノイズ(それ以外のもの)を区別し、データのパターンを特定します。
  • 根本原因を特定し、解決策を提案します。AIOpsは、異常イベントを環境全体の他のイベント・データと相関させることで、障害や性能問題の原因を突き止め、改善策を提案することができます。
  • プロアクティブなリアルタイム解決など、対応を自動化します。少なくとも、AIOpsツールは、アラートと推奨されるソリューションを適切なITチームに自動的にルーティングし、問題の性質とソリューションに基づいて対応チームを作成することもできます。多くの場合、MLの成果を処理し、問題が発生したときに(多くの場合、ユーザーが問題が発生したことに気づく前に)対処するための自動的なシステム応答をトリガーすることもできます。
  • 将来の問題への対処を改善するために、絶えず学びます。AIモデルは、(DevOpsチームが新しいインフラストラクチャーを準備したり、既存のインフラストラクチャーを再構成したりする場合など)環境の変化をシステムが理解し、それに適応するのを助けることができます。
オフィスでミーティングをするビジネスチーム

IBMお客様事例

お客様のビジネス課題(顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など)を解決した多岐にわたる事例のご紹介です。

AIOpsの実装

AIOpsへの道のりは組織ごとに異なります。ビジネス・リーダーがAIOpsのストラテジーを抽出したら、ITチームがITの問題を観察し、予測し、迅速に対応するのに役立つツールを取り入れ始めることができます。

AIOpsを改善するためのツールを選択する際、多くのチームは以下の主要な機能を考慮します。

  • オブザーバビリティー:オブザーバビリティー(可観測性)とは、外部出力の情報のみに基づいて、複雑なシステムの内部状態を理解できる程度を指します。システムが観察可能であればあるほど、チームは、特定された性能問題から根本原因までの経路を、追加のテストやコーディングなしで、より迅速かつ正確にナビゲートすることができます。

    先進的なオブザーバビリティー・ツールは、最新の分散ビジネス・サービスとアプリケーションに深い可視性を提供し、より迅速で自動化された問題の特定と解決を実現します。

    ITとクラウド・コンピューティングの分野では、オブザーバビリティーは高度なソフトウェア・ツールとプラクティスを使用して、分散アプリケーションとそれらが実行されているハードウェアとネットワークから定常的に流れる性能・データを集約、関連付け、分析します。オブザーバビリティーは、アプリとネットワークの監視、トラブルシューティング、デバッグのプロセスをより効果的に行い、システムがユーザーエクスペリエンスの期待、サービス・レベル・アグリーメント(SLA)、およびその他のビジネス要件を満たし続けることを可能にします。

  • 予測分析:予測分析は、履歴データ、統計モデリング、データマイニング技術、機械学習を使用して将来の結果を予測する高度な分析の一分野です。AIOpsでは、チームは予測分析を使ってデータのパターンを見つけ、リスクと機会を特定します。

    現代の企業には、組織全体にわたる異種のデータ・リポジトリからのデータが氾濫しています。予測分析では、ロジスティック回帰モデルや直線回帰モデル、ニューラル・ネットワーク、決定木などのツールを使用して、膨大な量の企業データから実行可能な洞察を得て、将来のシステムイベントを予測します。

  • プロアクティブな対応:一部のAIOpsソリューションは、速度低下や停止などの意図しないイベントに事前に対応し、アプリケーションの性能とリソース管理をリアルタイムで統合します。

    アプリケーションの性能指標を予測アルゴリズムに入力することで、さまざまなIT問題と一致するパターンや傾向を特定できます。また、ITの問題を発生前に予測する機能を備えたAIOpsツールは、解決を自動化し、システムの問題に迅速に対処できます。

    インシデント対応のオートメーション技術は、効果的なITシステム管理に不可欠です。これにより、企業はクライアントと顧客体験の両方を改善し、平均検知時間(MTTD)などの主要なメトリクスを大幅に改善できます。さらに、AIOpsシステムはITオペレーション・チームにセーフティネットを提供し、人間による監督だけでは見落としてしまう可能性のある問題に対処します。

ドメインにとらわれないAIOpsツールとドメイン中心のAIOpsツールの比較

AIOpsプラットフォームは、組織のITニーズとAIOpsストラテジーに応じて、さまざまなレベルのオートメーションを提供できます。

ドメインにとらわれないアプローチにより、AIOPsソフトウェアは幅広いソースからデータを収集し、様々な運用ドメイン(例えば、ネットワーク、ストレージ、セキュリティー)の問題を解決します。これらのツールは、性能全体を包括的かつ全体的に把握できるため、組織が複数の分野にまたがる問題に対処するのに役立つ。

しかし、ITチームが特定のペインポイントに取り組んだり、業種・業務のニーズに対応したりするために必要な洞察は得られない可能性があります。ドメインにとらわれないツールの幅広い性質は、一般的な概要を提供することには優れているが、微妙な課題に対して的を絞ったインシデント管理ソリューションを提供するには不十分であることを意味します。

ドメイン中心のAIOpsツールは、IT環境であれ特定の業種・業務であれ、特定のドメインに焦点を当てます。これらのツールはITランドスケープ全体をカバーしているわけではないが、高度に専門化されており、それぞれの領域に特化したデータセットで学習されたAIモデルを備えています。この専門性により、的確な洞察とソリューションを提供することができます。

例えば、ネットワークの文脈では、ドメイン中心のツールは、標準的なネットワーク・プロトコルとパターンを理解することによって、ボトルネックの原因を正確に特定することができます。また、専門的な訓練と集中力のおかげで、速度低下が分散型サービス妨害(DDoS)攻撃の結果なのか、それとも単純なシステムの設定ミスなのかを判断することができます。

組織の選択するツールの種類に関係なく、チームは次のことが重要です。

  • 信頼性と精度を最適化するために、包括的で代表的なデータセットを使用してAIモデルをトレーニングします。
  • 利害関係者がAIに基づく意思決定を理解できるよう、透明で公正なAIモデルを使用します。
  • AIOpsへの移行をより円滑にするために、ITチームがツールや洞察を効果的に使用できるようにトレーニングします。
  • チームとシステムに責任を持たせるため、AIモデルの結論を監督し、検証する人間を配置します。

AIOpsとDevOpsの比較

AIOpsとDevOpsはどちらもITオペレーションを強化するために設計された方法論ですが、ソフトウェア・ライフサイクルの異なる側面に焦点を当てています。

DevOpsは、開発チームとオペレーションチームを統合し、ソフトウェア開発プロセス全体にわたるコラボレーションと効率を促進することを目的としています。コーディング、テスト、デプロイメントのプロセスを合理化および自動化し、継続的統合継続的デリバリー(CI/CD)パイプラインを加速して、より迅速で信頼性の高いソフトウェアリリースを実現します。

DevOpsはまた、Infrastructure as Codeやコラボレーション・プラットフォームなどのツールを使って、チーム間のサイロ化を解消し、品質を損なうことなくソフトウェアのアップデートを迅速に提供できるようにします。

DevOpsがソフトウェア開発とデプロイメントの迅速化と改良に重点を置いているのに対し、AIOpsはAIを使って企業のIT環境の性能を最適化し、システムが円滑かつ効率的に稼働するようにします。AIOpsプラットフォームは、MLとビッグデータの分析を使用して膨大な量の運用データを分析し、ITチームが問題を積極的に検知して対応することができるようにします。

AIOpsとDevOpsサービスを組み合わせて使用することで、企業はソフトウェアのライフサイクル全体を管理するための補完的で包括的なアプローチを構築することができます。

AIOpsのユースケース

AIOpsサービスは、以下のようないくつかのユースケースに取り組む企業を支援することができます。

根本原因分析

根本原因分析(RCA)は、問題の根本原因を特定し、適切な解決策で修復します。RCAは、チームが問題の核心ではなく、問題の症状を治療するという非生産的な作業を避けるのに役立つ。

例えば、AIOpsプラットフォームは、ネットワーク障害の原因を追跡して直ちに解決し、将来同じ問題が発生しないようにするための安全策を設定できます。

例外検知

AIOpsツールは、大量の履歴データを調べ上げ、データセット内の非定型データ・ポイントを発見することができます。このような外れ値は、チームが問題のある事象(例えばデータ侵害)を特定・予測し、そのような事象がもたらす潜在的にコストのかかる結果(ネガティブなPR、規制当局による罰金、消費者の信頼低下など)を回避するのに役立ちます。

性能監視

最新のアプリケーションは、多くの場合、複数の抽象化レイヤーによって分離されているため、基盤となるオンプレミス・サーバー、ストレージ・リソース、ネットワーク・リソースがどのアプリケーションをサポートしているかを理解することが困難です。AIOpsは、このギャップを埋めるのに役立ちます。

クラウド・インフラストラクチャー、仮想化、ストレージ・システムの監視ツールとして機能し、使用状況、可用性、応答時間などのメトリクスをレポートします。さらに、AIOpsはイベント相関機能を使用して情報を統合・集約し、ユーザーがより簡単に情報を利用・理解できるようにします。

クラウドの採用と移行

ほとんどの組織にとって、クラウドの導入は全体的なものではなく、段階的なものです。その結果、多くの場合、ハイブリッド・マルチクラウド環境(APIやマイクロサービスなどのテクノロジーに依存する相互接続された部分が多数含まれる)が、文書化するにはあまりにも迅速かつ頻繁に変更される複数の依存関係が存在することになります。これらの相互依存関係を明確に可視化することで、AIOpsはクラウド・マイグレーションハイブリッドクラウド・アプローチの運用リスクを劇的に軽減することができます。

DevOpsの採用

DevOpsは、開発チームにITインフラストラクチャーのプロビジョニングと再構成の権限を与えることで開発をスピードアップします。しかし、チームは依然としてアーキテクチャーを管理する必要があります。AIOpsは、ITチームが過度の人間の監視なしにDevOpsをサポートするために必要な可視性とオートメーションを提供します。

AIOpsのメリット

AIOpsの主なメリットは、ITOpsチームが複数のツールやコンポーネントからのアラートを手作業で選別するよりも早く、速度低下や停止を特定し、解決できるようになることです。これにより、ビジネスは次のことを達成することができます。

平均修復時間(MTTR)の短縮

ITオペレーションのノイズを遮断し、複数のIT環境からの運用データを相関させることで、AIOpsは根本原因を特定し、人よりも迅速かつ正確に解決策を提案することができます。迅速な問題特定とインシデント解決プロセスにより、組織は今まで考えてこなかったMTTR目標を設定し、達成できるようになります。

運用コストの削減

運用上の問題を自動的に特定し、対応スクリプトを再プログラムすることで、運用コストを削減し、より正確な参考情報の割り当てを実現します。また、ITスタッフのワークロードを軽減し、より革新的で複雑な業務に参考情報を割くことができるため、従業員のエクスペリエンスも向上します。

より良いオブザーバビリティーとコラボレーション

AIOps監視ツール内の統合により、DevOps、ITOps、ガバナンス、セキュリティーの各チーム間のより効果的なコラボレーションが促進されます。また、可視性、コミュニケーション、透明性の向上により、これらのチームは意思決定を改善し、問題に迅速に対応することができます。

予測的ITOP管理

内蔵の予測分析機能により、AIOpsプラットフォームは継続的に学習し、最も緊急性の高いアラートを特定し、優先順位を付けます。これにより、ITチームは潜在的な問題に対処することで、計画外のダウンタイム、中断、サービス停止につながる前に対処できるようになります。

関連ソリューション
IBM Turbonomic

既存のITインフラストラクチャーを自動的にスケーリングして、低コストでより高い性能を実現します。

IBM Turbonomicの詳細はこちら
AIOpsソリューション

IT運用のためのAIが、卓越したビジネス・パフォーマンスを実現するのに必要な洞察をどのように提供するかをご覧ください

AIOpsソリューションの詳細はこちら
オートメーション・コンサルティング・サービス

単純なタスクの自動化だけではなく、注目度が高く、顧客と接し、収益を生み出すプロセスを、組み込み型の導入とスケーリングで処理します。

オートメーション・コンサルティング・サービスの詳細はこちら
次のステップ

AIを活用したIT運用が、優れたビジネスパフォーマンスを促進するためのインサイトをどのように提供するかをご紹介します。

Turbonomicはこちら AIOpsソリューションの詳細はこちら