AIOpsとMLOpsの比較:ビッグデータを「よりスマート」なITOPに活用する

男性のITエンジニアが大きなデータセンターのラップトップで作業していて、ラックサーバーが並んでいるのが見える

デジタル・データはここ数十年で爆発的に増加しています。コンピューティング・テクノロジーの大幅な進歩により、携帯電話からスマート家電、公共交通システムに至るまで、あらゆるものがデータを生成、処理し、先進的な企業がイノベーションを推進するために活用できるビッグデータ環境を構築しています。

しかし、ビッグデータの状況はまさにその通りです。ビッグ。実際、非常に巨大です。ウェアラブル・デバイス(フィットネス・トラッカー、スマート・ウォッチ、スマート・リングなど)だけでも、2020年には毎日およそ28ペタバイト(280億メガバイト)のデータが生成されます。そして2024年、世界の1日のデータ生成量は4億200万テラバイト(402兆バイト)を突破しました。

クラウド・サービスの採用やハイブリッド環境の利用、マイクロサービス・アーキテクチャーやさらに統合されるシステム、DevOpsの実践、その他のデジタル・トランスフォーメーションのテクノロジーの利用など、IT環境が複雑化するにつれて、従来のITオペレーション管理ツールは、多くの場合増え続けるデータ生成の要求への対処に苦慮することになります。

その代わりに、企業は高度なツールと戦略、すなわちIT運用のための人工知能(AIOps)や機械学習運用(MLOps)に依存し、膨大な量のデータを実用的なインサイトに変換することで、ITの意思決定を改善し、最終的には収益の向上を図る傾向にあります。拡張することができます。

AIOpsとMLOpsの違いとは。

AIOpsとは、ITオペレーション(ITOps)の様々な側面を強化し自動化するために、人工知能(AI)と機械学習(ML)テクノロジーを応用することを指します。

AIテクノロジーにより、コンピューティングデバイスは人間の心に通常付随する認知機能(学習、知覚、推論、問題解決など)を模倣できます。また、機械学習は、AIのサブセットであり、(明示的にプログラムされるのではなく)既存のデータと1つ以上の「訓練」方法を使用して、入力から学習するようにコンピューターを訓練するための幅広い技術のセットを指します。MLテクノロジーは、コンピューターが人工知能を実現するのに役立ちます。

その結果、AIOpsは、データとインサイトの生成機能を活用して、組織がますます複雑化するITスタックを管理できるように設計されています。

MLOpsは、機械学習(ML)と従来のデータ・エンジニアリングおよびDevOpsを組み合わせて、信頼性が高く、スケーラブルで、効率的なMLモデルを構築および実行するための組立ラインを作成する一連のプラクティスです。データ収集、モデル作成(ソフトウェア開発ライフサイクルのデータ・ソースに基づいて構築)、モデル・デプロイメント、モデル・オーケストレーション、ヘルスモニタリング、データ・ガバナンス・プロセスを含む、エンド・ツー・エンドのMLライフサイクルの合理化と自動化を支援します。

MLOpsは、データサイエンティストからソフトウェア・エンジニア、IT担当者まで、すべての関係者が共同作業を行い、モデルを継続的に監視および改善して、モデルの精度と性能を最大化できるようにします。

AIOpsとMLOpsは今日の企業にとって極めて重要なプラクティスです。それぞれが、異なるが補完的なITOpsのニーズに対応しています。ただし、AIとML環境での目的と専門化のレベルが根本的に異なります。

AIOpsがオペレーションの最適化を目的とした様々な分析やAIイニシアチブを含む包括的な分野であるのに対し、MLOpsはMLモデルのオペレーション面に特化しており、効率的なデプロイメント、監視、保守を促進します。

ここでは、AIOpsとMLOpsの主な違いと、それぞれがチームや企業がさまざまなITおよびデータサイエンスの課題に対処するのにどのように役立つかについて説明します。

MLOpsとAIOpsの実践

AIOpsとMLOpsの手法はAIに根ざしているため共通点もありますが、目的が異なったり、コンテキストで運用されたり、その他の重要な点で異なります。

1. スコープとフォーカス

AIOpsの方法論は、基本的にITオペレーションの強化と自動化を目的としています。その主な目的は、AIを使用してさまざまなITシステムからの膨大な量のデータを分析および解釈することで、ITオペレーションのワークフローを最適化および合理化することです。AIOpsプロセスはビッグデータを活用して予測分析を促進し、応答やインサイト生成を自動化し、最終的にはエンタープライズIT環境のパフォーマンスを最適化します。

対照的に、MLOpsは、モデルの開発とトレーニングからデプロイメント、監視、保守まですべてを含むMLモデルのライフサイクル管理に重点を置いています。MLOpsはデータサイエンスと運用チーム間のギャップを埋め、高い性能と精度を維持しながら、MLモデルを開発環境から本番環境に確実かつ効率的に移行できるようにすることを目的としています。

2. データの特性と前処理

AIOpsツールは、システムログ、性能・メトリクス、ネットワーク・データ、アプリケーション・イベントなど、さまざまなデータ・ソースとタイプを処理します。ただし、AIOpsのデータの前処理は多くの場合、以下を含む複雑なプロセスになります。

  • ノイズの多い不完全な非構造化データを処理するための高度なデータ・クリーニング手順
  • データを統一して分析に備えられるように、異種のデータ形式を統一された構造に変換する変換手法
  • さまざまなITシステムやアプリケーションのデータを結合し、全体的なビューを提供する統合方法

MLOpsは、構造化データと半構造化データ(フィーチャー・セットとラベル付きデータ・セット)に焦点を当て、次のようなMLタスクに直接関連する前処理手法を使用します。

  • 未加工データから意味のある入力変数を作成するためのフィーチャー・エンジニアリング
  • モデル・トレーニング用にデータを準備するための正規化およびスケーリング手法
  • 特に画像処理などのタスクのトレーニング・データ・セットを強化するデータ拡張方法

3. 主な活動

AIOpsは、ITOpsデータを継続的に追跡・分析するために、データ駆動型分析、MLアルゴリズム、その他のAI駆動型テクノロジーに依存しています。このプロセスには、異常検知、イベント相関、予測分析、自動化された根本原因分析と自然言語処理(NLP)などのアクティビティーが含まれます。AIOpsはITサービス管理(ITSM)ツールとも統合され、プロアクティブかつリアクティブに運用に関する洞察を提供します。

MLOpsには、MLモデルのシームレスな導入可能性、再現性、拡張性、可観測性を確保するための一連のステップが含まれます。機械学習フレームワーク、データパイプライン、継続的統合/継続的デプロイメント(CI/CD)システム、パフォーマンス監視ツール、バージョン管理システム、場合によってはコンテナ化ツール(Kubernetesなど)など、MLライフサイクルを最適化するテクノロジーが含まれています。

4. モデルの開発とデプロイメント

AIOpsプラットフォームは、機械学習を含むがこれに限定されない幅広い分析モデルを開発します。統計モデル(回帰分析など)、ルール・ベースのシステム、複雑なイベント処理モデルなどがあります。AIOpsは、これらのモデルを既存のITシステムに統合して、その機能と性能を強化します。

MLOpsは、データ準備、モデルのトレーニング、ハイパーパラメーターの調整、検証を含む機械学習モデルのエンド・ツー・エンドの管理を優先します。CI/CDパイプラインを使用して、予知保全とモデル展開プロセスを自動化し、新しいデータが利用可能になるとモデルの更新と再トレーニングに重点を置いています。

5. 主要ユーザーと利害関係者

AIOpsテクノロジーの主なユーザーは、IT運用チーム、ネットワーク管理者、DevOpsおよびデータ運用(DataOps)専門家、ITSMチームであり、いずれもAIOpsが提供する可視性の向上、積極的な問題検出、迅速なインシデント解決の恩恵を受けています。

MLOpsプラットフォームは、主にデータサイエンティスト、MLエンジニア、DevOpsチーム、ITOps担当者によって使用され、MLモデルを自動化および最適化し、AIイニシアチブからより迅速に価値を実現するために使用されています。

6. モニタリングとフィードバック・ループ

AIOpsソリューションは、システムの性能アップタイム、応答時間、エラー率などのKPIをオペレーション全体で監視し、フィードバックを取り入れて分析モデルとサービスを反復および改良することに重点を置いています。AIOpsテクノロジー内のリアルタイム監視およびアラート・システムにより、ITチームはIT問題を迅速に特定して解決できます。

MLOpsモニタリングでは、チームがモデルの精度(正確性)、精度(一貫性)、想起(メモリー)、データ・ドリフト(時間の経過とともにモデルを劣化させる外部要因)などの指標を継続的に追跡する必要があります。MLOpsテクノロジーは、これらのメトリクスに基づいてMLモデルを継続的に更新し、パフォーマンスの問題を修正し、データ・パターンの変更を組み込みます。

7. ユースケースとメリット

AIOpsは、通常は人間の作業者を必要とする日常的なタスクを自動化することで、企業の業務効率を高め、運用コストを削減するのに役立ちます。このオートメーションは、ITスタッフが(反復的な保守作業ではなく)より戦略的なAIイニシアチブに集中できるようになります。また、予測分析を活用し、修復プロセスを自動化することで、インシデント管理を加速し、AIOpsシステムがダウンタイムを引き起こしたり、ユーザー・エクスペリエンスに影響を与えたりする前に問題を発見して修正できるようにします。

サイロ化を解消し、異なるチームやシステム間のコラボレーションを促進するAIOpsソリューションは、企業のデータセンターやクラウド環境を管理するIT部門で頻繁に使用されています。AIOpsは、ITOPs担当者が予測アラート処理を実装し、データ・セキュリティーを強化し、DevOpsプロセスをサポートすることを可能にします。

MLOpsテクノロジーは、企業がMLモデルの市場投入までの時間を短縮し、データ・サイエンス・チームと運用チーム間のコラボレーションを強化し、組織全体でAIの取り組みを拡張するのに役立ちます。MLOpsは、MLモデルが業界のベスト・プラクティスに従ってデプロイおよび管理されるようにすることで、組織がデータ・コンプライアンスとガバナンスの基準を維持するのにも役立ちます。

MLOpsには金融を含む業界全体でさまざまなユースケースがあり、不正行為の検知とリスク評価を容易にすることができます、医療分野では診断モデルの構築や患者モニタリングの改善に貢献します。小売・EC分野では、MLOpsサービスを用いてレコメンデーションシステム(例:オンラインショッピングプラットフォームの「こちらもおすすめ」表示)を構築し、在庫管理を効率化しています。

IBM® Turbonomicによる高品質のAIOpsおよびMLOpsの実装

AIOpsとMLOpsは、ビッグデータの世界で競争上の優位性を維持するために不可欠です。IBM® Turbonomicプラットフォームを使用することで、先進的な企業はインテリジェントな自動化により、ハイブリッドクラウド環境(Amazon Web Services(AWS)、Azure、Google Cloud、Kubernetes、データセンターなど)を管理し、継続的に最適化することができます。

IBM® Turbonomicは、パブリックプライベートハイブリッドクラウド環境を含むITインフラの性能を向上させ、コストを削減するのを支援するソフトウェアプラットフォームです。Turbonomicを使用することで、チームは人間の介入なしにリアルタイムで最適化タスクを自動化し、ITスタック全体にネットワーク・リソースを積極的に提供し、クラウド環境でのリソースのオーバープロビジョニングを防ぐことができます。

 
ベンチに座ってモバイルを使用している男性の上からの眺め

見逃せない知見AIニュースレターを購読する

AI、量子コンピューティング、クラウド、セキュリティーなどに関する専門ニュースをチェックして、知識を自分のものにしましょう。

今すぐ登録