S
Smarter Business

3分で読める「ここまで来たAIOps!」1.DX時代におけるITシステム運用の課題

post_thumb

谷松 清孝
日本アイ・ビー・エム
IBMコンサルティング事業本部
ハイブリッド・クラウド・サービス
アソシエイト・パートナー

 

三島 善行
日本アイ・ビー・エム
IBMコンサルティング事業本部
ハイブリッド・クラウド・マネージメント
シニア・プロジェクト・マネージャー

 

小林 武彦
日本アイ・ビー・エム
IBMコンサルティング事業本部
AIOps Technology IT Architect

ITシステム運用の今までとこれから

突然ですが、ITシステム運用と聞くとみなさんはどのようなイメージをお持ちですか?

“サーバールームの監視端末の前で、眠い目をこすりながら、ずっと画面を見てどこかで障害が起きていないか確認”
“いざ障害が起きるとパトランプが回り、早朝だろうが深夜だろうが遠慮なく、あちこちに電話して対応方法を確認”
“やっとのことで対処方法が決まると、手順書やチェック・リストを見ながら、おそるおそるコマンドを実行”
“月末には、1ヶ月分のCPUやメモリ使用率のグラフを作ったり、発生したトラブル・リストを作ったりして作業報告”
“毎月同じことの繰り返し。こんな生活いつまで続くのだろうという運用担当者の心の声”

さすがにこれは、昭和の話でしょうか?

定期的に実施するような定型作業は自動化されて、少しは担当者の負荷が軽減されているかもしれませんが、それでも何か起きたら結局は人が間に入って判断が必要な状態ではないでしょうか。これでは運用担当者の苦労は絶えません。

これからは、ITシステム運用もDXの時代です

  • 障害が起きると、自動検知して大量のエラー・ログの中から根本原因を特定し、障害チケットを自動起票。
  • 対処法が決まっている既知のエラーであれば、人が介在することなく自動復旧。
  • 人は未知のエラーに集中して対応。未知のエラーも一度発生すれば既知のエラーになるので、自動復旧できるように日々改善を実施するなど、システムをより安定して利用できるようなイノベーティブな活動に従事していきます。
  • システム状況や障害対応状況は、見たい時に見たい人がオンラインでいつでも確認可能
  •  
    これだけではありません。今や障害が起きてからでは遅いのです。対処から予防へと運用は変わっていきます。

  • CPUやメモリの使用状況がいつもと違う、ログ上にいつもは出ていない警告が出力されているなどのトラブルの予兆を検知して、対処方法をリコメンドしてくれることにより、システムダウンにより引き起こされるビジネス・ロスの事前回避なども可能になります。

こういった高度なITシステム運用を実現するのに役立つのが、AI for IT Operations (AIOps)です。AIOpsは、アプリケーション開発で活用されている自動化やAI技術をITシステムの運用作業にも活用し効率化・高度化を目指す技術です。

昨今のようにビジネス環境の変化が激しいアジャイルな時代には新しい商品やサービスに対応させるためITシステムの機能拡張が日常のように実施され、業務処理量が急激に変化することも珍しくありません。

オンプレだけでなくマルチクラウドで複雑化し変化の激しいDXシステムを運用するためにはDXに対応したシステム運用が求められており、それを解決するソリューションの1つがAIOpsです。

シリーズ 3分で読める「ここまで来たAIOps!」では、ITシステムの運用監視で適用されるAIや自動化技術と、実装事例の1つとして日本アイ・ビー・エム(以下、日本IBM)が提供する「AIを活用したITシステム運用サービス(以降、本サービス)」を下記の順番で説明していきます。

  1. DX時代におけるITシステム運用の課題
  2. AIOpsと自動化技術による運用の効率化・高度化(前編)
  3. AIOpsと自動化技術による運用の効率化・高度化(後編)
  4. AIを活用したITシステム運用サービスでAIOpsを始める
  5. 導入効果とまとめ

1.DX時代におけるITシステム運用の課題

ビジネス環境の急激な変化
新型コロナウイルス感染症の影響や米中関係の悪化によるサプライチェーンの見直し、戦争によるエネルギー不足、大きな為替変動、インフレによる物価の高騰、脱炭素対応の本格化など国内外のビジネス環境は急速な変化が続いています。この変化に迅速に対応するため、企業は継続的なシステム開発・拡張が求められています。

運用担当者の人材不足
国内では少子高齢化により労働人口が減少しています。ITシステムは社会インフラとしての重要性が増した分、障害発生時の影響が大きく運用担当者へのプレッシャーやストレスが増大しています。深夜、土日祝日、緊急サポートによる疲弊もあります。

特にシステム運用作業は保守的・受け身的な作業イメージがあり、新しい技術を獲得し成長したい若手技術者が運用を担当したがらない傾向もあります。

高品質なサービスを継続的に提供するためには運用担当者の負荷を軽減する必要があります。

複雑化するIT環境下での先を見越した運用の必要性
ビジネスを支えるITシステムはオンプレの既存環境に加え、SaaSを含めたマルチクラウド環境との接続が増え益々複雑になっています。さらにセキュリティーの観点では個人情報保護の規制が強化され、ランサムウェアの被害も増大しています。

従来のようにCPUやメモリ、ディスク容量、ネットワークなどのリソースや、システムやアプリケーションのログを単体で監視し、アラート通知が発生する毎に人が判断・処理するような受け身の運用ではサービス回復に時間が掛かり、ユーザーの不満が増加、サービスからの離脱や販売機会損失に繋がりかねません。

現在のITシステムでは全体のパフォーマンス監視を行い、障害発生時の自動回復、障害の異常検知・予兆検知、事前回避など先を見越した運用が求められています。

次の記事では課題の解決方法としてAIOpsと自動化をご説明します。