IBM Watson Blog

Watson AIOpsでIT運用を刷新する

記事をシェアする:

アプリケーションのエンドツーエンド・ワークフローのコンポーネントが使用できなくなり、社内ユーザーやお客様に影響を及ぼすようになると、その時点からお客様の満足度に大きな影響が出始める可能性があります。市場調査会社の  Aberdeen (外部ページ、英語) は、障害により1時間あたり約260,000ドルの損失がでると見込んでいます。多くの企業には、この障害を迅速に解決できる設備が整っていません。

とはいえ、懸念を募らせているCIO(最高情報責任者)に良いニュースもあります。市場インテリジェンス会社であるIDCによると、AIを活用する企業は2024年までに、顧客、競合他社、規制当局、パートナーへの対応が活用しない企業に比べて50%速く対応できるようになると予測しています。[1]

 

データの分散、差し迫った課題

多くのIT部門が直面している主要な問題は、現代の企業が絶えず処理しているさまざまなソースからの膨大なデータを、従来のデータ分析の手法やアプリケーションではリアルタイムでモニターできないことです。この様な状況に起因する問題が発生した場合、その根本原因のトラブルシューティングには数時間から数日かかる可能性があります。

とはいえ、CIOにとって明るい兆しも伺えます。ここ10年で、IT業界にIT運用向けの新しい一連のフレームワークが台頭してきました。DevOpsとDataOpsは、IT部門と他企業との統合方法に革命をもたらしました。昨今の業界における新たなメソドロジーはAIOpsと呼ばれており、これによりIT部門の能力がいっそう高まり、変化への対応とリアルタイムでの問題解決が実現します。

 

AIでできること

AIは急速な勢いで今日のIT部門の必須コンポーネントになりつつあります。コストがかかるかもしれないIT障害や壊滅的な打撃をうけるIT障害を、障害発生中あるいは障害発生前に検出、特定、対処するための方法を、企業がAIを使用することで自動化できるためです。AIソリューションなら膨大な量の構造化/非構造化データにも対処できます。従来型のシステム・モニター・ツールはこのようなデータを単一のビューで監視できるような設計にはなっていませんでした。

AIは、パフォーマンス・アラートからインシデント・チケットまで、ITインフラ全体にわたる異種混合配列のソースからデータを収集できます。このデータを使用すると、たとえば、ITリソースの需要が低い時刻を特定し、計算リソースを自動的にシフトすることで、コスト削減を可能にし、生産性の向上を実現できます。自動調整にしたくない場合は、データをビジュアルで表示することで、IT 運用マネージャーまたはSite Reliability Engineer (SRE)に一連の推奨作業を提供し、その推奨の根拠を説明することができます。AIは、ルーター間でトラフィックをシフトする、ドライブのスペースを解放する、アプリケーションを再起動するなどのタスクを自動化できます。また、AIシステムを自己修正するようにトレーニングして、ITマネージャーとそのチームが価値の高い作業に時間を費やせるようにし、同時に企業の運用を完全に可視化することもできます。

 

IBM Watson AIOpsの紹介

さて、いよいよWatson AIOpsが発表されます。新製品であるWatson AIOpsは機械学習、自然言語理解、説明可能なAI、その他テクノロジーを活用してIT運用の自動化を実現します。IBM Researchの研究成果を活用して、Watson AIOpsでは、将来の結果に対処したり、それを形成する機能を企業に提供し、事後対処から事前対応へと戦略的に移行させます。これにより、コストと人員を効率化し、企業の情報アーキテクチャー全体で回復力を向上し、問題解決を迅速にできるようになります。

Watson AIOpsは、データ・ソース全体と一般的なIT業界ツールをリアルタイムに点と点を接続するようにトレーニングされており、問題を迅速に検出して特定できるよう支援します。これは、メトリックやアラートのような従来の運用上の構造化データだけでなく、ログやチケットなどの半構造化/非構造化データにまでを対象とし、それらのデータを機械学習と自然言語理解を使用して組み合わせ、状況を判別して対処するための総合的な問題レポートを作成します。

 

仕組み

Watson AIOpsでは、さまざまな異常ログやアラートを、過去の状況との類似性からだけでなく、時間的空間的な推論に基づいて、グループ化します。次に、問題の発生箇所のポインターを提供し、爆発半径 (blast radius) と呼ばれる影響を受ける可能性のある他のサービスを判別します。これは、環境内にある既存ツールによるデータに基づいて、問題の詳細をすべてアプリケーション・トポロジーに則って表示し、複数のシグナルを簡潔なレポートにすることで行われます。

Watson AIOpsは、IBMの優れた自然言語処理 (NLP) テクノロジーを活用して、チケットの内容を理解し、解決アクションを自動的に識別して導き出します。新しい問題が識別されると、Watson AIOpsは過去の類似問題を識別し、現在起きている問題に対処してサービスを復元するために、次に行う最適なアクションを提示します。Watson AIOpsの洞察を用い、予測機能と事前対応機能を活用して自動化をさらに促進することで、運用チームはより価値の高い作業にシフトできます。

IBMのAIイノベーションは信頼できる説明可能なテクノロジー開発の最先端にあり、SREがWatson AIOpsの推奨の根拠を解釈できるように支援します。AIシステムのアクションに対する信頼を築くには、透過性と説明可能性の維持が重要です。IBMは引き続き、Watson OpenScaleなどの、信頼を確立するAIソリューションを開発していきます。

 

サービスの背後にあるテクノロジー

IBMのAI開発の多くがそうであるように、Watson AIOpsの基礎となるテクノロジーの大部分はIBM Research (英語)から生まれました。この新しいオファリングはAI for ITと呼ばれるものの一部であり、IBM Researchが長年にわたり研究/開発してきた、AIを使用したITライフサイクルの変換方法の集大成です。詳しくはこちら (英語) (IBM Researchの主任研究員Ruchir Puriによる記事) をご覧ください。

 

AIOpsを使用するIBMのお客様

IBMはSlackと提携して、世界有数のChatOpsエクスペリエンスを提供しています。ChatOpsでは、ヘルプ・チケットやサポート・メールを作成して応答するような従来の方法を取りません。問題が発生した場合は、Slack内部から特定のエンジニアまたはグループに向けてWatson AIOpsによるアラートが出されます。そして、システムを解決に導いたり、コードをデプロイしたりできます。チャット環境から離れる必要はありません。全員が同じページに集まることができ、解決やデプロイなどのアクションはすべて1つの場所に記録されます。Box との統合に加え、このパートナーシップは、COVID-19の蔓延により在宅で勤務しているエンジニアにとって、現行の計画外配布に対しても即時に実施できる解決策であり、今後、ITサービス対応が増加することが想定される為、有効な方策と言えるでしょう。

Watson AIOpsは、PagerDuty、LogDNA、Sysdigなどのクラス最高のモニタリング・ソリューションとも提携して、今日のIT環境全体に総体的な洞察を提供しています。加えてIBM Watson AIOpsは他のIT Opsツールとも統合し、高度なカスタマイズが可能で、またRed Hat Openshiftを使用することで任意のクラウドで実行することもできます。

 

[1] IDC FutureScape: Worldwide Digital Transformation 2020 Predictions, Doc # US45569118, Oct 2019

 

原文:Revolutionize IT Operations with Watson AIOps (https://www.ibm.com/blogs/watson/2020/05/revolutionize-it-operations-with-watson-aiops/)

More IBM Watson Blog stories

【セミナー抄録】セキュリティーの脅威を経営課題として捉える セキュリティーリスク管理の核心

IBM Data and AI, IBM Watson Blog

2022年12月14日(水)13:00-14:00に開催されたセミナー「セキュリティーの脅威を経営課題として捉える セキュリティーリスク管理の核心」の抄録です。   昨今のサイバーセキュリティー脅威の現状 IB ...続きを読む


【セミナー抄録】たくさんのスプレッドシートでメタボになった予算管理をダイエットしよう!

IBM Data and AI, IBM Watson Blog

2022年11月15日(火)13:00-14:00に開催されたセミナー「たくさんのスプレッドシートでメタボになった予算管理をダイエットしよう!〜あれだけ苦労してきたレポート作成と分析に必要なデータ準備・加工をスモールスタ ...続きを読む