AIOps

menu icon

AIOps

AIOps 運用人工智慧來簡化 IT 作業管理,並在複雜的現代化 IT 環境中加速與自動化執行問題解決方案。

何謂 AIOps?

AIOps(代表 Artificial Intelligence for IT Operations,智慧維運)是用以加強 IT 維運的人工智慧 (AI) 應用程式。 具體而言,AIOps 可使用大數據、分析及機器學習功能來執行下列作業:

  • 收集並彙總由多個 IT 基礎架構元件、應用程式及效能監視工具所產生之大量且不斷增加的作業資料
  • 智慧地從「雜訊」中過濾出「信號」,以識別與系統效能及可用性問題相關的重要事件及型樣。
  • 診斷主要原因並將其回報給 IT 以進行快速回應及補救,或在某些情況下,自動解決這些問題而無需人為介入。

AIOps 以單一智慧型自動化 IT 作業平台來取代多個獨立的手動 IT 作業工具, 藉此讓 IT 作業團隊能夠更快速、甚至是更主動地回應減速和服務中斷情況,而且還能大幅減少工作。

它能彌補下列兩者之間的差距:一方面日益多樣化、動態且難以監視的 IT 環境,另一方面使用者希望應用程式效能和可用性鮮少甚或沒有中斷。 多數專家認為 AIOps 是 IT 作業管理的未來。

進一步瞭解 AIOps

為什麼我們需要 AIOps?

如今,大部分的組織正在從包含獨立靜態實體系統的傳統基礎架構轉移至包括內部部署、受管理雲端、私有雲及公有雲環境在內的動態混合架構(在可不斷調整及重新配置的虛擬化或軟體定義資源上執行)。

在這些環境中的應用程式和系統會產生持續增長的海量資料。 事實上,Gartner 預估,企業 IT 基礎架構平均每年產生的 IT 作業資料會多出二至三倍。

傳統的網域型 IT 管理解決方案無法跟上數量的增長速度。 它們無法聰明地從如此巨量的資料中整理出重大事件。 它們無法在彼此不同但相互依存的環境之間建立資料關聯。 同時,它們也無法提供 IT 作業團隊所需的即時洞察及預測分析,以足夠快的速度來回應問題,進而符合使用者與客戶服務水準的期望。

進入 AIOps,其可以顯示所有環境的效能資料及相依關係,分析資料以擷取與減速或運作中斷相關的重要事件,並自動向 IT 人員發出相關問題、其主要原因及建議解決方案的警示。

AIOps 如何運作?

瞭解 AIOps 如何運作的最簡單方法,就是瞭解每個 AIOps 元件技術(大數據、機器學習與自動化)在處理程序中扮演的角色。

AIOps 會使用大數據平台,將孤立的 IT 作業資料聚集到一處。 此資料可包括下列項目:

  • 歷程效能和事件資料
  • 串流即時作業事件
  • 系統日誌及度量值
  • 網路資料,包括封包資料
  • 事件相關資料及問題單
  • 相關的文件型資料

然後,AIOps 會應用聚焦分析和機器學習功能:

  • 將重要事件警示與「雜訊」分開:AIOps 使用分析(如規則應用程式及型樣比對)梳理出 IT 作業資料,並將信號(重大異常事件警示)與雜訊(其他所有項目)分開。
  • 找出主要原因並提出解決方案:AIOps 利用產業特定或環境特定的演算法,在異常事件與環境當中的其他事件資料之間產生關聯,以專注尋找運作中斷或效能問題的原因並建議補救措施。
  • 自動化回應,包括即時主動解決方案:AIOps 至少可以自動將警示及建議的解決方案遞送至合適的 IT 團隊,或甚至根據問題和解決方案的本質來建立回應團隊。 在許多情況下,它甚至可以在使用者意識到發生問題之前,處理機器學習的結果,以觸發自動系統回應來即時處理問題。
  • 不斷學習,以提高處理未來問題的能力:根據分析的結果,機器學習功能可以改變演算法,或建立新的演算法,以便更早地識別問題,並建議更有效的解決方案。 AI 模型也可協助系統瞭解及適應環境中的變化,例如由 DevOps 團隊佈建或重新配置的新基礎架構。

AIOps 優勢

AIOps 的總體優勢在於,它可讓 IT 作業從多個 IT 作業工具的警示中自動篩選以識別、處理並解決減速及運作中斷情況,其速度比手動篩選更快。 這會帶來幾項特定的好處:

  • 實現更快的平均解決時間 (MTTR):透過摒除 IT 作業的雜訊,並關聯多個 IT 環境的作業資料,AIOps 能夠比人力更快且更精準地識別主要原因,並提出解決方案。 這可讓組織設定並達成先前無法想像的 MTTR 目標。 例如,電信供應商 Nextel Brazil 能夠使用 AIOps 將突發事件回應時間從 30 分鐘縮短到 5 分鐘以下。
  • 從被動到主動再到預測管理:因為 AIOps 永遠不會停止學習,所以它會不斷改進以更好地識別與較緊急狀況產生關聯的不太緊急警示或信號。 這表示它可以提供預測警示,讓 IT 團隊在潛在問題導致減速或運作中斷之前將其解決。
  • 將 IT 作業和 IT 作業團隊現代化:有別於被每個環境中的每項警示不斷轟炸,AIOps 作業團隊只會收到符合特定服務水準臨界值或參數的警示,同時一併獲得做出最佳診斷所需的一切必要環境定義,並採取最佳且最快速的更正動作。 AIOps 學習得越多、自動化程度越高,就越能在只需少量人力的情況下「保持運作」,讓您的 IT 作業團隊能夠更專注對企業更具高策略價值的工作。

AIOps 使用案例

除了將 IT 作業最佳化之外,AIOps 可見性與自動化還能支援並協助推動其他重要的商業和 IT 提案:

  • 數位轉型:數位轉型會產生 IT 複雜性(例如,多個環境、虛擬化資源、動態基礎架構),而 AIOps 正是為了解決這些問題而設計。 正確的 AIOps 解決方案賦予組織更多的自由和彈性,以利根據策略性商業目標進行轉型,而不必擔心 IT 作業負載。
  • 雲端採用/移轉:對於大部分組織而言,雲端採用是漸進過程而非一夕完成,而這會產生混合多雲環境(私有雲、公有雲、多個供應商),其中可能會因為多重交互相依關係變更太快太頻繁而來不及記錄。 透過清楚顯示這些交互相依關係,AIOps 可以大幅降低雲端移轉混合雲方法的作業風險。
  • DevOps 採用:DevOps 透過提高開發團隊佈建及重新配置基礎架構的能力來加速開發,但 IT 仍必須管理該基礎架構。 AIOps 提供 IT 需要的可見性和自動化以支援 DevOps,完全不需要增加額外的管理人力。

AIOps 與 IBM Cloud

IBM Cloud  可讓您跨多雲端架構和現有 IT 進行建置及部署。透過在所有環境中提供集中可見性,讓您的作業團隊能夠更快地診斷問題並解決突發事件,IBM 的 AIOps  解決方案可讓新的 IT 作業效率更上一層樓。

IBM Cloud Pak for Watson AIOps  使用機器學習和自然語言理解,來即時關聯作業工具鏈中的結構化和非結構化資料,以發現隱藏的洞察,並協助更快識別出主要原因。 Watson AIOps 消除了多儀表板需求,將洞察與建議直接提供給您的團隊工作流程,以加速解決事件。

若要開始使用,請註冊 IBMid 並建立您的 IBM Cloud 帳戶