グローバルなソフトウェアSRE組織のレジリエンスをオートメーションにより強化
IBMのソフトウェア・サイト信頼性エンジニアリング(SRE)チームは、IBMのSaaS製品とマネージド・サービス・インフラストラクチャーの信頼性とセキュリティーを維持する上で重要な役割を果たします。IBM® Cloud、AWS、Microsoft Azure、Googleクラウド・プラットフォームにまたがり運用するサイト信頼性エンジニアリング・チームは、約70種類のSaaSソリューションを世界中のお客様に提供し、マイクロサービス・レベルまで膨大な量のデータを収集しています。
包括的なレジリエンス評価を作成することは、このチームにとって大きな課題でした。主席サイト信頼性エンジニアのKevin Yuは、次のように説明しています。「以前の方法では、ワークショップや、プレイブックに照らした評価のためのスプレッドシートの多用が必要で、完了するまでに文字どおり数カ月かかり、更新も困難でした。これらの方法では、システムのレジリエンス・ポスチャーを総合的に把握することは不可能でした」。
脆弱性を特定し、効果的に改善を実施するため、可用性、回復性、オブザーバビリティーなどの主要なレジリエンス・メトリクスを長期にわたって正確に測定および追跡するソリューションも必要でした。
月次業務レビュー(MOR)の強化も大きな課題でした。SREチームの既存のMORプロセスの非効率性が、問題を迅速に特定して解決するのを妨げていました。組織のサイロ化はプロセスをさらに複雑にし、複数のチームが共通のレジリエンス戦略で歩調を合わせることを困難にしました。
SREチームは、サイロを削減し、継続的な改善を推進し、復元力に対する繰り返し可能なアプローチを実現するために、IBM® Concertプラットフォームを導入しました。
このソリューションは、オートメーションとAIを活用した洞察を標準化されたスケーラブルなフレームワークに統合し、レジリエンスを評価、強化、維持します。
IBM Concertを導入する前は、レジリエンス評価は手動で行う労働集約的なタスクで、完了するまでに数カ月かかることもありました。このソリューションのレジリエンス・フレームワークは、このプロセスを自動化し、可用性、回復性、観測可能性などの主要なレジリエンス・メトリクスを包括的に表示します。オートメーションにより必要な時間と労力が大幅に削減され、SREチームはアプリケーションの堅牢性と信頼性の向上に集中できるようになりました。
以前のMORプロセスは非効率的で時間がかかり、データの抽出と照合に何百時間もかかることがよくありました。IBM Concertを使用することで、SREチームはデータをより効率的に要約してレポートし、コンプライアンス評価と戦略計画のために最も正確な情報を関係者に提供できるようになりました。このソリューションは、さまざまなソースからのデータを統合して統一されたビューを作成し、SREチームの問題解決能力を強化します。
Yuは次のように説明しています。「Concertはサイロを解体し、生産性を向上させるのに役立ちました。IBM全体でアプリケーションのレジリエンスを測定、改善、維持するためのスケーラブルなフレームワークができました」。
IBM Concertにレジリエンス・フレームワークを導入することで、IBM SREチームに革新的な成果がもたらされました。
「このソリューションは、アプリケーションのレジリエンスに対する私たちのアプローチを根本から変えました」とYuは述べています。「主要なレジリエンス・データの収集を自動化することで、サイロ化に対処し、レジリエンスを強化しました。その結果、IBM Concertのレジリエンス・ポスチャー分析により、手動による評価と比較して、アプリケーションごとのIBM企業全体のレジリエンス・ポスチャー分析にかかる工数が62%削減されました」。1
SREチームは、この変革により生産性が向上し、他のチームとの連携も強化されたと語ります。ソリューションの標準化されたフレームワークを使用することで、SREチームは複数の部署が共通のレジリエンス戦略で歩調を合わせることができ、全体的な調整とコミュニケーションの改善が見られます。さらに、包括的かつ一貫性のあるレポート機能により、IBM内の透明性と説明責任が強化されました。社内の関係者は、レジリエンス・メトリクスと問題管理についての理解が深まり、より情報に基づいた意思決定ができるようになったと述べています。
SREチームは、IBM Concertのレジリエンス・ポスチャー分析により、レジリエンス評価とMORに対するより合理的かつ効果的なアプローチを実現し、IBMのSaaSおよびマネージド・サービス・インフラストラクチャーの信頼性とセキュリティーの維持に貢献しています。「IBM Concertのレジリエンス・ポスチャー分析により、IBM SREチームがMORに費やす工数は、手動でレポートを作成する場合と比較して72%削減されました」とYuは述べています。1
IBMソフトウェアSREチームは、IBMソフトウェア製品向けに可用性と拡張性の高い実稼働SaaSを提供することに重点を置いたグローバル・チームです。ツール、プロセス、オートメーション、ランブック、プラクティスを標準化することで、インシデントのプロビジョニング、展開、監視、保守、および管理を行っています。IBMソフトウェア開発チームと密接に連携して変更を設計・実装し、ソフトウェア・ライフサイクル全体を通じてレジリエントなサービスを提供しています。
1:社内テスト結果に基づくデータです。個々の成果は異なる場合があります。
© Copyright IBM Corporation 2025.IBM、IBMのロゴ、Concert、IBM Cloud、およびIBM Concertは、米国およびその他の国または地域におけるIBM社の商標または登録商標です。
Microsoftは、米国およびその他の国々におけるMicrosoft社の商標です。
示されている例は、説明のみを目的として提供されています。実際の結果はお客様の設定や条件により異なるため、一般的に期待される結果を提供するものではありません。