Mengubah manajemen ketahanan dengan otomatisasi

Organisasi sre perangkat lunak global menjadi lebih tangguh dengan otomatisasi

Karyawan sedang berbincang di sekitar komputer laptop.
Bergelut dengan ketahanan multicloud

Tim rekayasa keandalan situs perangkat lunak IBM (SRE) memainkan peran penting dalam menjaga keandalan dan keamanan penawaran SaaS IBM dan infrastruktur layanan terkelola. Beroperasi di IBM Cloud®, AWS, Microsoft Azure dan Google Cloud Platform, tim SRE memberikan hampir 70 solusi SaaS secara global, mengumpulkan sejumlah besar data hingga tingkat layanan mikro.

Menciptakan evaluasi ketahanan yang komprehensif merupakan tantangan yang signifikan bagi tim ini. Kevin Yu, Principal Site Reliability Engineer, menjelaskan, “Metode kami sebelumnya melibatkan lokakarya dan penggunaan spreadsheet secara ekstensif untuk penilaian terhadap buku pedoman kami yang dapat memakan waktu berbulan-bulan untuk menyelesaikannya dan juga merupakan tantangan untuk diperbarui. Metode ini tidak memiliki kemampuan untuk memberikan pandangan holistik tentang postur ketahanan sistem kami.”

Tim SRE juga membutuhkan solusi untuk mengukur dan melacak metrik ketahanan utama secara akurat, seperti ketersediaan, pemulihan, dan pengamatan, dari waktu ke waktu untuk mengidentifikasi kerentanan dan menerapkan perbaikan secara efektif.

Meningkatkan ulasan operasional bulanan (MOR) adalah tantangan utama lainnya. Ketidakefisienan proses MOR tim SRE yang ada saat ini menghambat kemampuan mereka untuk mengidentifikasi dan menyelesaikan masalah dengan cepat. Silo-silo organisasi semakin memperumit prosesnya, sehingga sulit untuk menyelaraskan tim yang berbeda ke dalam strategi ketahanan yang sama.

62% evaluasi postur ketahanan di seluruh perusahaan yang lebih cepat per aplikasi 72% ulasan operasi bulanan yang lebih cepat
Concert membantu kami memecah silo dan menjadi lebih produktif. Kami sekarang memiliki kerangka kerja yang dapat diskalakan untuk mengukur, meningkatkan, dan mempertahankan ketahanan aplikasi di seluruh IBM.
Kevin Yu Insinyur Keandalan Situs Utama IBM
Merevolusi manajemen ketahanan

Tim SRE menerapkan IBM® Concert Resilience untuk membantu mereka mengurangi silo, mendorong peningkatan berkelanjutan, dan membuka pendekatan ketahanan yang dapat diulang.

Solusi ini menggabungkan otomatisasi dan insight yang didukung AI ke dalam kerangka kerja terstandardisasi dan dapat diskalakan untuk menilai, meningkatkan, dan mempertahankan ketahanan.

Sebelum menerapkan IBM®Concert Resilience, evaluasi ketahanan merupakan tugas manual dan padat kerja yang bisa memakan waktu berbulan-bulan untuk menyelesaikannya. Kerangka kerja ketahanan solusi telah mengotomatiskan proses ini, memberikan pandangan komprehensif tentang metrik ketahanan utama seperti ketersediaan, pemulihan, dan observabilitas. Otomatisasi telah secara signifikan mengurangi waktu dan upaya yang diperlukan, memungkinkan tim SRE untuk fokus pada peningkatan ketahanan dan keandalan aplikasi.

Proses MOR sebelumnya tidak efisien dan memakan waktu, sering kali membutuhkan ratusan jam untuk mengekstrak dan menyusun data. Dengan IBM® Concert Resilience, tim SRE sekarang merangkum dan melaporkan data dengan lebih efisien, kemudian memberikan informasi yang paling akurat kepada pemangku kepentingan mereka untuk penilaian kepatuhan dan perencanaan strategis. Solusi ini juga mengonsolidasikan data dari berbagai sumber untuk menciptakan pandangan terpadu yang meningkatkan kemampuan tim SRE dalam memecahkan masalah.

Seperti yang dijelaskan Yu, “Concert membantu kami memecah silo dan menjadi lebih produktif. Kami sekarang memiliki kerangka kerja yang dapat diskalakan untuk mengukur, meningkatkan, dan mempertahankan ketahanan aplikasi di seluruh IBM.”

Peningkatan efisiensi dan peningkatan ketahanan

Menerapkan kerangka kerja ketahanan di IBM® Concert Resilience membawa hasil transformatif bagi tim SRE IBM®.

“Solusi ini telah mengubah pendekatan kami terhadap ketahanan aplikasi,” kata Yu. “Dengan mengotomatiskan pengumpulan data ketahanan utama, kami mengatasi silo dan mengoperasionalkan ketahanan. Akibatnya, IIBM® Concert Resilience mengurangi hari orang dalam evaluasi postur ketahanan perusahaan IBM® secara keseluruhan per aplikasi sebesar 62%, dibandingkan dengan evaluasi manual.1

Tim SRE mengatakan transformasi tersebut juga telah meningkatkan produktivitas mereka dan mendorong kolaborasi yang lebih baik dengan tim lain. Dengan menggunakan kerangka kerja solusi yang terstandarisasi, tim SRE dapat menyelaraskan berbagai bagian organisasi ke dalam strategi ketahanan umum di mana mereka melihat peningkatan dalam koordinasi dan komunikasi secara keseluruhan. Selain itu, kemampuan pelaporan yang komprehensif dan konsisten telah meningkatkan transparansi dan akuntabilitas di IBM. Para pemangku kepentingan internal telah menyatakan bahwa mereka sekarang memiliki pemahaman yang lebih baik tentang metrik ketahanan dan manajemen masalah, yang mengarah pada pengambilan keputusan yang lebih tepat.

Dengan memanfaatkan postur ketahanan IBM® Concert Resilience, tim SRE telah mencapai pendekatan yang lebih terstruktur dan efektif untuk evaluasi ketahanan dan MOR, membantu memastikan infrastruktur SaaS dan layanan terkelola IBM® tetap dapat diandalkan dan terjamin. “IBM® Concert Resilience mengurangi jam kerja tim SRE IBM® yang dihabiskan di MOR sebesar 72% dibandingkan dengan membuat laporan secara manual,” kata Yu.1

Tentang organisasi IBM Software SRE

Organisasi IBM Software SRE adalah tim global yang berfokus pada penyediaan SaaS produksi yang sangat tersedia dan dapat diskalakan untuk produk piranti lunak IBM. Tim Software SRE menyediakan, menerapkan, memantau, memelihara, dan mengelola insiden dengan menstandarkan alat, proses, otomatisasi, runbook, dan praktik. Tim mereka bekerja secara erat dengan tim pengembangan perangkat lunak IBM untuk merancang dan menerapkan perubahan, menyediakan layanan yang sangat tangguh di seluruh siklus hidup perangkat lunak.

Komponen solusi IBM® Concert Resilience
Ketahanan ditata ulang

IBM® Concert Resilience menggabungkan otomatisasi dan wawasan yang didukung AI ke dalam kerangka kerja standar yang dapat diskalakan untuk menilai, meningkatkan, dan mempertahankan ketahanan.

  1. Pelajari lebih lanjut tentang Concert Resilience
Catatan kaki

1: Berdasarkan hasil dari tes internal. Hasil individu dapat bervariasi.

Legal

© Hak Cipta IBM® Corporation 2025. IBM®, logo IBM®, Concert, IBM® Cloud, dan IBM® Concert Resilience adalah merek dagang atau merek dagang terdaftar dari IBM® Corp., di AS dan/atau negara lain.

Microsoft adalah merek dagang Microsoft Corporation di Amerika Serikat, negara lain, atau keduanya.

Contoh disajikan hanya sebagai ilustrasi. Hasil aktual akan bervariasi berdasarkan konfigurasi dan kondisi klien dan, oleh karena itu, hasil yang diharapkan secara umum tidak dapat diberikan.