Mengubah manajemen ketahanan dengan otomatisasi

Organisasi sre perangkat lunak global menjadi lebih tangguh dengan otomatisasi

Karyawan sedang berbincang di sekitar komputer laptop.
Bergelut dengan ketahanan multicloud

Tim rekayasa keandalan situs perangkat lunak IBM (SRE) memainkan peran penting dalam menjaga keandalan dan keamanan penawaran SaaS IBM dan infrastruktur layanan terkelola. Beroperasi di IBM Cloud®, AWS, Microsoft Azure dan Google Cloud Platform, tim SRE memberikan hampir 70 solusi SaaS secara global, mengumpulkan sejumlah besar data hingga tingkat layanan mikro.

Menciptakan evaluasi ketahanan yang komprehensif merupakan tantangan yang signifikan bagi tim ini. Kevin Yu, Principal Site Reliability Engineer, menjelaskan, “Metode kami sebelumnya melibatkan lokakarya dan penggunaan spreadsheet secara ekstensif untuk penilaian terhadap buku pedoman kami yang dapat memakan waktu berbulan-bulan untuk menyelesaikannya dan juga merupakan tantangan untuk diperbarui. Metode ini tidak memiliki kemampuan untuk memberikan pandangan holistik tentang postur ketahanan sistem kami.”

Tim SRE juga membutuhkan solusi untuk mengukur dan melacak metrik ketahanan utama secara akurat, seperti ketersediaan, pemulihan, dan pengamatan, dari waktu ke waktu untuk mengidentifikasi kerentanan dan menerapkan perbaikan secara efektif.

Meningkatkan ulasan operasional bulanan (MOR) adalah tantangan utama lainnya. Ketidakefisienan proses MOR tim SRE yang ada saat ini menghambat kemampuan mereka untuk mengidentifikasi dan menyelesaikan masalah dengan cepat. Silo-silo organisasi semakin memperumit prosesnya, sehingga sulit untuk menyelaraskan tim yang berbeda ke dalam strategi ketahanan yang sama.

62% evaluasi postur ketahanan di seluruh perusahaan yang lebih cepat per aplikasi 72% ulasan operasi bulanan yang lebih cepat
Concert membantu kami memecah silo dan menjadi lebih produktif. Kami sekarang memiliki kerangka kerja yang dapat diskalakan untuk mengukur, meningkatkan, dan mempertahankan ketahanan aplikasi di seluruh IBM.
Kevin Yu Insinyur Keandalan Situs Utama IBM
Merevolusi manajemen ketahanan

Tim SRE menerapkan platform IBM Concert untuk membantu mereka mengurangi silo, mendorong peningkatan berkelanjutan, dan membuka pendekatan berulang terhadap ketahanan.

Solusi ini menggabungkan otomatisasi dan insight yang didukung AI ke dalam kerangka kerja terstandardisasi dan dapat diskalakan untuk menilai, meningkatkan, dan mempertahankan ketahanan.

Sebelum menerapkan IBM Concert, evaluasi ketahanan merupakan tugas manual dan padat karya yang bisa memakan waktu berbulan-bulan untuk menyelesaikannya. Kerangka kerja ketahanan solusi telah mengotomatiskan proses ini, memberikan pandangan komprehensif tentang metrik ketahanan utama seperti ketersediaan, pemulihan, dan observabilitas. Otomatisasi telah secara signifikan mengurangi waktu dan upaya yang diperlukan, memungkinkan tim SRE untuk fokus pada peningkatan ketahanan dan keandalan aplikasi.

Proses MOR sebelumnya tidak efisien dan memakan waktu, sering kali membutuhkan ratusan jam untuk mengekstrak dan menyusun data. Dengan IBM Concert, tim SRE sekarang merangkum dan melaporkan data dengan lebih efisien, kemudian memberikan informasi yang paling akurat kepada pemangku kepentingan mereka untuk penilaian kepatuhan dan perencanaan strategis. Solusi ini juga mengkonsolidasikan data dari berbagai sumber untuk menciptakan pandangan terpadu yang meningkatkan kemampuan tim SRE dalam memecahkan masalah.

Seperti yang dijelaskan Yu, “Concert membantu kami memecah silo dan menjadi lebih produktif. Kami sekarang memiliki kerangka kerja yang dapat diskalakan untuk mengukur, meningkatkan, dan mempertahankan ketahanan aplikasi di seluruh IBM.”

Peningkatan efisiensi dan peningkatan ketahanan

Menerapkan kerangka kerja ketahanan di IBM Concert membuahkan hasil transformatif bagi tim SRE IBM.

“Solusi ini telah mengubah pendekatan kami terhadap ketahanan aplikasi,” kata Yu. “Dengan mengotomatiskan pengumpulan data ketahanan utama, kami mengatasi silo dan mengoperasionalkan ketahanan. Akibatnya, postur ketahanan IBM Concert mengurangi hari orang dalam evaluasi postur ketahanan perusahaan IBM secara keseluruhan per aplikasi sebesar 62%, dibandingkan dengan evaluasi manual.1

Tim SRE mengatakan transformasi tersebut juga telah meningkatkan produktivitas mereka dan mendorong kolaborasi yang lebih baik dengan tim lain. Dengan menggunakan kerangka kerja solusi yang terstandarisasi, tim SRE dapat menyelaraskan berbagai bagian organisasi ke dalam strategi ketahanan umum di mana mereka melihat peningkatan dalam koordinasi dan komunikasi secara keseluruhan. Selain itu, kemampuan pelaporan yang komprehensif dan konsisten telah meningkatkan transparansi dan akuntabilitas di IBM. Para pemangku kepentingan internal telah menyatakan bahwa mereka sekarang memiliki pemahaman yang lebih baik tentang metrik ketahanan dan manajemen masalah, yang mengarah pada pengambilan keputusan yang lebih tepat.

Dengan memanfaatkan postur ketahanan IBM Concert, tim sre telah mencapai pendekatan yang lebih efisien dan efektif untuk evaluasi ketahanan dan MOR, membantu memastikan infrastruktur SaaS dan layanan terkelola IBM tetap dapat diandalkan dan terjamin. “Postur ketahanan IBM Concert mengurangi jam kerja tim IBM SRE yang dihabiskan di MOR sebesar 72% dibandingkan dengan membuat laporan secara manual,” kata Yu.1

Tentang organisasi IBM Software SRE

Organisasi IBM Software SRE adalah tim global yang berfokus pada penyediaan SaaS produksi yang sangat tersedia dan dapat diskalakan untuk produk piranti lunak IBM. Tim Software SRE menyediakan, menerapkan, memantau, memelihara, dan mengelola insiden dengan menstandarkan alat, proses, otomatisasi, runbook, dan praktik. Tim mereka bekerja secara erat dengan tim pengembangan perangkat lunak IBM untuk merancang dan menerapkan perubahan, menyediakan layanan yang sangat tangguh di seluruh siklus hidup perangkat lunak.

Komponen solusi IBM Concert
Ketahanan ditata ulang

IBM Concert menggabungkan otomatisasi dan insight yang didukung AI ke dalam kerangka kerja yang terstandardisasi dan dapat diskalakan untuk menilai, meningkatkan, dan mempertahankan ketahanan.

Pelajari lebih lanjut Mulai uji coba gratis Anda
Catatan kaki

1: Berdasarkan hasil dari tes internal. Hasil individu dapat bervariasi.

Legal

© Hak Cipta IBM Corporation 2025. IBM, logo IBM, Concert, IBM Cloud, dan IBM Concert adalah merek dagang atau merek dagang terdaftar dari IBM Corp, di AS dan/atau negara-negara lain.

Microsoft adalah merek dagang Microsoft Corporation di Amerika Serikat, negara lain, atau keduanya.

Contoh disajikan hanya sebagai ilustrasi. Hasil aktual akan bervariasi berdasarkan konfigurasi dan kondisi klien dan, oleh karena itu, hasil yang diharapkan secara umum tidak dapat diberikan.