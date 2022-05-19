Kapan 10 detik menjadi masalah besar? Dalam hal kinerja aplikasi.
Untuk aplikasi layanan mikro cloud native, 10 detik adalah waktu yang sangat lama.
Hal-hal yang dapat terjadi pada aplikasi Anda dalam 10 detik tidak ada habisnya dan sebagian besar tidak baik.
Tapi, sebelum kita menyelami detail tentang apa yang bisa terjadi pada aplikasi Anda, mari kita lihat beberapa peristiwa dunia nyata yang menunjukkan apa yang bisa terjadi dalam 10 detik:
Kami terutama menyukai contoh Usain Bolt karena jumlah jarak itu adalah jalan yang panjang untuk berlari dalam waktu kurang dari 10 detik.
Untuk kinerja dan ketersediaan aplikasi cloud-native, 10 detik adalah keabadian. Transaksi berputar di internet, menjaga roda perdagangan terlumasi dengan baik.
Apa yang bisa terjadi dalam 10 detik jika terjadi kesalahan? Nah, ribuan transaksi bisa mengalami penundaan atau crash dan tidak selesai sama sekali.
Dengan jenis masalah ini, pendapatan dapat turun karena hilangnya penjualan. Pelanggan akan meninggalkan keranjang belanja dan situs Anda dan menemukan tempat lain untuk membeli apa yang mereka inginkan. Dan citra merek Anda bisa menderita.
Lalu, mengapa alat observabilitas yang menangkap metrik secara perlahan atau lebih buruk sampel dan agregat metrik dan jejak? Bagaimana platform seperti itu dapat dilihat setara dengan platform observabilitas, seperti platform IBM® Instana yang mengumpulkan dan mengontekstualisasikan informasi dengan kecepatan layanan mikro modern. Mereka memungkinkan masalah yang dijelaskan di atas bertahan untuk jangka waktu yang lama sampai informasi yang Anda butuhkan untuk memperbaiki masalah tersedia.
Bagi PRISA Tecnologia, kinerja adalah kunci. Ketika mereka menghadapi masalah kinerja, itu memiliki dampak langsung dan merugikan pada kinerja bisnis dan persepsi konsumen tentang merek mereka.
“Perbedaan waktu satu detik dalam menampilkan konten membuat perbedaan besar bagi pengalaman audiens kami.” – Jorge Tomé Hernando, Director of IT Architecture, Operations, Security and Workplace, PRISA Tecnologia
Pesaing pengam atan utama platform Instana baik mengambil sampel metrik pada interval 10 detik atau metrik agregat dalam interval satu menit atau lebih, dibandingkan dengan interval metrik satu detik platform Instana yang sangat tepat. Platform Instana juga memberikan pemberitahuan masalah dalam waktu tiga detik. Respons ini diilustrasikan dalam diagram celah deteksi pengamatan yang ditunjukkan di sini.
Bisakah Anda benar-benar menunggu 10 detik atau hingga satu menit agar platform pengamatan Anda memberi tahu Anda ada masalah? Dengan penanganan manual, mungkin. Tetapi dengan remediasi otomatis atau bahkan semi-otomatis Anda tidak bisa.
Untuk semua aplikasi, kecepatan dan keandalan adalah tujuannya. Untuk mencapai kinerja dan keandalan aplikasi yang lebih baik, strategi go-to bahwa “manusia selalu perlu memperbaiki masalah (MTTR),” harus diubah. Intervensi manusia untuk memperbaiki perbaikan akan membebani sumber daya manusia dan membatasi laju perubahan. Ini juga akan mengurangi indikator tingkat layanan (SLI).
“Dengan Instana, tujuan kami sehari-hari adalah untuk dapat menjamin harapan latensi. Tujuan kami untuk panggilan layanan adalah menyelesaikan dalam waktu kurang dari 250 milidetik. Jadi, ini bukan hanya untuk latihan kebakaran. Dalam kehidupan sehari-hari, kami dapat meningkatkan kinerja, dan itu mendorong kami menuju tujuan 250 ms itu. Instana memungkinkan hal ini.” – Bryce Hendrix, Lead Platform Architect, Dealerware
Untuk peningkatan kinerja dengan ketersediaan yang lebih tinggi, AIOps otomatis adalah jalan ke depan. AIOps Otomatis menyediakan otomatisasi tambahan yang dikombinasikan dengan AIOps, yang merupakan jalan ke depan untuk mencapai tingkat kinerja plus ketersediaan yang lebih tinggi. Bagaimana caranya? Dengan membiarkan AIOP otomatis menyelesaikan masalah yang dapat diperbaiki mesin dengan sempurna jauh lebih cepat daripada manusia. Ada banyak masalah mengenai alokasi sumber daya infrastruktur dan lainnya yang dapat diperbaiki dan dicegah oleh mesin sebelum manusia bahkan dapat melakukan intervensi.
Apakah manfaat ini berarti bahwa semua masalah aplikasi dapat diselesaikan dengan AIOps otomatis? Tentu saja tidak.
Ada banyak masalah logika kompleks yang hanya dapat diselesaikan oleh triase manusia, seperti masalah kode dan sejenisnya. Tetapi ada juga banyak masalah di mana AIOps otomatis lebih cepat, lebih efisien dan harus lebih disukai untuk remediasi masalah.
Pertimbangkan rata-rata waktu pencegahan (MTTP), yang diklasifikasikan sebagai jumlah waktu yang dibutuhkan pengamatan ditambah AIOps untuk mencegah masalah berdampak negatif pada aplikasi dan infrastruktur cloud hybrid.
AIOps Otomatis menambahkan opsi baru ke kontinum remediasi masalah aplikasi. Diagram sebelumnya menggambarkan bahwa kontinum dimulai dengan remediasi masalah yang sepenuhnya otomatis hingga ke stapel MTTR manusia.
Dalam kontinum, observabilitas adalah titik awal untuk setiap jenis remediasi. Semakin lama waktu yang dibutuhkan suatu masalah untuk dideteksi oleh platform observabilitas, semakin lama waktu yang dibutuhkan untuk memulai proses remediasi. Selang waktu ini berarti ketika AIOps otomatis ditambahkan, perbedaan antara deteksi satu detik dan deteksi 10 detik atau lebih menjadi besar. Jika aplikasi Anda mampu menunggu lebih dari 10 detik agar masalah terdeteksi, mengapa menggunakan AIOps otomatis sama sekali?
Remediasi AIOps otomatis adalah gelombang masa depan. Ini adalah langkah logis berikutnya bagaimana meningkatkan kinerja dan ketahanan aplikasi. Masalah kinerja infrastruktur sering kali lebih besar daripada masalah kode layanan mikro dan akan terus melakukannya di masa depan.
Standar emas baru untuk deteksi dan remediasi masalah aplikasi akan menjadi pengamatan otomatis ditambah AIOP. Mereka akan digunakan bersama-sama untuk membantu memastikan bahwa masalah tidak berubah menjadi masalah besar.
Jika Anda ingin mencapai manfaat penuh dari remediasi AIOps otomatis, Anda memerlukan metrik dan jejak frekuensi tinggi dan sangat tepat untuk memberi makan mesin AIOps. Dan Anda bisa mendapatkannya dengan sebagian kecil dari biaya teknologi pengamatan yang lebih lambat.
Memang, banyak yang bisa terjadi dalam 10 detik. Dengan metrik real-time dan AIOps otomatis, Anda dapat memastikan bahwa masalah buruk tidak terjadi pada aplikasi Anda.
