Ada sejumlah metrik yang dapat Anda pilih, tetapi kami sarankan untuk berfokus pada delapan metrik ini untuk menuai manfaat paling banyak dalam organisasi TI Anda.

1. Skor Apdex dan SLA

Mari kita mulai dengan indeks kinerja aplikasi (Apdex) dan skor perjanjian tingkat layanan (SLA), karena mereka adalah dasar dari pengalaman pelanggan yang unggul. Kecepatan dan umpan yang akan Anda ukur adalah aspek spesifik yang seharusnya menambah kinerja yang cepat. Namun, keduanya adalah sarana, bukan tujuan. Pelanggan yang bahagia adalah tujuan Anda—yang diharapkan dapat mengarah ke peningkatan penjualan.

Skor Apdex dan SLA adalah cara paling populer untuk melihat pemantauan pengalaman pengguna akhir. Skor Apdex melacak kinerja relatif aplikasi dengan menentukan tujuan untuk waktu yang biasanya dilakukan permintaan web atau transaksi. SLA adalah metrik dalam kontrak pelanggan Anda dan apa pun yang lebih rendah dari SLA yang ditentukan berisiko penurunan CX (dan kemungkinan penalti yang telah ditentukan sebelumnya).

2. Ketersediaan aplikasi (dikenal juga sebagai waktu aktif atau pemantauan kinerja)

Ini adalah metrik paling dasar: Apakah lampu menyala? Anda memantau dan mengukur apakah aplikasi Anda online dan tersedia. Sebagian besar perusahaan menggunakan ini untuk mengukur kepatuhan perjanjian tingkat layanan (SLA). Waktu aktif sering merupakan jalan singkat untuk menilai keandalan dan kesehatan sistem secara keseluruhan. Waktu henti yang berlebihan dapat berdampak negatif pada kepuasan pengguna untuk organisasi yang memberikan layanan online. Untuk aplikasi web, Anda dapat memverifikasi ketersediaan dengan pemeriksaan HTTP sederhana yang dijadwalkan secara teratur.

3. Penggunaan CPU (dikenal juga sebagai penggunaan sumber daya)

Persentase tinggi kapasitas CPU yang digunakan oleh aplikasi dapat menjadi tanda masalah kinerja. Lonjakan penggunaan CPU yang tiba-tiba dapat mengakibatkan waktu respons yang lebih lambat. Fluktuasi permintaan untuk aplikasi mungkin juga merupakan indikasi bahwa Anda perlu menambahkan lebih banyak instans aplikasi. Aturan umum adalah jika penggunaan CPU melebihi 70% lebih dari 30% waktu penggunaan, Anda mungkin kehabisan kapasitas CPU.

Penggunaan sumber daya juga dapat mencakup penggunaan memori dan disk. Pelacakan RAM membantu mengidentifikasi kebocoran memori yang dapat menyebabkan kegagalan atau kebutuhan memori yang lebih besar. Metrik penggunaan disk dapat membantu mencegah aplikasi kehabisan penyimpanan persisten yang dapat menyebabkannya gagal. Penggunaan disk yang tinggi juga bisa menjadi tanda penyimpanan data backend yang tidak efisien atau kebijakan retensi data yang salah.

4. Tingkat Kesalahan

Perangkat lunak metrik APM Anda harus memantau aplikasi untuk mencatat persentase permintaan yang mengakibatkan kegagalan. Ini membantu mengidentifikasi dan memprioritaskan penyelesaian masalah yang memengaruhi pengalaman pengguna. Kesalahan aplikasi dapat mencakup kesalahan server, respons 404 atau batas waktu dalam aplikasi web. Anda dapat mengonfigurasi solusi APM untuk mengirim notifikasi saat tingkat kesalahan melebihi parameter yang ditetapkan. Misalnya, kirim pemberitahuan ketika 2,5% dari 25 permintaan sebelumnya telah mengakibatkan kesalahan.

5. Pengumpulan sampah

Pengumpulan sampah (GC) dapat meningkatkan kinerja dengan mengidentifikasi dan menghilangkan penggunaan memori yang berat dari Java atau bahasa lainnya. Kabar baiknya adalah bahwa otomatisasi GC mengklaim kembali memori yang ditujukan untuk objek atau data yang tidak digunakan atau berlebihan yang tidak lagi digunakan oleh aplikasi. Objek atau data yang tidak digunakan dihapus dan objek yang digunakan disalin ke kumpulan memori generasi selanjutnya. Ini adalah metrik yang harus Anda pertahankan agar seimbang. Jika GC terlalu sering dijalankan, mungkin akan membutuhkan terlalu banyak overhead; tetapi jika GC tidak terlalu sering dijalankan, sistem Anda mungkin akan kekurangan memori.

6. Jumlah instans

Pelacakan instans memungkinkan Anda menskalakan aplikasi untuk memenuhi permintaan pengguna aktual, berdasarkan berapa banyak instans aplikasi atau server yang berjalan setiap saat. Ini bisa sangat penting untuk aplikasi cloud. Auto-scaling dapat membantu Anda memastikan aplikasi modern berskala untuk memenuhi permintaan dan menghemat anggaran selama jam di luar jam sibuk. Hal ini juga dapat menciptakan tantangan pada pemantauan infrastruktur. Sebagai contoh, jika aplikasi Anda secara otomatis meningkatkan penggunaan CPU, Anda mungkin tidak akan pernah melihat penggunaan CPU Anda meningkat—sebaliknya, Anda mungkin melihat jumlah instans server meningkat terlalu jauh, berikut tagihan hosting Anda.

7. Kecepatan permintaan

Anda dapat mengukur lalu lintas yang diterima oleh aplikasi untuk mengidentifikasi penurunan, peningkatan, atau pengguna yang berbarengan. Menghubungkan kecepatan permintaan dengan metrik kinerja aplikasi lainnya akan membantu Anda memahami skalabilitas aplikasi perangkat lunak Anda. Perangkat lunak APM juga dapat memantau lalu lintas untuk mengidentifikasi anomali. Pemantauan pengguna yang menunjukkan peningkatan permintaan yang tidak terduga bisa menjadi serangan denial-of-service (DoS). Sejumlah besar permintaan dari pengguna yang sama bisa menjadi indikasi akun yang diretas. Bahkan permintaan yang luar biasa rendah pun bisa jadi merupakan hal yang buruk—inaktivitas atau tidak ada lalu lintas sama sekali bisa berarti kegagalan di hampir semua bagian sistem Anda.

8. Waktu respons (dikenal juga sebagai durasi)

Dengan melacak waktu respons rata-rata terhadap permintaan—yaitu, berapa lama waktu yang dibutuhkan aplikasi untuk menampilkan permintaan sumber daya—Anda dapat menilai kinerja aplikasi. Permintaan ini dapat mencakup transaksi yang diprakarsai oleh pengguna akhir, seperti permintaan untuk memuat halaman web, atau dapat mencakup permintaan internal dari satu bagian aplikasi ke bagian lain, seperti proses atau layanan mikro yang meminta data dari disk atau memori. Total waktu respons mencakup waktu respons server (waktu yang dibutuhkan server Anda untuk memproses permintaan) ditambah latensi jaringan (total waktu yang dibutuhkan permintaan untuk bergerak melintasi jaringan).

Metrik terkait adalah waktu muat halaman yang mengukur waktu yang dibutuhkan halaman web untuk dimuat ke browser. Melacak waktu muat halaman memungkinkan alat pemantauan kinerja aplikasi Anda mengidentifikasi masalah yang menyebabkan halaman memuat dengan lambat dan kemudian meningkatkan pengalaman digital. Pemuatan halaman yang lambat dapat berarti pengabaian halaman dan kehilangan bisnis. Solusi APM dapat ditetapkan sebagai dasar kinerja untuk metrik ini dan kemudian memperingatkan Anda ketika tolok ukur tersebut tidak terpenuhi.