Pemantauan AWS adalah proses pelacakan, pengumpulan, dan analisis data dari platform komputasi cloud Amazon Web Services (AWS). Proses ini membantu mengoptimalkan sumber daya AWS, mengidentifikasi masalah kinerja, mengelola biaya, dan memelihara infrastruktur cloud yang aman.
Dengan pangsa lebih dari 30% di pasar cloud, AWS menjalankan lebih banyak infrastruktur daripada penyedia infrastruktur cloud lainnya.1 Perusahaan menggunakan AWS untuk hosting web, penyimpanan, analitik big data, pengembangan aplikasi mobile, dan layanan TI perusahaan.
Untuk organisasi ini, pemantauan beban kerja mereka di AWS sangat penting. Hal ini memungkinkan mereka untuk melacak metrik kinerja, log sistem, dan peristiwa untuk membantu memastikan bahwa lingkungan AWS berkinerja seperti yang diharapkan.
Tanpa pemantauan AWS, masalah kinerja dapat berlipat ganda tanpa terdeteksi, biaya dapat melesat dengan cepat dari sumber daya yang disediakan berlebihan, dan kerentanan keamanan dapat tetap terpapar. Misalnya, lalu lintas jaringan yang berlebihan dapat membebani unit pemrosesan pusat (CPU) dan menyebabkan kemacetan. Atau kontainer penyimpanan cloud yang salah konfigurasi dapat mengekspos data sensitif melalui akses publik.
Alat pemantauan AWS dapat mengidentifikasi masalah ini dan memicu respons otomatis—seperti memanggil fungsi AWS Lambda untuk remediasi—atau memperingatkan tim untuk pemecahan masalah manual. Ini membantu organisasi mempertahankan kinerja optimal, mengurangi biaya, memperkuat postur keamanan mereka, dan membuat keputusan berbasis data tentang infrastruktur mereka.
Pemantauan AWS membantu memastikan keandalan, ketersediaan, dan kinerja sumber daya cloud AWS. Ini memberikan visibilitas tentang infrastruktur AWS sehingga organisasi dapat secara proaktif mendeteksi dan menyelesaikan masalah, mengurangi gangguan, dan meminimalkan waktu henti.
Pemantauan membantu mengungkapkan kesehatan operasional sumber daya berbasis cloud AWS, termasuk kapasitas komputasi, sistem penyimpanan, dan infrastruktur jaringan.
Misalnya, jika server mengalami beban berat dari lalu lintas pelanggan, pemantauan memicu penskalaan otomatis untuk menambahkan lebih banyak server. Hal ini membantu mencegah aplikasi macet dan memastikan waktu respons yang konsisten bahkan saat terjadi lonjakan lalu lintas, sehingga aplikasi tetap dapat diakses oleh pengguna akhir.
Dengan mengumpulkan metrik pada sumber daya cloud AWS, pemantauan dapat membantu mengoptimalkan konfigurasi untuk meningkatkan kecepatan dan efisiensi.
Sebagai contoh, jika pengguna di Asia mengalami pemuatan halaman yang lambat, alat pemantauan dapat menyimpan konten di Singapura, yang lebih dekat dengan lokasi mereka. Hal ini membantu mengurangi latensi dan memungkinkan pemuatan halaman yang lebih cepat, memastikan streaming yang lebih lancar, dan meningkatkan pengalaman pengguna.
Biaya cloud sering menjadi salah satu item lini terbesar pada anggaran TI organisasi.
Pemantauan dapat mengidentifikasi sumber daya AWS yang kurang dimanfaatkan atau tidak perlu untuk membantu mengoptimalkan biaya cloud. Misalnya, virtual servers yang hanya menggunakan 10% dari memori yang dialokasikan untuk beban kerjanya dapat berisiko membuang-buang 90% biaya memori. Pemantauan AWS dapat membantu mengukur instans dengan tepat secara otomatis dan mematikan sumber daya yang menganggur selama jam sibuk.
Pemantauan deteksi aktivitas mencurigakan atau perubahan tidak biasa pada infrastruktur AWS yang mungkin mengindikasikan ancaman keamanan, seperti panggilan API yang tidak sah, transfer data yang tidak biasa, dan perubahan konfigurasi.
Misalnya, ketika alat pemantauan mendeteksi upaya login yang berulang kali gagal, alat tersebut dapat memblokir alamat IP sumber dan memicu pemberitahuan keamanan.
Pemantauan dapat mengidentifikasi potensi masalah sebelum terjadi dan berdampak pada pengguna akhir. Ini dapat mencakup batas kapasitas yang hampir habis, tren kinerja menurun, dan sertifikat SSL yang kedaluwarsa.
Misalnya, pemantauan basis data yang mendekati kapasitas penyimpanan lebih dari 90% memicu peringatan kepada pengembang untuk menambahkan lebih banyak ruang sebelum kegagalan basis data.
Pemantauan AWS terus mengumpulkan dan menganalisis data dari infrastruktur AWS.
Data pemantauan biasanya mencakup metrik kinerja, pemanfaatan sumber daya dan tingkat kesalahan dari server, basis data, dan aplikasi, serta log sistem seperti panggilan API, perubahan konfigurasi, aktivitas jaringan, dan peristiwa keamanan.
Alat bantu menganalisis data ini untuk mengidentifikasi tren, deteksi anomali, dan memvisualisasikan kinerja secara real-time melalui dasbor.
Alat pemantauan AWS kemudian dapat memberi tahu tim tentang masalah potensial untuk pemecahan masalah dan analisis akar masalah. Mereka juga dapat secara otomatis menyelesaikan beberapa masalah, termasuk menambahkan sumber daya atau memulai ulang layanan AWS.
Misalnya, ketika pelanggan meninggalkan keranjang belanja online karena gagal melakukan pembayaran, pemantauan AWS dapat mengidentifikasi kesalahan gateway pembayaran dan memperingatkan tim DevOps. Mereka kemudian dapat menyelidiki dan memperbaiki pengaturan batas waktu yang sudah ketinggalan zaman, sehingga meminimalkan kerugian pendapatan.
Harga pemantauan AWS biasanya meningkat sesuai dengan jumlah metrik khusus, volume penyerapan log, dan frekuensi analisis, tergantung pada layanan yang digunakan.
Untuk memberikan cakupan yang komprehensif, pemantauan AWS biasanya melacak metrik di empat area inti:
Pemantauan AWS secara otomatis melacak kinerja dan konsumsi sumber daya di seluruh komponen infrastruktur AWS.
Metrik ini membantu tim mengidentifikasi penyediaan sumber daya yang berlebihan, memprediksi kebutuhan kapasitas, dan deteksi penurunan kinerja sebelum berdampak pada pengguna.
Amazon CloudWatch, dasar pemantauan AWS, adalah alat utama untuk mengumpulkan data ini. Alat ini secara otomatis mengumpulkan, menggabungkan, dan menganalisis metrik di semua layanan AWS. Alat AWS lainnya seperti X-Ray dan CloudTrail terintegrasi dengan CloudWatch untuk memberikan tampilan terpadu tentang kesehatan, kinerja, dan keamanan sistem.
EC2 menyediakan virtual servers yang menjalankan aplikasi di cloud dengan kapasitas komputasi sesuai permintaan.
Metrik utama EC2 meliputi:
ECS dan EKS, layanan kontainer asli Amazon, menerapkan dan mengatur aplikasi kontainer dalam skala besar.
Metrik kontainer utama meliputi:
RDS menyediakan basis data terkelola di lingkungan cloud AWS.
Metrik RDS utama meliputi:
Lambda menyediakan komputasi nirserver untuk berbagai tugas seperti mengubah ukuran gambar atau memperbarui basis data.
Metrik utama Lambda meliputi:
ELB mendistribusikan lalu lintas masuk ke sumber daya cloud yang sesuai untuk membantu menjaga ketersediaan tinggi.
Metrik ELB utama meliputi:
Pemantauan kinerja AWS dapat melacak perilaku aplikasi tetapi hanya dengan konfigurasi manual dan penambahan kode.
Aplikasi jarang sekali tersedia secara terpisah—aplikasi terhubung ke prosesor pembayaran eksternal, API pihak ketiga, dan basis data bukan AWS.
Pemantauan interaksi ini mengungkapkan apakah masalah kinerja berasal dari sumber daya AWS atau dependensi eksternal. Ini juga memberikan insight tentang bagaimana pengguna akhir berinteraksi dengan aplikasi.
AWS X-Ray, layanan pelacakan terdistribusi, adalah alat utama untuk mengumpulkan metrik ini. Ketika kode ditambahkan dengan SDK-nya, X-Ray akan melacak permintaan saat mereka bergerak melalui aplikasi, memberikan visibilitas tentang latensi, kesalahan, dan hambatan di seluruh layanan AWS.
Metrik pemantauan kinerja aplikasi utama meliputi:
Pemantauan AWS secara otomatis melacak aktivitas dan perubahan konfigurasi dalam akun AWS. Metrik ini membantu mengidentifikasi siapa yang mengakses data sensitif, deteksi pelanggaran kebijakan, dan membuktikan kepatuhan terhadap peraturan.
Layanan AWS Security yang berbeda memberikan manfaat keamanan yang berbeda pula, seperti jejak audit, pelacakan konfigurasi, dan deteksi ancaman. Beberapa layanan, seperti CloudTrail, mencatat aktivitas dasar secara default, sementara yang lain—seperti GuardDuty dan Config—memerlukan pengaturan eksplisit.
Layanan keamanan bawaan AWS utama meliputi:
Metrik keamanan utama meliputi:
Pemantauan AWS dapat melacak metrik bisnis tetapi memerlukan konfigurasi khusus, di mana organisasi menentukan dan mengirimkannya ke alat pemantauan AWS sebagai metrik khusus.
Metrik ini—seperti pendapatan, waktu pemenuhan pesanan, atau kepuasan pelanggan—dapat membantu menghubungkan kinerja teknis dengan hasil bisnis, membenarkan pengeluaran cloud, dan mengidentifikasi bagaimana masalah sistem memengaruhi pendapatan.
Metrik operasional dan bisnis utama meliputi:
Pemantauan membantu menjawab apa yang salah, sementara observabilitas membantu menjelaskan mengapa hal itu terjadi.
Solusi pemantauan AWS biasanya mencakup kemampuan pengamatan AWS. Keduanya bekerja sama untuk memecahkan masalah dan menjaga keandalan.
Pemantauan menangkap metrik yang telah ditentukan sebelumnya seperti penggunaan CPU dan latensi jaringan, menawarkan cuplikan kinerja sistem tetapi sedikit insight tentang mengapa masalah terjadi. Misalnya, pemantauan mungkin mengidentifikasi pemanfaatan CPU yang tinggi di server web tetapi bukan akar masalahnya.
Observabilitas menghubungkan beberapa jenis data telemetri—metrik, peristiwa, log, dan jejak (data MELT)—untuk memberikan tampilan lingkungan AWS secara real-time. Observabilitas berkembang dari pemantauan tradisional untuk menangani kompleksitas arsitektur cloud native.
