Pengamatan cloud-native adalah kemampuan untuk memahami aplikasi dan sistem cloud yang sangat kompleks—biasanya berbasis layanan mikro, dan seringkali tanpa server—berdasarkan output dan data telemetri mereka.
Pengamatan cloud-native berbeda dari observabilitas tradisional dalam fokus spesifiknya pada tantangan yang ditimbulkan oleh sistem cloud. Dalam sistem ini, kontainer, mesin virtual, dan sumber daya lainnya dapat disediakan dan dihapus dalam sekejap, sehingga menciptakan sejumlah besar data yang terkadang bersifat sementara.
Solusi observabilitas cloud-native membantu organisasi melacak titik data utama dalam sistem yang dapat berubah-ubah ini, yang pada gilirannya membantu mendukung proses DevOps dan pembaruannya yang kecil, sering, dan sering kali otomatis.
Platform pengamatan cloud asli mengumpulkan data dari seluruh lingkungan hybrid cloud organisasi, yang dapat terdiri dari layanan dari beberapa penyedia (seperti Microsoft Azure dan Amazon Web Services), server di tempat dan banyak alat dan sumber daya yang mereka dukung (seperti layanan mikro atau alat orkestrasi kontainer seperti Kubernetes). Mereka memberikan insight yang dapat ditindaklanjuti ke dalam metrik seperti lalu lintas jaringan dan latensi dan korelasi antara metrik tersebut di seluruh platform, seringkali mengotomatiskan perbaikan dan visualisasi yang diperlukan dari data yang dikumpulkan.
Misalnya, platform observabilitas berbasis cloud mungkin mengumpulkan metrik latensi dari mesin virtual yang dihosting di server cloud, log dari kontainer yang diatur Orchestrate mesin virtual yang menjelaskan panggilan API mereka dan informasi tentang peristiwa jaringan seperti penerapan aplikasi baru. Kemudian dapat menyajikan data yang dikumpulkan sebagai bagan atau grafik dan melakukan analisis akar masalah, memberikan insight konkret kepada administrator tentang apa yang menyebabkan waktu henti.
Banyak platform modern menggunakan kecerdasan buatan (AI) dan machine learning (ML) untuk mendukung fitur otomatis ini. Menurut laporan tahun 2025 dari 451 Riset, 71% organisasi yang menggunakan solusi observabilitas menggunakan fitur AI mereka, meningkat dari tahun 2024 sebesar 26%.1
Banyak alat pengamatan cloud-native yang populer adalah sumber terbuka, seperti OpenTelemetry, Jaeger dan Prometheus. Dengan memungkinkan komunitas pengembang untuk membuat perbaikan khusus platform atau aplikasi saat masalah muncul, alat sumber terbuka memberi organisasi lebih banyak fleksibilitas dalam lingkungan cloud-native yang terkadang tidak dapat diprediksi, dan kemampuan yang lebih besar untuk menghubungkan alat mereka dengan berbagai sistem dan antarmuka pemrograman aplikasi (API).
Buletin industri
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM® kami untuk informasi lebih lanjut.
Alat pengamatan berbasis cloud mengumpulkan log, jejak, dan metrik dari seluruh ekosistem cloud. Mereka sering menyajikan data mentah, analisis, dan visualisasi melalui dasbor yang membantu pengguna memantau kesehatan aplikasi dan tujuan bisnis.
Dalam lingkungan cloud yang sebagian besar terdiri dari layanan mikro, kontainer baru dan mesin virtual dapat menghilang dan muncul dalam sekejap, sehingga menciptakan data telemetri dalam jumlah besar. Ini menciptakan masalah baru yang harus ditangani oleh platform pengamatan cloud-native: melihat segala sesuatu dalam jaringan yang terus berubah, dan melacak data dari sumber yang mungkin tidak lagi ada saat jaringan berkembang dan berkontraksi secara otomatis untuk memenuhi kebutuhan bisnis.
Alat observabilitas memfasilitasi pengumpulan dan agregasi data memori CPU, log aplikasi, informasi ketersediaan, latensi rata-rata, dan titik data lainnya dalam jaringan kompleks ini.
Platform observabilitas cloud-native mengandalkan tiga pilar pengamatan: log, jejak, dan metrik.
Log adalah catatan peristiwa aplikasi yang terperinci, diberi stempel waktu, lengkap, dan tidak dapat diubah. Log dapat digunakan untuk membuat catatan dalam satuan milidetik dengan ketelitian yang tinggi dari setiap peristiwa, lengkap dengan konteks terkait. Pengembang menggunakan log untuk pemecahan masalah dan debugging.
Traces merekam “perjalanan” ujung ke ujung dari setiap permintaan pengguna, dari antarmuka pengguna, melalui seluruh arsitektur, dan kembali ke pengguna.
Metrik adalah ukuran mendasar kesehatan aplikasi dan sistem dari waktu ke waktu. Misalnya, metrik digunakan untuk mengukur berapa banyak memori atau kapasitas CPU yang digunakan aplikasi dalam lima menit, atau berapa banyak latensi yang dialami aplikasi selama lonjakan penggunaan.
Visibilitas adalah fungsi inti dari platform observabilitas cloud-native. Kemampuan untuk memantau kontainer, mesin virtual, server, dan elemen lain dari jaringan berbasis layanan mikro merupakan fitur penting untuk arsitektur ini, di mana pelacakan terdistribusi dan peta ketergantungan dapat berbelit-belit dan hampir tidak dapat dipahami.
Dasbor pengamatan memungkinkan pengguna untuk memantau ukuran kesehatan aplikasi seperti ketersediaan dan penggunaan sumber daya serta tujuan bisnis yang relevan seperti tingkat konversi atau pengguna aktif. Fitur pemantauan juga membantu memperjelas bagaimana layanan bekerja satu sama lain (dengan menggunakan alat seperti grafik ketergantungan) dan bagaimana mereka cocok dengan arsitektur keseluruhan.
Pemantauan tradisional dilakukan dengan alat manajemen kinerja aplikasi (APM), yang akan menggabungkan data yang dikumpulkan dari setiap sumber data untuk membuat laporan, dasbor, dan visualisasi yang dapat dicerna—tidak seperti fitur pemantauan dalam perangkat lunak pengamatan modern.
Dalam lingkungan komputasi awan modern, alat observabilitas sering menurunkan telemetri dasar ke lapisan Kubernetes, di mana perangkat lunak orkestrasi kontainer menggunakan alat asli untuk melakukan observabilitas dalam platform. Mengizinkan Kubernetes untuk mengotomatiskan aktivitas ini memungkinkan tim TI untuk memfokuskan analisis data pada tujuan tingkat layanan (SLOs) dan indikator tingkat layanan (SLI).
Otomatisasi dalam perangkat lunak pengamatan modern lebih dari sekadar pengumpulan, pemantauan, dan analisis. Alat bantu observabilitas juga dapat mengotomatiskan proses debugging, instrumentasi, dan pembaruan dasbor pemantauan saat layanan baru ditambahkan ke jaringan. Mereka juga dapat mengelola penanganan agen, di mana agen adalah komponen kecil yang diterapkan di seluruh ekosistem untuk terus mengumpulkan data telemetri.
Mempraktikkan observabilitas cloud-native dapat memberi organisasi pandangan yang lebih komprehensif tentang sistem yang kompleks, mengurangi waktu rata-rata untuk perbaikan (MTTR) dan lebih lanjut mengintegrasikan alat otomatisasi ke dalam alur kerja DevOps workflow.
Dalam sistem yang sangat terdistribusi, sejumlah besar server yang tumpang tindih dan aplikasi cloud-native memancarkan sinyal, metrik, log, dan jejak, dan mereka tidak selalu berbagi data dengan bersih. Alat bantu observabilitas cloud-native membantu mengatasi hambatan ini dengan mengumpulkan data observabilitas dari seluruh ekosistem, sehingga administrator dapat memecahkan masalah secara real time dan mengambil keputusan berbasis data.
Setelah administrator—atau alat otomatis dalam platform observabilitas—telah melihat korelasi antara masalah di cloud, mereka dapat melakukan analisis akar masalah. Misalnya, platform mungkin menandai respons aplikasi lambat secara global yang bertepatan dengan latensi tinggi di wilayah tertentu, dan kemudian melakukan analisis untuk mengidentifikasi server yang salah konfigurasi atau tidak berfungsi yang bertanggung jawab atas masalah tersebut.
Analisis ini dapat menjadi perbedaan antara melakukan triaging insiden selama berjam-jam dan menyelesaikan masalah yang akan datang sebelum terjadi, mengurangi downtime dan membebaskan tim DevOps untuk tugas-tugas lain.
Kecerdasan buatan dan alat pembelajaran mesin berada di jantung banyak platform pengamatan modern, mendeteksi anomali tanpa intervensi pengguna, melakukan analisis akar penyebab dan menggunakan AI generatif untuk visualisasi data.
Banyaknya data telemetri yang dihasilkan di lingkungan cloud membuat AI dan ML sangat berharga untuk pengamatan berbasis cloud. Mengotomatiskan pengamatan dalam skala besar dapat menghasilkan insight yang memungkinkan organisasi untuk mengotomatiskan fungsi bisnis lainnya, juga. Analisis prediktif, misalnya, dapat memungkinkan bisnis untuk menyediakan infrastruktur server baru sebelum lalu lintas padat.
Karena mengumpulkan dan mensintesis sejumlah besar dan beragam data, cloud-native dapat menimbulkan tantangan terkait penskalaan dan kompleksitas, penggunaan beberapa alat pengamatan, serta privasi data dan kepatuhan.
Organisasi harus menyeimbangkan visibilitas di lingkungan cloud yang kompleks dengan kendala praktis seputar biaya penyimpanan, kinerja kueri, dan retensi data. Tanpa strategi pengambilan sampel yang tepat dan prioritas data, volume data yang dikumpulkan dapat membanjiri platform pengamatan.
Sifat layanan mikro kontainer yang luas dan berubah dengan cepat juga dapat berarti bahwa pemantauan harus melampaui tingkat aplikasi ke cluster dan node alat orkestrasi seperti Kubernetes.
Sebagian besar organisasi mengoperasikan lusinan alat pemantauan yang terakumulasi selama bertahun-tahun, masing-masing melayani tim atau teknologi tertentu. Tumpukan teknologi biasanya mencakup berbagai bahasa pemrograman, sistem lama, lingkungan multicloud, layanan mikro, komponen infrastruktur, dan kerangka kerja. Hal ini membuat interoperabilitas menjadi sulit dan menciptakan data yang terfragmentasi, yang mengalahkan tujuan mendasar dari observabilitas: menciptakan pandangan terpadu tentang kesehatan sistem.
Observabilitas cloud-native dapat menciptakan tantangan kepatuhan dengan menggabungkan data sensitif dari seluruh perusahaan ke dalam platform. Data telemetri dapat berisi informasi identifikasi pribadi (PII), detail kartu pembayaran, atau informasi kesehatan yang dilindungi. Jenis data ini dapat berada di bawah wewenang peraturan seperti Peraturan Perlindungan Data Umum (GDPR), Undang-Undang Portabilitas dan Akuntabilitas Asuransi Kesehatan (HIPAA) dan Undang-Undang Privasi Konsumen California (CCPA).
Tanpa penyembunyian data, tokenisasi, pembatasan geografis, dan kontrol akses berbasis peran, organisasi berisiko mengekspos data sensitif kepada pengguna yang tidak sah atau melanggar persyaratan peraturan. Contohnya, menyelesaikan masalah transaksi untuk pelanggan Eropa dapat memerlukan akses ke log yang berisi informasi identifikasi pribadi. Jika karyawan yang berbasis di AS melihat data itu, situasi itu mungkin membuka pintu bagi pelanggaran GDPR.
Implementasi observabilitas cloud-native adalah pilar dari pergeseran menuju AIOps, aplikasi kemampuan AI untuk mengotomatisasi, merampingkan dan mengoptimalkan manajemen layanan TI dan alur kerja operasional.
Ketika organisasi memiliki visibilitas yang lebih besar ke dalam data di cloud, mereka dapat mengotomatiskan keputusan tentang penyediaan atau pemecahan masalah bahkan di lingkungan cloud yang sering luas, luas, dan tidak dapat diprediksi. Singkatnya, observabilitas memungkinkan AIOP dengan memberi organisasi kepercayaan yang lebih besar dalam pengambilan keputusan alat AI dan ML mereka.
Fungsi AI utama dalam pengamatan cloud-native meliputi:
Sementara keduanya memiliki kesamaan penting, pengamatan cloud-native berbeda dari praktik full-stack observability. Pengamatan cloud-native dapat dianggap sebagai evolusi full-stack observability, mengadaptasi alat dan teknik yang sama untuk lingkungan cloud-native.
Full-stack observability mengorelasikan telemetri di semua lapisan tumpukan teknologi. Platform full-stack observability mengumpulkan data dari beberapa sistem secara real time dan menggunakan AI dan ML untuk mendeteksi anomali, memprediksi kegagalan, dan menghasilkan insight bagi administrator.
Pengamatan cloud-native adalah evolusi dari ini, di mana pengumpulan data dan alat analisis yang digunakan untuk full-stack observability dikembangkan secara khusus untuk teknologi cloud-native, terintegrasi dengan lancar dengan layanan mikro yang kompleks dan berkontainer.
Singkatnya, sementara full-stack observability menyediakan data telemetri yang komprehensif di seluruh lingkungan TI, cloud native difokuskan secara khusus pada lingkungan cloud yang nirserver.
Mengidentifikasi dan memperbaiki sumber masalah dengan cepat.Data real-time dengan fidelitas tinggi menawarkan visibilitas lengkap terhadap lingkungan aplikasi dan infrastruktur yang dinamis.
Tingkatkan otomatisasi dan operasi TI dengan AI generatif, yang menyelaraskan setiap aspek infrastruktur TI Anda dengan prioritas bisnis.
IBM SevOne Network Performance Management adalah perangkat lunak pemantauan dan analitik yang memberikan visibilitas dan wawasan real-time ke dalam jaringan yang kompleks.
1. “Use of observability tools rises alongside AI integration – Highlights from VotE: Cloud Native,” 451 Research, 14 Agustus 2025.