Observabilitas adalah kemampuan untuk memahami keadaan internal sistem dengan menganalisis output eksternalnya, terutama melalui data telemetri seperti metrik, peristiwa, log, dan jejak, yang secara kolektif disebut sebagai “data MELT”.
Observabilitas melampaui solusi pemantauan tradisional untuk memberikan insight penting tentang sistem perangkat lunak dan lingkungan komputasi cloud, membantu tim IT memastikan ketersediaan, mengoptimalkan kinerja, dan mendeteksi anomali.
Sebagian besar sistem IT berperilaku secara deterministik, yang membuat analisis akar masalah cukup mudah. Ketika aplikasi gagal, alat observabilitas dapat menggunakan data MELT untuk menghubungkan sinyal dan menemukan titik kegagalan, menentukan apakah itu kebocoran memori, kegagalan koneksi database, atau timeout API.
Namun, model bahasa besar (LLM) dan aplikasi kecerdasan buatan (AI) generatif lainnya mempersulit observabilitas. Tidak seperti perangkat lunak tradisional, LLM menghasilkan output yang bersifat probabilistik, yang berarti input yang sama dapat menghasilkan respons yang berbeda. Kurangnya interpretabilitas ini, atau kesulitan dalam melacak bagaimana input membentuk output, dapat menyebabkan masalah bagi alat observabilitas konvensional. Akibatnya, pemecahan masalah, debugging, dan pemantauan kinerja secara signifikan lebih kompleks dalam sistem AI generatif.
“Observabilitas dapat mendeteksi jika respons AI mengandung informasi identifikasi pribadi (PII), misalnya, tetapi tidak dapat menghentikannya,” jelas Drew Flowers dari IBM, Americas Sales Leader untuk Instana. “Proses pengambilan keputusan model masih merupakan kotak hitam.”
Fenomena “kotak hitam” ini menyoroti tantangan penting bagi observabilitas LLM. Meskipun alat observabilitas dapat mendeteksi masalah yang telah terjadi, alat tersebut tidak dapat mencegah masalah tersebut karena kesulitan dengan keterjelasan AI, yaitu kemampuan untuk memberikan alasan yang dapat dipahami manusia mengapa suatu model membuat keputusan tertentu atau menghasilkan output tertentu.
Hingga masalah keterjelasan diselesaikan, solusi observabilitas AI harus memprioritaskan hal-hal yang dapat diukur dan dianalisis secara efektif. Ini termasuk kombinasi data MELT tradisional dan metrik observabilitas khusus AI.
Meskipun metrik tradisional tidak memberikan visibilitas lengkap ke dalam perilaku model, metrik ini tetap merupakan komponen penting dari kemampuan observabilitas AI. CPU, memori, dan kinerja jaringan secara langsung memengaruhi fungsionalitas sistem AI dan pengalaman pengguna. Mereka dapat membantu organisasi menilai seberapa efisien beban kerja AI berjalan dan apakah kendala infrastruktur memengaruhi kinerja model dan waktu respons.
Namun, pengamatan AI yang komprehensif memerlukan metrik tambahan yang memantau kualitas khusus untuk model AI dan output, termasuk:
Token adalah unit bahasa individu, biasanya berupa kata atau bagian dari kata, yang dapat dipahami oleh model AI. Jumlah token yang diproses model untuk memahami input atau menghasilkan output secara langsung berdampak pada biaya dan kinerja aplikasi berbasis LLM. Konsumsi token yang lebih tinggi dapat meningkatkan biaya operasional dan latensi respons.
Metrik utama untuk melacak penggunaan token meliputi:
Metrik ini dapat membantu organisasi mengidentifikasi peluang pengoptimalan untuk mengurangi konsumsi token, seperti dengan menyempurnakan prompt untuk menyampaikan lebih banyak informasi dalam token yang lebih sedikit. Dengan mengoptimalkan pemanfaatan token, organisasi dapat mempertahankan kualitas respons yang tinggi sambil berpotensi mengurangi biaya inferensi untuk beban kerja machine learning.
Tidak seperti perangkat lunak tradisional, model AI dapat mengubah perilakunya secara bertahap seiring berkembangnya data dunia nyata. Fenomena ini, yang dikenal sebagai pergeseran model, dapat memengaruhi keandalan dan kinerja sistem AI secara signifikan.
Metrik utama untuk melacak penyimpangan model meliputi:
Mekanisme deteksi drift dapat memberikan peringatan dini ketika akurasi model menurun untuk contoh penggunaan tertentu, memungkinkan tim untuk melakukan intervensi sebelum model mengganggu operasi.
Memantau kualitas output AI sangat penting untuk menjaga kepercayaan, keandalan, dan kepatuhan. Metrik utama untuk melacak kualitas respons meliputi:
Meskipun melacak metrik ini dapat membantu menandai respons anomali, alat pengamatan tidak dapat sepenuhnya menjelaskan mengapa halusinasi terjadi, juga tidak dapat secara otomatis menentukan kebenaran konten yang dihasilkan AI. Ini adalah tantangan utama untuk kepercayaan dan tata kelola AI yang belum sepenuhnya ditangani oleh siapa pun.
Memastikan penerapan AI yang etis dan kepatuhan terhadap peraturan memerlukan pemantauan komprehensif terhadap konten yang dihasilkan AI.
Metrik utama untuk melacak AI yang bertanggung jawab meliputi:
Dasbor visualisasi real-time dengan deteksi anomali otomatis dapat mengingatkan tim saat output AI menyimpang dari norma yang diharapkan. Pendekatan proaktif ini membantu organisasi mengatasi masalah dengan cepat, memantau kinerja AI dari waktu ke waktu, dan memastikan AI yang bertanggung jawab dalam skala besar.
OpenTelemetry (OTel) telah muncul sebagai kerangka kerja standar industri untuk mengumpulkan dan mentransmisikan data telemetri, dan juga dapat membantu observabilitas AI generatif. Proyek sumber terbuka ini menyediakan pendekatan netral vendor untuk pengamatan yang sangat berharga dalam ekosistem AI yang kompleks.
Untuk penyedia AI, OpenTelemetry menawarkan cara untuk menstandarkan cara mereka berbagi data kinerja tanpa mengekspos detail model eksklusif atau kode sumber. Untuk perusahaan, ini memastikan bahwa data observabilitas mengalir secara konsisten melintasi saluran AI kompleks yang mungkin mencakup beberapa model, berbagai dependensi, dan sistem generasi dengan dukungan pengambilan data (RAG).
Manfaat utama OpenTelemetry untuk observabilitas gen AI meliputi:
Aplikasi AI membutuhkan investasi yang signifikan, mulai dari biaya lisensi model hingga pengeluaran infrastruktur dan sumber daya pengembang. Organisasi yang menunda pengamatan AI generatif berisiko membuang sumber daya jika mereka tidak dapat mengungkap masalah kinerja, masalah etika, atau implementasi yang tidak efisien.
“Untuk observability AI, time to value (TTV) adalah segalanya,” kata Flowers. “Jika saya tidak bisa mulai mendapatkan insight dengan cepat, saya membakar uang saat menunggu untuk mengoptimalkan sistem saya.”
Beberapa tantangan umum yang memperlambat adopsi observabilitas AI meliputi:
Untuk mengatasi tantangan ini, organisasi harus mempertimbangkan solusi observabilitas yang mendukung:
Organisasi harus memprioritaskan solusi observabilitas yang dapat mereka terapkan dengan cepat untuk mendapatkan insight langsung. Platform yang telah dikonfigurasikan sebelumnya dapat secara signifikan mengurangi waktu penyiapan dan mempercepat TTV, sehingga tim dapat mulai memantau sistem AI dalam hitungan hari, bukan minggu.
Kemampuan solusi observabilitas utama untuk penerapan observabilitas AI yang cepat meliputi:
Menganalisis data yang dihasilkan AI dalam jumlah besar secara manual dapat memakan waktu dan keahlian yang signifikan, sehingga sering kali menyebabkan penundaan, kesalahan, atau masalah yang terlewatkan. Solusi observabilitas dapat mengotomatiskan proses ini, sehingga tim dapat fokus pada masalah yang lebih mendesak daripada memilah data telemetri mentah.
Otomatisasi utama dalam solusi pengamatan AI meliputi:
Observabilitas seharusnya tidak menjadi pemikiran tambahan. Menanamkannya di seluruh siklus pengembangan AI akan memberdayakan tim di seluruh organisasi dengan visibilitas bersama ke kinerja sistem AI, memungkinkan penyelesaian masalah yang lebih cepat dan pengambilan keputusan yang lebih tepat.
Untuk observabilitas AI, TTV bukan hanya tentang seberapa cepat alat observabilitas dapat diterapkan. Ini juga tentang seberapa cepat alat ini memberikan insight yang dapat ditindaklanjuti untuk mengoptimalkan investasi AI dan mencegah downtime.
Cara utama untuk mengintegrasikan pengamatan AI ke dalam alur kerja pengembangan AI meliputi:
Ketika observabilitas AI matang, organisasi beralih dari pemantauan reaktif ke pendekatan prediktif yang mengantisipasi masalah sebelum berdampak pada pengguna atau hasil bisnis. Untuk mendukung hal ini, solusi pengamatan paling canggih sekarang menggabungkan alat AI khusus mereka sendiri untuk menganalisis pola di seluruh data telemetri dan mengidentifikasi masalah sebelum menjadi penting.
“AI yang paling berharga dalam observabilitas adalah AI prediktif dan kausal, bukan AI generatif,” jelas Flowers.
Alat observabilitas dengan kemampuan AI prediktif dan kausal dapat:
Pergeseran dari observabilitas reaktif ke prediktif ini mewakili perbatasan berikutnya untuk operasi AI, memungkinkan pengelolaan aplikasi dan infrastruktur AI yang lebih proaktif sambil memastikan output yang konsisten dan berkualitas tinggi.
Berdasarkan tantangan dan solusi yang dibahas, berikut adalah lima prinsip penting yang perlu diingat ketika mencari solusi observabilitas yang tepat untuk aplikasi AI generatif:
Meskipun observabilitas AI memberikan insight penting tentang kinerja dan anomali, itu tidak dapat sepenuhnya menjelaskan proses pengambilan keputusan internal model bahasa besar. Fokus pada metrik terukur yang menunjukkan kesehatan dan kinerja sistem.
Observabilitas AI generatif yang komprehensif memerlukan pemantauan pola penggunaan token, indikator penyimpangan model, dan hubungan prompt-respon di samping metrik kinerja infrastruktur tradisional seperti pemanfaatan CPU dan konsumsi memori.
Pilih platform pengamatan yang menawarkan kemampuan penerapan cepat dengan dasbor yang telah dikonfigurasi sebelumnya dan peringatan otomatis untuk mewujudkan pengembalian investasi AI yang lebih cepat dan mencegah masalah operasional yang mahal.
Integrasikan instrumentasi observabilitas di awal siklus pengembangan perangkat lunak untuk mengidentifikasi masalah sebelum penerapan, menetapkan garis dasar kinerja, dan membuat loop masukan yang meningkatkan kualitas sistem AI.
Standarisasi pada kerangka kerja pengamatan terbuka membantu strategi observabilitas yang siap untuk masa depan sambil memberikan visibilitas menyeluruh yang komprehensif di seluruh sistem AI yang kompleks dan menghindari vendor lock-in.
Selain itu, ingatlah bahwa menggunakan OpenTelemetry bukan berarti Anda harus memilih solusi observabilitas sumber terbuka. Banyak platform komersial, yang mungkin sudah digunakan oleh organisasi Anda, yang sepenuhnya mendukung OTel dan menawarkan kemampuan tambahan kelas enterprise.
Solusi observabilitas komersial dapat menyediakan observabilitas yang terkelola sepenuhnya dengan insight berbasis AI dan dukungan berkelanjutan, meminimalkan pengaturan manual dan pemeliharaan serta meningkatkan TTV.
“Jika saya duduk di sana membuat dasbor, membuat peringatan, membangun konteks dan data, saya benar-benar hanya fokus pada pembuatan perkakas. Saya tidak mengoptimalkan sistem. Saya tidak mendukung inisiatif pelanggan,” kata Flowers. “Apa yang saya lakukan secara fundamental tidak membantu saya menghasilkan uang.”
Dengan solusi observabilitas komersial, sebagian besar pengaturan itu dapat diotomatisasi atau dikonfigurasi sebelumnya. Tim dapat fokus pada mengoptimalkan kinerja dan keandalan model AI generatif mereka, memaksimalkan investasi observabilitas dan dampak dunia nyata dari aplikasi AI.
Mengidentifikasi dan memperbaiki sumber masalah dengan cepat.Data real-time dengan fidelitas tinggi menawarkan visibilitas lengkap terhadap lingkungan aplikasi dan infrastruktur yang dinamis.
Tingkatkan otomatisasi dan operasi TI dengan AI generatif, yang menyelaraskan setiap aspek infrastruktur TI Anda dengan prioritas bisnis.
IBM SevOne Network Performance Management adalah perangkat lunak pemantauan dan analitik yang memberikan visibilitas dan wawasan real-time ke dalam jaringan yang kompleks.