Bagaimana observabilitas menyesuaikan dengan AI generatif

15 April 2025

Penyusun

Observabilitas adalah kemampuan untuk memahami keadaan internal sistem dengan menganalisis output eksternalnya, terutama melalui data telemetri seperti metrik, peristiwa, log, dan jejak, yang secara kolektif disebut sebagai “data MELT”.

Observabilitas melampaui solusi pemantauan tradisional untuk memberikan insight penting tentang sistem perangkat lunak dan lingkungan komputasi cloud, membantu tim IT memastikan ketersediaan, mengoptimalkan kinerja, dan mendeteksi anomali.

Sebagian besar sistem IT berperilaku secara deterministik, yang membuat analisis akar masalah cukup mudah. Ketika aplikasi gagal, alat observabilitas dapat menggunakan data MELT untuk menghubungkan sinyal dan menemukan titik kegagalan, menentukan apakah itu kebocoran memori, kegagalan koneksi database, atau timeout API.

Namun, model bahasa besar (LLM) dan aplikasi kecerdasan buatan (AI) generatif lainnya mempersulit observabilitas. Tidak seperti perangkat lunak tradisional, LLM menghasilkan output yang bersifat probabilistik, yang berarti input yang sama dapat menghasilkan respons yang berbeda. Kurangnya interpretabilitas ini, atau kesulitan dalam melacak bagaimana input membentuk output, dapat menyebabkan masalah bagi alat observabilitas konvensional. Akibatnya, pemecahan masalah, debugging, dan pemantauan kinerja secara signifikan lebih kompleks dalam sistem AI generatif.

“Observabilitas dapat mendeteksi jika respons AI mengandung informasi identifikasi pribadi (PII), misalnya, tetapi tidak dapat menghentikannya,” jelas Drew Flowers dari IBM, Americas Sales Leader untuk Instana. “Proses pengambilan keputusan model masih merupakan kotak hitam.”

Fenomena “kotak hitam” ini menyoroti tantangan penting bagi observabilitas LLM. Meskipun alat observabilitas dapat mendeteksi masalah yang telah terjadi, alat tersebut tidak dapat mencegah masalah tersebut karena kesulitan dengan keterjelasan AI, yaitu kemampuan untuk memberikan alasan yang dapat dipahami manusia mengapa suatu model membuat keputusan tertentu atau menghasilkan output tertentu.

Hingga masalah keterjelasan diselesaikan, solusi observabilitas AI harus memprioritaskan hal-hal yang dapat diukur dan dianalisis secara efektif. Ini termasuk kombinasi data MELT tradisional dan metrik observabilitas khusus AI.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru 


Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Metrik penting untuk observabilitas gen AI

Meskipun metrik tradisional tidak memberikan visibilitas lengkap ke dalam perilaku model, metrik ini tetap merupakan komponen penting dari kemampuan observabilitas AI. CPU, memori, dan kinerja jaringan secara langsung memengaruhi fungsionalitas sistem AI dan pengalaman pengguna. Mereka dapat membantu organisasi menilai seberapa efisien beban kerja AI berjalan dan apakah kendala infrastruktur memengaruhi kinerja model dan waktu respons.

Namun, pengamatan AI yang komprehensif memerlukan metrik tambahan yang memantau kualitas khusus untuk model AI dan output, termasuk:

  • Penggunaan token
  • Penyimpangan model
  • Kualitas respons
  • Pemantauan AI yang bertanggung jawab

Penggunaan token

Token adalah unit bahasa individu, biasanya berupa kata atau bagian dari kata, yang dapat dipahami oleh model AI. Jumlah token yang diproses model untuk memahami input atau menghasilkan output secara langsung berdampak pada biaya dan kinerja aplikasi berbasis LLM. Konsumsi token yang lebih tinggi dapat meningkatkan biaya operasional dan latensi respons.

Metrik utama untuk melacak penggunaan token meliputi:

  • Tingkat dan biaya konsumsi token, yang dapat membantu mengukur biaya operasional.

  • Efisiensi token, ukuran dari seberapa efektif setiap token digunakan dalam suatu interaksi. Interaksi yang efisien menghasilkan output berkualitas tinggi sambil meminimalkan jumlah token yang dikonsumsi.

  • Pola penggunaan token di berbagai jenis prompt, yang dapat membantu mengidentifikasi penggunaan model yang membutuhkan banyak sumber daya.

Metrik ini dapat membantu organisasi mengidentifikasi peluang pengoptimalan untuk mengurangi konsumsi token, seperti dengan menyempurnakan prompt untuk menyampaikan lebih banyak informasi dalam token yang lebih sedikit. Dengan mengoptimalkan pemanfaatan token, organisasi dapat mempertahankan kualitas respons yang tinggi sambil berpotensi mengurangi biaya inferensi untuk beban kerja machine learning.

Penyimpangan model 

Tidak seperti perangkat lunak tradisional, model AI dapat mengubah perilakunya secara bertahap seiring berkembangnya data dunia nyata. Fenomena ini, yang dikenal sebagai pergeseran model, dapat memengaruhi keandalan dan kinerja sistem AI secara signifikan.

Metrik utama untuk melacak penyimpangan model meliputi:

  • Perubahan dalam pola respons dari waktu ke waktu untuk mengidentifikasi inkonsistensi yang muncul.

  • Variasi dalam kualitas output atau relevansi yang mungkin mengindikasikan penurunan kinerja model.

  • Pergeseran dalam latensi atau pemanfaatan sumber daya yang dapat menandakan inefisiensi komputasi.

Mekanisme deteksi drift dapat memberikan peringatan dini ketika akurasi model menurun untuk contoh penggunaan tertentu, memungkinkan tim untuk melakukan intervensi sebelum model mengganggu operasi.

Kualitas respons

Memantau kualitas output AI sangat penting untuk menjaga kepercayaan, keandalan, dan kepatuhan. Metrik utama untuk melacak kualitas respons meliputi:

  • Frekuensi halusinasi di berbagai jenis prompt untuk mengidentifikasi kemungkinan pemicu output yang tidak akurat.

  • Akurasi faktual dari respons yang dihasilkan, meskipun ini seringkali memerlukan validasi eksternal dan pengawasan manusia.

  • Konsistensi output untuk input serupa untuk memverifikasi stabilitas model dari waktu ke waktu.

  • Relevansi respons terhadap prompt untuk menilai bagaimana model selaras dengan maksud pengguna.

  • Pelacakan latensi sangat penting untuk aplikasi AI yang berhadapan langsung dengan pengguna, di mana kecepatan dan akurasi sering kali harus bertukar. Memantau waktu respons di berbagai jenis prompt dapat membantu organisasi menentukan kemacetan kinerja dan inefisiensi komputasi.

Meskipun melacak metrik ini dapat membantu menandai respons anomali, alat pengamatan tidak dapat sepenuhnya menjelaskan mengapa halusinasi terjadi, juga tidak dapat secara otomatis menentukan kebenaran konten yang dihasilkan AI. Ini adalah tantangan utama untuk kepercayaan dan tata kelola AI yang belum sepenuhnya ditangani oleh siapa pun.

Pemantauan AI yang bertanggung jawab

Memastikan penerapan AI yang etis dan kepatuhan terhadap peraturan memerlukan pemantauan komprehensif terhadap konten yang dihasilkan AI.

Metrik utama untuk melacak AI yang bertanggung jawab meliputi:

  • Terjadinya bias dalam respons untuk membantu memastikan keadilan di seluruh interaksi pengguna.

  • Instans PII dalam konten yang dihasilkan untuk membantu melindungi informasi sensitif.

  • Kepatuhan terhadap pedoman AI yang etis agar selaras dengan standar dan peraturan industri.

  • Kesesuaian konten untuk menegakkan reputasi merek dan kepercayaan pengguna.

Dasbor visualisasi real-time dengan deteksi anomali otomatis dapat mengingatkan tim saat output AI menyimpang dari norma yang diharapkan. Pendekatan proaktif ini membantu organisasi mengatasi masalah dengan cepat, memantau kinerja AI dari waktu ke waktu, dan memastikan AI yang bertanggung jawab dalam skala besar. 

Mixture of Experts | 25 April, episode 52

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

OpenTelemetry dan observabilitas AI

OpenTelemetry (OTel) telah muncul sebagai kerangka kerja standar industri untuk mengumpulkan dan mentransmisikan data telemetri, dan juga dapat membantu observabilitas AI generatif. Proyek sumber terbuka ini menyediakan pendekatan netral vendor untuk pengamatan yang sangat berharga dalam ekosistem AI yang kompleks.

Untuk penyedia AI, OpenTelemetry menawarkan cara untuk menstandarkan cara mereka berbagi data kinerja tanpa mengekspos detail model eksklusif atau kode sumber. Untuk perusahaan, ini memastikan bahwa data observabilitas mengalir secara konsisten melintasi saluran AI kompleks yang mungkin mencakup beberapa model, berbagai dependensi, dan sistem generasi dengan dukungan pengambilan data (RAG).

Manfaat utama OpenTelemetry untuk observabilitas gen AI meliputi:

  • Independensi vendor: Organisasi menghindari lock-in ke platform observabilitas tertentu, menjaga fleksibilitas seiring berkembangnya teknologi AI.

  • Visibilitas menyeluruh: Data telemetri mengalir secara konsisten dari semua komponen infrastruktur aplikasi AI.

  • Persiapan untuk masa depan: Seiring berkembangnya teknologi AI, standar OpenTelemetry beradaptasi, memastikan strategi observabilitas tetap relevan.

  • Integrasi ekosistem: Standar terbuka memungkinkan pengamatan di seluruh solusi AI multivendor dan model penerapan hybrid.

  • Standarisasi metadata: Menangkap metadatapenting, termasuk stempel waktu pelatihan, asal kumpulan data, dan masukan model, untuk menyediakan konteks penting guna memahami perilaku sistem AI.
Gambar buletin untuk perpesanan otomatisasi

Buka kekuatan IBM Instana Observability

IBM Instana Observability dapat membantu Anda mencapai ROI sebesar 219% dan mengurangi waktu yang ditembus pengembang untuk memecahkan masalah hingga 90%.

Kecepatan adalah segalanya

Aplikasi AI membutuhkan investasi yang signifikan, mulai dari biaya lisensi model hingga pengeluaran infrastruktur dan sumber daya pengembang. Organisasi yang menunda pengamatan AI generatif berisiko membuang sumber daya jika mereka tidak dapat mengungkap masalah kinerja, masalah etika, atau implementasi yang tidak efisien.

“Untuk observability AI, time to value (TTV) adalah segalanya,” kata Flowers. “Jika saya tidak bisa mulai mendapatkan insight dengan cepat, saya membakar uang saat menunggu untuk mengoptimalkan sistem saya.”

Beberapa tantangan umum yang memperlambat adopsi observabilitas AI meliputi:

  • Dasbor kustom kompleks yang memerlukan pengaturan dan konfigurasi ekstensif.

  • Volume data yang sangat besar yang menyebabkan kemacetan pemrosesan.

  • Kurangnya otomatisasi dalam mengonfigurasi peringatan dan menghasilkan laporan.

  • Kesulitan integrasi antara platform AI dan alat observabilitas.

  • Kesenjangan keterampilan dalam menafsirkan data telemetri spesifik AI.

Untuk mengatasi tantangan ini, organisasi harus mempertimbangkan solusi observabilitas yang mendukung:

  • Penerapan cepat

  • Insight otomatis

  • Alur kerja AI terintegrasi

Penerapan cepat

Organisasi harus memprioritaskan solusi observabilitas yang dapat mereka terapkan dengan cepat untuk mendapatkan insight langsung. Platform yang telah dikonfigurasikan sebelumnya dapat secara signifikan mengurangi waktu penyiapan dan mempercepat TTV, sehingga tim dapat mulai memantau sistem AI dalam hitungan hari, bukan minggu.

Kemampuan solusi observabilitas utama untuk penerapan observabilitas AI yang cepat meliputi:

  • Templat dasbor khusus AI yang siap pakai dengan penyesuaian minimal.

  • Instrumentasi otomatis yang dapat segera mulai mengumpulkan data dari kerangka kerja dan platform AI yang umum.

  • Konektor siap pakai untuk penyedia LLM populer dan infrastruktur AI yang menghilangkan kebutuhan integrasi kustom.

  • Panduan implementasi cepat untuk membantu tim memulai dan menjalankan pendekatan yang telah terbukti untuk contoh penggunaan AI umum.

Insight otomatis

Menganalisis data yang dihasilkan AI dalam jumlah besar secara manual dapat memakan waktu dan keahlian yang signifikan, sehingga sering kali menyebabkan penundaan, kesalahan, atau masalah yang terlewatkan. Solusi observabilitas dapat mengotomatiskan proses ini, sehingga tim dapat fokus pada masalah yang lebih mendesak daripada memilah data telemetri mentah.

Otomatisasi utama dalam solusi pengamatan AI meliputi:

  • Menggunakan deteksi anomali untuk mengidentifikasi penyimpangan dalam perilaku dan kinerja AI tanpa memerlukan konfigurasi ambang manual.

  • Menghasilkan rekomendasi yang dapat ditindaklanjuti untuk pengoptimalan sistem, bukan hanya untuk mengidentifikasi masalah.

  • Menerjemahkan masalah teknis ke dalam penjelasan yang relevan dengan bisnis.

  • Memprioritaskan peringatan berdasarkan dampak untuk menghindari kelelahan peringatan dan mengurangi waktu henti.

Alur kerja AI terintegrasi

Observabilitas seharusnya tidak menjadi pemikiran tambahan. Menanamkannya di seluruh siklus pengembangan AI akan memberdayakan tim di seluruh organisasi dengan visibilitas bersama ke kinerja sistem AI, memungkinkan penyelesaian masalah yang lebih cepat dan pengambilan keputusan yang lebih tepat.

Untuk observabilitas AI, TTV bukan hanya tentang seberapa cepat alat observabilitas dapat diterapkan. Ini juga tentang seberapa cepat alat ini memberikan insight yang dapat ditindaklanjuti untuk mengoptimalkan investasi AI dan mencegah downtime.

Cara utama untuk mengintegrasikan pengamatan AI ke dalam alur kerja pengembangan AI meliputi:

  • Membangun observabilitas ke dalam alur CI/CD untuk aplikasi AI.

  • Menguji instrumentasi observabilitas selama pra-produksi.

  • Menangkap metrik tahap pengembangan untuk menginformasikan pemantauan produksi.

Dari pemantauan hingga prediksi

Ketika observabilitas AI matang, organisasi beralih dari pemantauan reaktif ke pendekatan prediktif yang mengantisipasi masalah sebelum berdampak pada pengguna atau hasil bisnis. Untuk mendukung hal ini, solusi pengamatan paling canggih sekarang menggabungkan alat AI khusus mereka sendiri untuk menganalisis pola di seluruh data telemetri dan mengidentifikasi masalah sebelum menjadi penting.

“AI yang paling berharga dalam observabilitas adalah AI prediktif dan kausal, bukan AI generatif,” jelas Flowers.

Alat observabilitas dengan kemampuan AI prediktif dan kausal dapat:

  • Memprediksi kapan penyimpangan model akan mencapai tingkat bermasalah.

  • Memperkirakan kebutuhan sumber daya berdasarkan pola penggunaan AI.

  • Mengidentifikasi pola prompt yang mungkin menghasilkan halusinasi.

  • Mendeteksi tren bias halus sebelum menjadi signifikan.

Pergeseran dari observabilitas reaktif ke prediktif ini mewakili perbatasan berikutnya untuk operasi AI, memungkinkan pengelolaan aplikasi dan infrastruktur AI yang lebih proaktif sambil memastikan output yang konsisten dan berkualitas tinggi.

Menemukan solusi pengamatan gen AI yang tepat

Berdasarkan tantangan dan solusi yang dibahas, berikut adalah lima prinsip penting yang perlu diingat ketika mencari solusi observabilitas yang tepat untuk aplikasi AI generatif:

Kenali keterbatasan yang melekat 

Meskipun observabilitas AI memberikan insight penting tentang kinerja dan anomali, itu tidak dapat sepenuhnya menjelaskan proses pengambilan keputusan internal model bahasa besar. Fokus pada metrik terukur yang menunjukkan kesehatan dan kinerja sistem.

Lihat melampaui metrik tradisional

Observabilitas AI generatif yang komprehensif memerlukan pemantauan pola penggunaan token, indikator penyimpangan model, dan hubungan prompt-respon di samping metrik kinerja infrastruktur tradisional seperti pemanfaatan CPU dan konsumsi memori. 

Fokus pada time to value

Pilih platform pengamatan yang menawarkan kemampuan penerapan cepat dengan dasbor yang telah dikonfigurasi sebelumnya dan peringatan otomatis untuk mewujudkan pengembalian investasi AI yang lebih cepat dan mencegah masalah operasional yang mahal.

Integrasikan observabilitas ke dalam pengembangan perangkat lunak

Integrasikan instrumentasi observabilitas di awal siklus pengembangan perangkat lunak untuk mengidentifikasi masalah sebelum penerapan, menetapkan garis dasar kinerja, dan membuat loop masukan yang meningkatkan kualitas sistem AI.

Rangkul OpenTelemetry

Standarisasi pada kerangka kerja pengamatan terbuka membantu strategi observabilitas yang siap untuk masa depan sambil memberikan visibilitas menyeluruh yang komprehensif di seluruh sistem AI yang kompleks dan menghindari vendor lock-in.

Selain itu, ingatlah bahwa menggunakan OpenTelemetry bukan berarti Anda harus memilih solusi observabilitas sumber terbuka. Banyak platform komersial, yang mungkin sudah digunakan oleh organisasi Anda, yang sepenuhnya mendukung OTel dan menawarkan kemampuan tambahan kelas enterprise.

Solusi observabilitas komersial dapat menyediakan observabilitas yang terkelola sepenuhnya dengan insight berbasis AI dan dukungan berkelanjutan, meminimalkan pengaturan manual dan pemeliharaan serta meningkatkan TTV.

“Jika saya duduk di sana membuat dasbor, membuat peringatan, membangun konteks dan data, saya benar-benar hanya fokus pada pembuatan perkakas. Saya tidak mengoptimalkan sistem. Saya tidak mendukung inisiatif pelanggan,” kata Flowers. “Apa yang saya lakukan secara fundamental tidak membantu saya menghasilkan uang.”

Dengan solusi observabilitas komersial, sebagian besar pengaturan itu dapat diotomatisasi atau dikonfigurasi sebelumnya. Tim dapat fokus pada mengoptimalkan kinerja dan keandalan model AI generatif mereka, memaksimalkan investasi observabilitas dan dampak dunia nyata dari aplikasi AI. 

Solusi terkait
Observabilitas Otomatis Keseluruhan Lapisan

Mengidentifikasi dan memperbaiki sumber masalah dengan cepat.Data real-time dengan fidelitas tinggi menawarkan visibilitas lengkap terhadap lingkungan aplikasi dan infrastruktur yang dinamis.

Pelajari lebih lanjut tentang Observabilitas Tumpukan Penuh
Konsultasi AIOps

Tingkatkan otomatisasi dan operasi TI dengan AI generatif, yang menyelaraskan setiap aspek infrastruktur TI Anda dengan prioritas bisnis.

Pelajari lebih lanjut tentang konsultasi AIOps
IBM SevOne Network Performance Management

IBM SevOne Network Performance Management adalah perangkat lunak pemantauan dan analitik yang memberikan visibilitas dan wawasan real-time ke dalam jaringan yang kompleks.

Pantau kinerja jaringan
Ambil langkah selanjutnya

Temukan cara AI untuk operasi TI memberikan insight yang Anda butuhkan untuk membantu mendorong kinerja bisnis yang luar biasa.

Jelajahi solusi AIOps Pesan demo langsung