IBM Live Webinar — Daftar sekarang Bagaimana Masa Depan APM dan Observabilitas?

Apa itu AIOps?

Pengusaha mengadakan pertemuan di agensi kreatif besar

Apa itu AIOps?

Kecerdasan buatan untuk operasi TI, atau AIOps, adalah aplikasi dari kemampuan kecerdasan buatan (AI) — seperti model pemrosesan bahasa alami dan machine learning — untuk mengotomatiskan, merampingkan, dan mengoptimalkan manajemen layanan TI dan alur kerja operasional.

AIOps memanfaatkan kemampuan big data, analitik, dan ML untuk:

  • Menyerap dan mengumpulkan volume data yang sangat besar (dan terus meningkat) yang dihasilkan oleh komponen, tuntutan aplikasi, dan alat pemantauan kinerja dan sistem tiket layanan dalam tumpukan teknologi perusahaan.
  • Secara cerdas menggeser sinyal dari "ketidakakuratan" untuk mengidentifikasi peristiwa dan pola signifikan yang terkait dengan masalah kinerja dan ketersediaan aplikasi.
  • Diagnosis akar masalah dan melaporkannya ke TI dan DevOps untuk respons insiden dan remediasi yang cepat atau, terkadang, secara otomatis menyelesaikan masalah ini tanpa campur tangan manusia.

Dengan mengintegrasikan beberapa alat bantu operasi TI yang terpisah dan manual ke dalam satu platform operasi TI (ITOps) tunggal, cerdas, dan otomatis, AIOps memungkinkan tim operasi TI merespons dengan lebih cepat, bahkan sering kali secara proaktif, terhadap perlambatan dan pemadaman, dengan visibilitas dan konteks menyeluruh.

Ini membantu bisnis menjembatani kesenjangan antara lingkungan TI yang beragam, dinamis, dan sulit dipantau dan tim TI yang terisolasi di satu sisi dan harapan pengguna akan kinerja aplikasi dan ketersediaan di sisi lain. Dengan proliferasi inisiatif transformasi digital di seluruh sektor bisnis, banyak pakar melihat AIOps sebagai masa depan manajemen operasi.

Komponen AIOps

AIOps dapat menggabungkan berbagai strategi dan fitur AI, termasuk output data dan agregasi, algoritma, orkestrasi, dan visualisasi.

Algoritma mengodekan keahlian TI, logika bisnis, dan tujuan, sehingga memungkinkan platform AIOps memprioritaskan peristiwa keamanan dan membuat keputusan kinerja. Algoritma membentuk dasar untuk machine learning (ML) dan memungkinkan platform untuk menetapkan garis dasar dan beradaptasi saat data lingkungan berubah.

Machine learning menggunakan algoritma dan teknik—seperti diawasi, tanpa pengawasan, penguatan, dan pembelajaran mendalam—untuk membantu sistem belajar dari kumpulan data yang besar dan beradaptasi dengan informasi baru. Dalam AIOps, ML membantu dalam deteksi anomali, analisis akar masalah (RCA), korelasi kejadian, dan analisis prediktif.

Program AIOps mengumpulkan data dari berbagai komponen jaringan dan sumber data. Analitik menginterpretasikan data mentah untuk menciptakan data dan metadata baru yang membantu sistem dan tim mengidentifikasi tren, mengisolasi masalah, memprediksi permintaan kapasitas, dan mengelola peristiwa.

Fitur otomatisasi dalam alat AIOps memungkinkan sistem AIOps untuk bertindak berdasarkan insight real-time. Sebagai contoh, analitik prediktif dapat mengantisipasi peningkatan lalu lintas data dan memicu alur kerja otomatisasi untuk mengalokasikan penyimpanan tambahan sesuai kebutuhan (sesuai dengan aturan algoritmik).

Alat visualisasi data di AIOps menyajikan data melalui dasbor, laporan, dan grafik, sehingga tim TI dapat memantau perubahan dan membuat keputusan di luar kemampuan perangkat lunak AIOps.

Berita teknologi terbaru, didukung oleh insight dari pakar

Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM® kami untuk informasi lebih lanjut.

Bagaimana cara kerja AIOps?

AIOps menggunakan platform big data untuk mengumpulkan data, tim, dan alat ITOps yang terbagi-bagi di satu tempat. Data ini dapat mencakup:

  • Kinerja historis dan data peristiwa
  • Peristiwa operasi real-time
  • Log dan metrik sistem
  • Data jaringan, termasuk data paket
  • Data dan tiket terkait insiden
  • Data permintaan aplikasi
  • Data infrastruktur

Platform AIOps kemudian menerapkan analitik terfokus dan alat ML untuk:

  • Memisahkan peringatan peristiwa penting dari “ketidakakuratan.” AIOps menyisir data ITOps dan memisahkan sinyal, membedakan peristiwa abnormal dari ketidakakuratan (lainnya), dan mengidentifikasi pola data.
  • Mengidentifikasi akar masalah dan mengusulkan solusi. AIOps dapat mengorelasikan peristiwa abnormal dengan data peristiwa lain di seluruh lingkungan untuk mengetahui penyebab pemadaman atau masalah kinerja dan menyarankan solusi.
  • Mengotomatiskan respons, termasuk resolusi proaktif dan real-time. Minimal, alat AIOps dapat secara otomatis merutekan peringatan dan solusi yang direkomendasikan ke tim TI yang sesuai dan bahkan membuat tim respons berdasarkan sifat masalah dan solusinya. Dalam banyak kasus, mereka juga dapat memproses Hasil ML dan memicu respons sistem otomatis untuk alamat masalah saat muncul (dan seringkali, sebelum pengguna tahu itu terjadi).
  • Belajarlah terus menerus, untuk meningkatkan penanganan masalah di masa depan. Model AI dapat membantu sistem memahami dan beradaptasi dengan perubahan lingkungan (ketika tim DevOps menyediakan infrastruktur baru atau mengonfigurasi ulang infrastruktur yang ada, misalnya).
Mixture of Experts | 12 Desember, episode 85

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Menerapkan AIOps

Perjalanan menuju AIOps berbeda di setiap organisasi. Setelah para pemimpin bisnis menyaring strategi AIOps, mereka dapat mulai memasukkan alat yang membantu tim TI mengamati, memprediksi, dan merespons masalah TI dengan cepat. 

Saat memilih alat untuk meningkatkan AIOps, banyak tim mempertimbangkan fitur berikut:

  • Observabilitas: Observabilitas adalah sejauh mana Anda dapat memahami keadaan atau kondisi internal sistem yang kompleks hanya berdasarkan pengetahuan tentang output eksternalnya. Semakin dapat diamati suatu sistem, semakin cepat dan akurat tim dapat menjelajahi jalur dari masalah kinerja yang teridentifikasi ke akar masalah, semuanya tanpa pengujian atau pengodean tambahan.

    Alat bantu observabilitas terkemuka memberikan visibilitas mendalam tentang layanan dan aplikasi bisnis terdistribusi modern untuk identifikasi dan penyelesaian masalah yang lebih cepat dan otomatis.

    Dalam TI dan komputasi cloud, observabilitas menggunakan alat dan praktik perangkat lunak canggih untuk mengumpulkan, mengorelasikan, dan menganalisis aliran data kinerja yang stabil dari aplikasi terdistribusi — dan perangkat keras dan jaringan yang dijalankannya. Fasilitas pengamatan lebih efektif dalam pemantauan aplikasi dan jaringan, pemecahan masalah dan proses debug sehingga sistem terus memenuhi harapan pengalaman pengguna, perjanjian tingkat layanan(SLA), dan persyaratan bisnis lainnya.

  • Analitik prediktif: Analitik prediktif adalah cabang dari analitik lanjutan yang membuat prediksi tentang hasil masa depan menggunakan data historis, pemodelan statistik, teknik penambangan data, dan machine learning. Dalam AIOps, tim menggunakan analitik prediktif untuk menemukan pola data dan mengidentifikasi risiko serta peluang.

    Perusahaan modern dibanjiri dengan data dari repositori data yang berbeda di seluruh organisasi. Analitik prediktif menggunakan alat seperti model regresi logistik dan regresi linier, , neural networks, dan struktur keputusan untuk mendapatkan insight yang dapat ditindaklanjuti dari data perusahaan dalam jumlah besar dan membuat prediksi tentang peristiwa sistem pada masa depan.

  • Respons proaktif: Beberapa solusi AIOps secara proaktif merespons peristiwa yang tidak diinginkan (seperti perlambatan dan pemadaman), menyatukan kinerja aplikasi dan manajemen sumber daya secara real-time.

    Dengan memasukkan metrik kinerja aplikasi ke dalam algoritma prediktif, mereka dapat mengidentifikasi pola dan tren yang sesuai dengan berbagai masalah TI. Dan mengingat kemampuan mereka untuk memperkirakan masalah TI sebelum terjadi, alat AIOps dapat mengotomatiskan resolusi untuk mengatasi masalah sistem dengan segera.

    Teknologi otomatisasi respons insiden merupakan bagian integral dari manajemen sistem TI yang efektif. Mereka dapat membantu bisnis meningkatkan pengalaman klien dan pelanggan dan secara signifikan meningkatkan metrik kinerja utama, seperti rata-rata waktu untuk mendeteksi (MTTD). Selain itu, sistem AIOps menyediakan jaring pengaman bagi tim operasi TI, mengatasi masalah yang mungkin terlewat jika hanya tersedia pengawasan manusia.

Membandingkan alat AIOps yang tidak bergantung pada domain dan terpusat pada domain

Platform AIOps dapat menyediakan berbagai tingkat otomatisasi kepada organisasi, tergantung pada kebutuhan TI dan strategi AIOps mereka.

Dengan pendekatan tidak bergantung pada domain, perangkat lunak AIOps mengumpulkan data dari berbagai sumber untuk memecahkan masalah di berbagai domain operasional (jaringan, penyimpanan, dan keamanan, misalnya). Semua alat ini menawarkan gambaran komprehensif dan holistik tentang kinerja keseluruhan, membantu organisasi mengatasi masalah yang menjangkau berbagai bidang.

Namun, mereka mungkin tidak memberikan insight yang dibutuhkan tim TI untuk mengatasi masalah tertentu atau memenuhi kebutuhan industri unik. Sifat luas dari alat yang tidak bergantung pada domain berarti alat bantu ini unggul dalam memberikan gambaran umum, tetapi mungkin gagal dalam memberikan solusi manajemen insiden yang ditargetkan untuk tantangan dengan nuansa khusus.

Alat AIOps yang berpusat pada domain berfokus pada domain tertentu, baik lingkungan TI maupun industri tertentu. Meskipun tidak mencakup seluruh lingkungan TI, alat ini sangat khusus di mana model AI dilatih pada kumpulan data khusus untuk domain mereka. Spesialisasi ini memungkinkan mereka untuk memberikan insight dan solusi yang tepat.

Misalnya, dalam konteks jaringan, alat yang berpusat pada domain dapat secara akurat mengidentifikasi penyebab kemacetan dengan memahami protokol dan pola jaringan standar. Dan berkat pelatihan dan fokus khusus, alat dapat menentukan apakah perlambatan diakibatkan serangan denial-of-service terdistribusi (DDoS) atau kesalahan konfigurasi sistem sederhana.

Terlepas dari jenis alat yang dipilih organisasi, penting bagi tim untuk:

  • Melatih model AI dengan kumpulan data yang komprehensif dan representatif untuk keandalan dan akurasi yang optimal.
  • Menggunakan model AI yang transparan dan adil sehingga pemangku kepentingan dapat memahami pengambilan keputusan berbasis AI.
  • Melatih tim TI untuk menggunakan alat dan insight secara efektif untuk transisi AIOps yang lebih lancar.
  • Menugaskan manusia untuk mengawasi dan memvalidasi kesimpulan model AI agar tim dan sistem tetap bertanggung jawab.

AIOps vs DevOps

Baik AIOps maupun DevOps adalah metodologi yang dirancang untuk meningkatkan operasi TI, namun keduanya berfokus pada aspek yang berbeda dari siklus hidup perangkat lunak.

DevOps bertujuan untuk mengintegrasikan tim pengembangan dan operasi untuk mendorong kolaborasi dan efisiensi di seluruh proses pengembangan perangkat lunak. Ini merampingkan dan mengotomatiskan proses pengodean, pengujian, dan penerapan serta mempercepat saluran integrasi berkelanjutan dan pengiriman berkelanjutan (CI/CD) yang memungkinkan rilis perangkat lunak yang lebih cepat dan lebih andal.

DevOps juga menggunakan alat seperti infrastruktur sebagai kode dan platform kolaborasi untuk memecah silo antara tim dan memastikan bahwa pembaruan perangkat lunak dapat dikirimkan dengan cepat, tanpa mengorbankan kualitas.

Sementara DevOps berfokus pada percepatan dan penyempurnaan pengembangan dan penerapan perangkat lunak, AIOps menggunakan AI untuk mengoptimalkan kinerja lingkungan TI perusahaan, memastikan sistem berjalan lancar dan efisien. Platform AIOps menggunakan analitik ML dan big data untuk menganalisis data operasional dalam jumlah besar untuk membantu tim TI mendeteksi dan mengatasi masalah secara proaktif.

Ketika digunakan bersama-sama, layanan AIOps dan DevOps dapat membantu bisnis menciptakan pendekatan yang saling melengkapi dan komprehensif untuk mengelola seluruh siklus hidup perangkat lunak.

Kasus penggunaan AIOps

Layanan AIOps dapat membantu bisnis mengatasi beberapa contoh penggunaan, termasuk:

Analisis akar masalah

Analisis akar masalah (RCA) menentukan akar masalah dari masalah untuk memulihkannya dengan solusi yang tepat. RCA membantu tim menghindari pekerjaan kontraproduktif untuk mengobati gejala masalah, bukan masalah inti.

Misalnya, platform AIOps dapat melacak sumber pemadaman jaringan untuk segera menyelesaikannya dan mengatur perlindungan untuk mencegah masalah yang sama terjadi di masa mendatang.

Deteksi anomali

Alat AIOps dapat menyisir sejumlah besar data historis dan menemukan titik data tidak biasa dalam kumpulan data. Outlier ini membantu tim mengidentifikasi dan memprediksi peristiwa bermasalah (pelanggaran data, misalnya) dan menghindari konsekuensi yang berpotensi mahal dari peristiwa tersebut (PR negatif, denda peraturan dan penurunan kepercayaan konsumen, di antara masalah lainnya).

Pemantauan kinerja

Aplikasi modern sering dipisahkan oleh beberapa lapisan abstraksi, sehingga sulit untuk memahami server on premises yang mendasarinya, sumber daya penyimpanan, dan aplikasi mana yang didukung sumber daya jaringan. AIOps membantu menjembatani kesenjangan ini.

Alat ini bertindak sebagai alat pemantauan untuk infrastruktur cloud, virtualisasi, dan sistem penyimpanan, yang melaporkan metrik seperti penggunaan, ketersediaan, dan waktu respons. Selain itu, AIOps menggunakan kemampuan korelasi peristiwa untuk mengonsolidasikan dan mengumpulkan informasi sehingga pengguna dapat menggunakan dan memahami informasi dengan lebih mudah.

Adopsi dan migrasi cloud

Bagi sebagian besar organisasi, adopsi cloud dilakukan secara bertahap, tidak secara besar-besaran. Hal ini sering menghasilkan lingkungan multicloud hybrid (termasuk banyak bagian saling berhubungan yang bergantung pada teknologi seperti API dan layanan mikro) dengan beberapa dependensi yang dapat berubah terlalu cepat dan sering untuk didokumentasikan. Dengan memberikan visibilitas yang jelas tentang saling ketergantungan ini, AIOps dapat mengurangi secara drastis risiko operasional yang terkait dengan migrasi cloud dan pendekatan hybrid cloud.

Adopsi DevOps

DevOps mempercepat pengembangan dengan memberi tim pengembangan lebih banyak kekuatan untuk menyediakan dan mengonfigurasi ulang infrastruktur TI, tetapi tim masih harus mengelola arsitektur. AIOps menyediakan visibilitas dan otomatisasi yang dibutuhkan tim TI untuk mendukung DevOps tanpa pengawasan manusia yang berlebihan.

Manfaat AIOps

Manfaat utama AIOps adalah memungkinkan tim ITOps untuk mengidentifikasi, mengatasi, dan menyelesaikan perlambatan dan pemadaman lebih cepat daripada yang bisa mereka lakukan dengan menyaring peringatan secara manual dari berbagai komponen dan alat. Hal ini memungkinkan bisnis untuk mencapai:

Waktu rata-rata untuk memperbaiki (MTTR) yang lebih cepat

Dengan memotong ketidakakuratan operasi dan menghubungkan data operasi dari berbagai lingkungan TI, AIOps dapat mengidentifikasi akar masalah dan mengusulkan solusi lebih cepat dan lebih akurat daripada yang mungkin dilakukan secara manusiawi. Proses identifikasi masalah dan penyelesaian insiden yang dipercepat memungkinkan organisasi untuk menetapkan dan mencapai tujuan MTTR yang sebelumnya tidak terpikirkan.

Memangkas biaya operasional

Mengidentifikasi otomatis masalah operasional dan skrip respons yang diprogram ulang mengurangi biaya operasional dan mendorong alokasi sumber daya yang lebih tepat. Ini juga mengurangi beban kerja staf TI dan membebaskan sumber daya pekerja untuk pekerjaan yang lebih inovatif dan kompleks, sehingga meningkatkan pengalaman karyawan.

Observabilitas dan kolaborasi yang lebih baik

Integrasi dalam alat pemantauan AIOps memfasilitasi kolaborasi yang lebih efektif di seluruh tim DevOps, ITOps, tata kelola, dan keamanan. Dan visibilitas, komunikasi, dan transparansi yang lebih baik memungkinkan tim ini untuk meningkatkan pengambilan keputusan dan menanggapi masalah dengan lebih cepat.

Manajemen ITOPs prediktif

Dengan kemampuan analitik prediktif bawaan, platform AIOps terus belajar mengidentifikasi dan memprioritaskan peringatan yang paling mendesak. Ini membantu tim TI mengatasi masalah potensial sebelum menyebabkan waktu henti, gangguan, dan pemadaman layanan yang tidak direncanakan.

Solusi terkait
IBM Turbonomic

Secara otomatis menskalakan infrastruktur TI Anda yang ada untuk kinerja yang lebih tinggi dengan biaya lebih rendah.

Jelajahi IBM Turbonomic
Solusi AIOps

Temukan bagaimana AI untuk operasi TI memberikan insight yang Anda butuhkan untuk membantu mendorong kinerja bisnis yang luar biasa.

Jelajahi solusi AIOps
Layanan konsultasi otomatisasi

Bergerak melampaui otomatisasi tugas sederhana untuk menangani proses dengan profil tinggi, yang berhadapan langsung dengan pelanggan, dan menghasilkan pendapatan dengan adopsi dan skala bawaan.

Jelajahi layanan konsultasi otomatisasi
Ambil langkah selanjutnya

Temukan cara AI mengoperasikan operasi TI memberikan insight untuk mendorong kinerja bisnis yang luar biasa.

Jelajahi Turbonomic Jelajahi solusi AIOps