Teknologi machine learning (ML) dapat mendorong pengambilan keputusan di hampir semua industri, mulai dari layanan kesehatan, sumber daya manusia, hingga keuangan, dan dalam berbagai contoh penggunaan, seperti visi komputer, model bahasa besar (LLM), pengenalan ucapan, mobil tanpa pengemudi, dan banyak lagi.
Namun, pengaruh ML yang berkembang bukannya tanpa komplikasi. Kumpulan data validasi dan pelatihan yang mendasari teknologi ML sering kali dikumpulkan oleh manusia, dan manusia rentan terhadap bias dan rentan terhadap kesalahan. Bahkan dalam kasus-kasus di mana model ML itu sendiri tidak bias atau salah, menerapkannya dalam konteks yang salah dapat menghasilkan kesalahan dengan konsekuensi berbahaya yang tidak diinginkan.
Itulah sebabnya diversifikasi penggunaan AI dan ML perusahaan dapat terbukti sangat berharga untuk mempertahankan keunggulan kompetitif. Setiap jenis dan sub-jenis algoritma ML memiliki manfaat dan kemampuan unik yang dapat dimanfaatkan oleh tim untuk berbagai tugas. Di sini, kita akan membahas lima jenis utama dan aplikasinya.
ML adalah subset ilmu komputer, ilmu data, dan kecerdasan buatan (AI) yang memungkinkan sistem untuk belajar dan meningkatkan dari data tanpa intervensi pemrograman tambahan.
Alih-alih menggunakan instruksi eksplisit untuk optimalisasi kinerja, model ML mengandalkan algoritme dan model statistik yang menerapkan tugas berdasarkan pola data dan kesimpulan. Dengan kata lain, ML memanfaatkan data input untuk memprediksi hasil, dan secara terus menerus memperbarui hasil ketika data baru tersedia.
Di situs ritel, misalnya, algoritma machine learning memengaruhi keputusan pembelian konsumen dengan membuat rekomendasi berdasarkan riwayat pembelian. Banyak platform e-commerce peritel, termasuk platform IBM, Amazon, Google, Meta, dan Netflix, mengandalkan jaringan neural tiruan (artificial neural network/ANN) untuk memberikan rekomendasi yang dipersonalisasi. Dan pengecer sering memanfaatkan data dari chatbot dan asisten virtual, bersama dengan ML dan teknologi pemrosesan bahasa alami (NLP), untuk mengotomatiskan pengalaman berbelanja pengguna.
Algoritme machine learning terbagi dalam lima kategori besar: pembelajaran yang diawasi, pembelajaran tanpa pengawasan, pembelajaran semi-diawasi, pembelajaran yang diawasi sendiri, dan pembelajaran penguatan.
Machine learning yang diawasi adalah jenis machine learning di mana model dilatih pada kumpulan data berlabel (misalnya, variabel target atau hasil diketahui). Misalnya, jika ilmuwan data sedang membangun model untuk prakiraan tornado, variabel input mungkin mencakup tanggal, lokasi, suhu, pola aliran angin, dan lainnya, sedangkan hasilnya menjadi aktivitas tornado aktual yang tercatat pada hari-hari tersebut.
Pembelajaran yang diawasi biasanya digunakan untuk penilaian risiko, pengenalan gambar, analitik prediktif dan deteksi penipuan, dan terdiri dari beberapa jenis algoritma.
Algoritma Pembelajaran tanpa pengawasan—seperti Apriori, Model Campuran Gaussian (GMMs) dan analisis komponen utama (PCA) —menarik kesimpulan dari kumpulan data yang tidak berlabel, memfasilitasi analisis data eksplorasi dan memungkinkan pengenalan pola dan pemodelan prediktif.
Metode pembelajaran tanpa pengawasan yang paling umum adalah analisis cluster, yang menggunakan algoritma pengelompokan untuk mengkategorikan titik data sesuai dengan kesamaan nilai (seperti dalam segmentasi pelanggan atau deteksi anomali). Algoritma asosiasi memungkinkan ilmuwan data untuk mengidentifikasi asosiasi antara objek data di dalam database yang besar, memfasilitasi visualisasi data, dan pengurangan dimensi.
Model ML tanpa pengawasan sering berada di belakang jenis sistem rekomendasi “pelanggan yang membeli ini juga membeli...”.
Pembelajaran yang diawasi sendiri (SSL) memungkinkan model untuk melatih dirinya sendiri pada data yang tidak berlabel, alih-alih memerlukan kumpulan data besar yang diberi anotasi dan/atau diberi label. Algoritma SSL, disebut juga algoritma pembelajaran prediktif atau preteks, mempelajari satu bagian input dari bagian lain, secara otomatis menghasilkan label dan mengubah masalah tanpa pengawasan menjadi masalah yang diawasi. Algoritma ini terutama berguna untuk pekerjaan seperti visi komputer dan NLP, di mana volume data pelatihan berlabel yang dibutuhkan untuk melatih model bisa sangat besar (terkadang sangat mahal).
Pembelajaran penguatan, juga disebut pembelajaran penguatan dari umpan balik manusia (RLHF), adalah jenis pemrograman dinamis yang melatih algoritme menggunakan sistem penghargaan dan hukuman. Untuk menerapkan pembelajaran penguatan, agen mengambil tindakan dalam lingkungan tertentu untuk mencapai tujuan yang telah ditentukan. Agen diberi penghargaan atau hukuman atas tindakannya berdasarkan metrik yang telah ditetapkan (biasanya berupa poin), sehingga mendorong agen untuk melanjutkan praktik-praktik yang baik dan membuang praktik-praktik yang buruk. Dengan pengulangan, agen mempelajari strategi terbaik.
Algoritma pembelajaran penguatan adalah hal yang umum dalam pengembangan video game dan sering digunakan untuk mengajari robot cara meniru tugas-tugas manusia.
Jenis kelima teknik machine learning menawarkan kombinasi antara pembelajaran yang diawasi dan tidak diawasi.
Algoritma pembelajaran semi-pengawasan dilatih pada kumpulan data kecil berlabel dan kumpulan data besar tak berlabel, dengan data berlabel memandu proses pembelajaran untuk kumpulan data tak berlabel yang lebih besar. Model pembelajaran semi-diawasi dapat menggunakan pembelajaran tanpa pengawasan untuk mengidentifikasi klaster data dan kemudian menggunakan pembelajaran yang diawasi untuk memberi label pada kelompok tersebut.
Generative adversarial networks (GAN) — alatpembelajaran mendalam yang menghasilkan data tanpa label dengan melatih dua jaringan neural — adalah contoh machine learning semi-diawasi.
Terlepas dari jenisnya, model ML dapat mengumpulkan insight data dari data perusahaan, tetapi kerentanannya terhadap bias manusia/data membuat praktik AI yang bertanggung jawab menjadi keharusan organisasi.
Hampir semua orang, mulai dari pengembang, pengguna, hingga regulator, terlibat dengan aplikasi machine learning pada suatu titik, baik mereka berinteraksi langsung dengan teknologi AI atau tidak. Dan adopsi teknologi ML hanya dipercepat. Pasar machine learning global dinilai (tautan berada di luar ibm.com) sebesar USD 19 miliar pada tahun 2022 dan diperkirakan akan mencapai USD 188 miliar pada tahun 2030 (CAGR lebih dari 37 persen).
Skala adopsi ML dan dampak bisnisnya yang terus meningkat membuat pemahaman teknologi AI dan ML menjadi komitmen yang berkelanjutan dan sangat penting, yang membutuhkan pemantauan yang cermat dan penyesuaian tepat waktu seiring dengan perkembangan teknologi. Dengan IBM watsonx.ai AI studio, pengembang dapat mengelola algoritma dan proses ML dengan mudah.
IBM watsonx.ai—bagian dari platform data dan AI IBM watsonx—menggabungkan kemampuan AI generatif baru dan studio perusahaan generasi berikutnya untuk membantu para pembangun AI dalam melatih, memvalidasi, menyetel, dan menerapkan model-model AI dengan data yang lebih sedikit, dan dalam waktu yang lebih singkat. Watsonx.ai menawarkan fitur pembuatan data dan klasifikasi tingkat lanjut kepada tim yang membantu bisnis memanfaatkan insight data untuk kinerja AI yang optimal di dunia nyata.
Di era proliferasi data, AI dan machine learning merupakan bagian integral dari operasi bisnis sehari-hari seperti halnya inovasi teknologi dan persaingan bisnis. Tetapi sebagai pilar baru masyarakat modern, mereka juga mewakili peluang untuk mendiversifikasi infrastruktur TI perusahaan dan menciptakan teknologi yang berfungsi untuk kepentingan bisnis dan orang-orang yang bergantung padanya.
Jelajahi studio AI watsonx.ai