Apa itu algoritma machine learning?

Apa itu algoritma machine learning?

Algoritma machine learning adalah seperangkat aturan atau proses yang digunakan oleh sistem AI untuk melakukan tugas-tugas, sering kali untuk menemukan insight dan pola data baru, atau untuk memprediksi nilai hasil dari sekumpulan variabel input yang diberikan. Algoritma memungkinkan machine learning (ML) untuk belajar.

Analis industri sepakat tentang pentingnya pembelajaran mesin dan algoritma yang mendasarinya. Dari Forrester, “Kemajuan dalam algoritma pembelajaran mesin menghadirkan presisi dan kedalaman analisis data pemasaran yang membantu pemasar memahami bagaimana detail pemasaran—seperti platform, kreatif, ajakan bertindak, atau pesan—berdampak pada kinerja pemasaran.1” Sementara Gartner menyatakan bahwa, “Pembelajaran mesin adalah inti dari banyak aplikasi AI yang sukses, memicu daya tariknya yang sangat besar di pasar.2

Seringkali, melatih algoritma ML dengan lebih banyak data akan memberikan jawaban yang lebih akurat daripada melatih dengan lebih sedikit data. Dengan menggunakan metode statistik, algoritma dilatih untuk menentukan klasifikasi atau membuat prediksi, dan untuk mengungkap insight penting dalam proyek penambangan data. Insight ini selanjutnya dapat meningkatkan pengambilan keputusan Anda untuk meningkatkan metrik utama.

Contoh penggunaan untuk algoritma machine learning mencakup kemampuan analisis data untuk mengidentifikasi tren dan memprediksi masalah sebelum terjadi.3 AI yang lebih canggih dapat memungkinkan dukungan yang lebih personal, mengurangi waktu respons, menyediakan pengenalan suara, dan meningkatkan kepuasan pelanggan. Industri yang secara khusus memperoleh manfaat dari algoritma machine learning untuk menciptakan konten baru dari sejumlah besar data meliputi manajemen rantai pasokan, transportasi dan logistik, retail dan manufaktur4, semuanya merangkul AI generatif, dengan kemampuannya untuk mengotomatiskan tugas, meningkatkan efisiensi, dan memberikan insight berharga, bahkan untuk pemula.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru 


Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Pembelajaran Mendalam

Pembelajaran mendalam adalah aplikasi spesifik dari fungsi-fungsi lanjutan yang disediakan oleh algoritma machine learning. Perbedaannya terletak pada cara masing-masing algoritma belajar. Model machine learning “mendalam” dapat menggunakan kumpulan data berlabel Anda, yang juga dikenal sebagai pembelajaran terawasi, untuk menginformasikan algoritmanya, tetapi tidak selalu membutuhkan data berlabel. Pembelajaran mendalam dapat menyerap data yang tidak terstruktur dalam bentuk mentah (seperti teks atau gambar), dan secara otomatis dapat menentukan sekumpulan fitur yang membedakan kategori data yang berbeda satu sama lain. Hal ini menghilangkan sebagian dari campur tangan manusia yang diperlukan dan memungkinkan penggunaan kumpulan data yang lebih besar.

Cara termudah untuk memikirkan kecerdasan buatan, machine learning, pembelajaran mendalam, dan jaringan saraf adalah dengan menganggapnya sebagai serangkaian sistem AI dari yang terbesar hingga yang terkecil, yang masing-masing mencakup yang berikutnya. Kecerdasan buatan (AI) adalah sistem yang menyeluruh. Machine learning adalah bagian dari AI. Pembelajaran mendalam adalah subbidang machine learning, dan neural network merupakan tulang punggung algoritma pembelajaran mendalam. Ini adalah jumlah lapisan node, atau kedalaman, neural network yang membedakan neural network tunggal dengan algoritma pembelajaran mendalam, yang harus memiliki lebih dari tiga lapisan.

Mixture of Experts | Podcast

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Cara kerja algoritma machine learning

Sebuah makalah dari UC Berkeley membagi sistem pembelajaran algoritma machine learning menjadi tiga bagian utama.5

  1. Sebuah proses keputusan: Secara umum, algoritma machine learning digunakan untuk membuat prediksi atau klasifikasi. Berdasarkan beberapa data input, yang bisa berlabel atau tidak berlabel, algoritma Anda akan menghasilkan perkiraan tentang pola dalam data.

  2. Fungsi kesalahan: Fungsi kesalahan mengevaluasi prediksi model. Jika ada contoh yang diketahui, fungsi kesalahan dapat membuat perbandingan untuk menilai keakuratan model.

3.   Proses optimasi model: Jika model dapat lebih cocok dengan titik data dalam set pelatihan, maka bobot disesuaikan untuk mengurangi perbedaan antara contoh yang diketahui dan estimasi model. Algoritma akan mengulangi proses “mengevaluasi dan mengoptimalkan” ini, memperbarui bobot secara mandiri sampai ambang batas akurasi terpenuhi.

Pembelajaran terawasi secara khusus menggunakan satu set pelatihan untuk mengajarkan model untuk menghasilkan output yang diinginkan. Kumpulan data pelatihan ini mencakup input dan output yang benar, yang memungkinkan model untuk belajar dari waktu ke waktu. Algoritma mengukur akurasinya melalui fungsi kehilangan, menyesuaikan sampai kesalahan telah diminimalkan secara memadai.

Jenis algoritma machine learning

Ada empat jenis algoritma machine learning: terawasi, tak terawasi, semi-terawasi, dan penguatan. Bergantung pada anggaran, kebutuhan akan kecepatan, dan presisi yang diperlukan, setiap jenis dan varian memiliki kelebihannya sendiri. Algoritma machine learning tingkat lanjut memerlukan beberapa teknologi, termasuk pembelajaran mendalam, neural network, dan pemrosesan bahasa alami, dan dapat menggunakan pembelajaran tak terawasi dan terawasi.6 Berikut ini adalah algoritma yang paling populer dan umum digunakan.

Algoritma pembelajaran yang diawasi

Pembelajaran terawasi dapat dibagi menjadi dua jenis masalah dalam penambangan data: klasifikasi dan regresi.

  • Klasifikasi menggunakan algoritma untuk secara akurat menetapkan data pengujian ke dalam kategori tertentu. Model mengenali entitas tertentu dalam kumpulan data dan mencoba untuk menarik beberapa kesimpulan tentang bagaimana entitas tersebut harus diberi label atau didefinisikan. Algoritma klasifikasi yang umum digunakan adalah pengklasifikasi linier, mesin vektor pendukung (SVM), pohon keputusan, K-tetangga terdekat, dan hutan acak, yang dijelaskan secara lebih terperinci di bawah ini.
  • Regresi digunakan untuk memahami hubungan antara variabel dependen dan independen. Ini biasanya digunakan untuk membuat proyeksi, seperti pendapatan penjualan untuk bisnis tertentu. Regresi linier, regresi logistik, dan regresi polinomial adalah algoritma regresi yang populer.

Berbagai algoritma dan teknik komputasi digunakan dalam proses pembelajaran mesin yang diawasi, yang sering kali dihitung melalui penggunaan program seperti Python. Algoritma pembelajaran yang diawasi meliputi:

  • AdaBoost atau peningkatan gradien: Juga disebut adaptiveboosting7, teknik ini meningkatkan algoritma regresi yang berkinerja buruk dengan menggabungkannya dengan algoritma yang lebih lemah untuk menciptakan algoritma yang lebih kuat yang menghasilkan lebih sedikit kesalahan. Boosting menggabungkan kekuatan perkiraan dari beberapa estimator dasar.
  • Neural network buatan: Juga dikenal sebagai ANN (Artifical neural networks),neural network buatan atau neural network tiruan (SNN), adalah sub-bagian dari teknik pembelajaran mesin dan merupakan inti dari algoritma pembelajaran mendalam. Algoritma pembelajar mengenali pola dalam data input menggunakan blok bangunan yang disebut neuron, yang mendekati neuron dalam otak manusia, yang dilatih dan dimodifikasi dari waktu ke waktu. (Selengkapnya di “neural network”.)
  • Algoritma decision trees: Digunakan untuk memprediksi nilai numerik (masalah regresi) dan mengklasifikasikan data ke dalam kategori decision trees menggunakan urutan percabangan dari keputusan tertaut yang dapat direpresentasikan dengan diagram pohon. Salah satu keuntungan dari pohon decision trees adalah bahwa mereka mudah untuk divalidasi dan diaudit, tidak seperti kotak hitam dari neural network.
  • Pengurangan dimensi: Ketika set data yang dipilih memiliki jumlahfitur yang tinggi7 , set data tersebut memiliki dimensi yang tinggi. Pengurangan dimensi kemudian mengurangi jumlah fitur, dan hanya menyisakan wawasan atau informasi yang paling berarti. Contohnya adalah analisis komponen utama.
  • K-tetangga terdekat: Juga dikenal sebagai KNN, algoritma non-parametrik ini mengklasifikasikan titik data berdasarkan kedekatan dan hubungannya dengan data lain yang tersedia. Ini mengasumsikan bahwa titik data yang serupa dapat ditemukan berdekatan satu sama lain. Hasilnya, algoritma ini berusaha menghitung jarak antara titik-titik data, biasanya melalui jarak Euclidean, dan kemudian menetapkan kategori berdasarkan kategori atau rata-rata yang paling sering.
  • Regresi linier: Regresi linier digunakan untuk mengidentifikasi hubungan antara variabel dependen dan satu atau lebih variabel independen dan biasanya digunakan untuk membuat prediksi tentang hasil di masa depan. Ketika hanya ada satu variabel independen dan satu variabel dependen, ini dikenal sebagai regresi linier sederhana.
  • Regresi logistik: Sementara regresi linier dimanfaatkan ketika variabel dependen bersifat berkelanjutan, regresi logistik dipilih ketika variabel dependen bersifat kategorikal, yang berarti ada hasil biner, seperti “benar” dan “salah” atau “ya” dan “tidak”. Sementara kedua model regresi berusaha untuk memahami hubungan antara input data, regresi logistik terutama digunakan untuk memecahkan masalah klasifikasi biner, seperti identifikasi spam.
  • Neural network: Terutama dimanfaatkan untuk algoritma pembelajaran mendalam, neural network memproses data pelatihan input dengan meniru interkonektivitas otak manusia melalui lapisan-lapisan node. Setiap node terdiri dari input, bobot, bias (ambang batas) dan output. Jika nilai output tersebut melebihi ambang batas yang diberikan, itu akan “menembak” atau mengaktifkan node, meneruskan data ke lapisan berikutnya dalam jaringan. Neural network belajar dari penyesuaian berdasarkan fungsi kerugian melalui proses penurunan gradien. Ketika fungsi biaya berada pada atau mendekati nol, Anda dapat yakin dengan akurasi model.
  • Naïve Bayes: Pendekatan ini mengadopsi prinsip independensi kondisional kelas dari Bayes Teorema. Ini berarti bahwa kehadiran satu fitur tidak memengaruhi kehadiran fitur lain dalam probabilitas hasil tertentu, dan setiap prediktor memiliki efek yang sama pada hasil itu. Ada tiga jenis pengklasifikasi Naïve Bayes: Multinomial Naïve Bayes, Bernoulli Naïve Bayes, dan Gaussian Naïve Bayes. Teknik ini terutama digunakan dalam klasifikasi teks, identifikasi spam dan sistem rekomendasi.
  • Random forest: Dalam random forest, algoritma machine learning memprediksi nilai atau kategori dengan menggabungkan hasil dari sejumlah decision trees. “Forest” mengacu pada decision trees yang tidak berkorelasi, yang dikumpulkan untuk mengurangi varians dan memungkinkan prediksi yang lebih akurat.
  • Support Vector Machines (SVM): Algoritma ini dapat digunakan untuk klasifikasi dan regresi data, tetapi biasanya untuk masalah klasifikasi, membangun hyperplane di mana jarak antara dua kelas titik data adalah maksimum. Hyperplane ini dikenal sebagai batas keputusan, yang memisahkan kelas-kelas titik data (seperti jeruk vs. apel) di kedua sisi bidang.

Algoritma pembelajaran tanpa pengawasan

Tidak seperti pembelajaran terawasi, pembelajaran tak terawasi menggunakan data yang tidak berlabel. Dari data tersebut, algoritma menemukan pola yang membantu memecahkan masalah pengelompokan atau asosiasi. Hal ini sangat berguna ketika para pakar subjek tidak yakin dengan properti umum dalam kumpulan data. Algoritma pengelompokan yang umum digunakan adalah hierarki, K-means, model campuran Gaussian, dan Metode Pengurangan Dimensi seperti PCA dan t-SNE.

  • Klustering: Algoritma ini dapat mengidentifikasi pola dalam data sehingga dapat dikelompokkan. Algoritma dapat membantu para ilmuwan data dengan mengidentifikasi perbedaan antara item data yang terlewatkan oleh manusia.
  • Klustering hierarkis: Ini mengelompokkan data ke dalam sebuah kluster8. Klustering hierarkis dimulai dengan memperlakukan setiap titik data sebagai kluster yang terpisah. Lalu, itu akan berulang kali menjalankan langkah-langkah ini: 1) mengidentifikasi dua kluster yang paling dekat, dan 2) menggabungkan dua kluster maksimum yang sebanding. Langkah-langkah ini terus berlanjut hingga semua kluster digabungkan.
  • Clustering K-means: Mengidentifikasi kelompok dalam data tanpa labelke dalam kluster-kluster yang berbeda dengan mencari kelompok data yang mirip satu sama lain. Nama “K-mean” berasal dari centroid yang digunakannya untuk mendefinisikan kluster. Sebuah titik ditetapkan ke dalam kluster tertentu jika titik tersebut lebih dekat ke pusat kluster tersebut dibandingkan dengan pusat kluster lainnya.

Algoritma pembelajaran semi-supervisi

Dalam hal ini, pembelajaran terjadi ketika hanya sebagian dari data input yang diberikan telah diberi label—memberikan algoritma sedikit "permulaan." Pendekatan ini dapat menggabungkan yang terbaik dari kedua dunia10—peningkatan akurasi yang terkait dengan pembelajaran mesin yang diawasi dan kemampuan untuk memanfaatkan data tanpa label yang hemat biaya, seperti dalam kasus pembelajaran mesin tanpa pengawasan.

Algoritma penguatan

Dalam hal ini, algoritma dilatih seperti halnya manusia belajar—melalui hadiah dan hukuman—yang diukur dan dilacak oleh agen pembelajaran penguatan11 yang memiliki pemahaman umum tentang probabilitas keberhasilan menggerakkan skor ke atas vs. menggerakkannya ke bawah. Melalui uji coba dan kesalahan, agen belajar untuk mengambil tindakan yang mengarah pada hasil yang paling menguntungkan dari waktu ke waktu. Pembelajaran penguatan seringdigunakan12  dalam manajemen sumber daya, robotika, dan permainan video.

Solusi terkait
IBM watsonx.ai

Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

Temukan watsonx.ai
Solusi kecerdasan buatan (AI)

Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI
Konsultasi dan layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

Jelajahi layanan AI
Ambil langkah selanjutnya

Dapatkan akses satu atap ke kemampuan yang mencakup siklus hidup pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Jelajahi watsonx.ai Pesan demo langsung