Pembelajaran yang diawasi versus tanpa pengawasan: Apa bedanya?

Fraktal tampak seperti sinapsis dengan banyak ujung saraf

Penulis

Julianna Delua

SME, IBM Analytics, Data Science/Machine Learning

Dunia semakin "pintar" setiap hari, dan untuk memenuhi harapan konsumen, perusahaan semakin banyak menggunakan machine learning untuk membuat segala sesuatunya menjadi lebih mudah. Anda dapat melihatnya digunakan di perangkat pengguna akhir (melalui pengenalan wajah untuk membuka ponsel cerdas) atau untuk mendeteksi penipuan kartu kredit (seperti memicu peringatan untuk pembelian yang tidak biasa).

Dalam kecerdasan buatan (AI) dan machine learning, ada dua pendekatan dasar: pembelajaran diawasi dan pembelajaran tidak diawasi. Perbedaan utama adalah bahwa yang satu menggunakan data berlabel untuk membantu memprediksi hasil, sementara yang lain tidak. Namun, ada beberapa nuansa antara kedua pendekatan dan area utama di mana satu pendekatan mengungguli pendekatan lainnya. Posting ini menjelaskan perbedaannya sehingga Anda dapat memilih pendekatan terbaik untuk situasi Anda.

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Apa yang dimaksud dengan pembelajaran terawasi?

Pembelajaran diawasi adalah pendekatan machine learning yang ditentukan oleh penggunaan kumpulan data berlabel. Kumpulan data ini dirancang untuk melatih atau "mengawasi" algoritma dalam mengklasifikasikan data atau memprediksi hasil secara akurat. Menggunakan input dan output berlabel, model dapat mengukur akurasinya dan belajar dari waktu ke waktu.

Pembelajaran diawasi dapat dibagi menjadi dua jenis masalah dalam penambangan data: klasifikasi dan regresi:

  • Klasifikasi masalah menggunakan algoritma untuk menetapkan data uji secara akurat ke dalam kategori, seperti memisahkan apel dari jeruk. Atau, di dunia nyata, algoritma pembelajaran diawasi dapat digunakan untuk mengklasifikasikan spam dalam folder terpisah dari kotak masuk Anda. Pengklasifikasi linier, mesin vektor pendukung, struktur keputusan, dan random forest, semuanya adalah jenis algoritma klasifikasi yang umum.

  • Regresi adalah jenis lain dari metode pembelajaran diawasi yang menggunakan algoritma untuk memahami hubungan antara variabel dependen dan independen. Model regresi sangat membantu untuk memprediksi nilai numerik berdasarkan titik data yang berbeda, seperti proyeksi pendapatan penjualan untuk bisnis tertentu. Beberapa algoritma regresi yang populer adalah regresi linier, regresi logistik, dan regresi polinomial.
Akademi AI

Manfaatkan AI untuk layanan pelanggan

Lihat bagaimana AI generatif dapat menyenangkan pelanggan dengan pengalaman yang lebih mulus dan meningkatkan produktivitas organisasi di tiga area utama ini: layanan mandiri, agen manusia, dan operasi pusat kontak.

Apa yang dimaksud dengan pembelajaran tanpa pengawasan?

Pembelajaran tanpa pengawasan menggunakan algoritma machine learning untuk menganalisis dan klaster kumpulan data tanpa label. Algoritma ini menemukan pola tersembunyi dalam data tanpa perlu campur tangan manusia (oleh karena itu, algoritma ini bersifat "tanpa pengawasan").

Model pembelajaran tanpa pengawasan digunakan untuk tiga tugas utama—pengelompokan, asosiasi, dan pengurangan dimensi:

  • Pengelompokan adalah teknik penambangan data untuk mengelompokkan data yang tidak berlabel berdasarkan kesamaan atau perbedaannya. Misalnya, algoritma klaster K-mean menetapkan titik data serupa ke dalam kelompok, di mana nilai K mewakili ukuran pengelompokan dan granularitas. Teknik ini berguna untuk segmentasi pasar, kompresi gambar, dan sebagainya.

  • Asosiasi adalah jenis lain metode pembelajaran tanpa pengawasan yang menggunakan aturan yang berbeda untuk menemukan hubungan antara variabel dalam kumpulan data yang diberikan. Metode ini sering digunakan untuk analisis keranjang pasar dan mesin rekomendasi, sejalan dengan rekomendasi "Pelanggan yang Membeli Barang Ini Juga Membeli".

  • Reduksi dimensi adalah teknik pembelajaran yang digunakan ketika jumlah fitur (atau dimensi) dalam kumpulan data yang diberikan terlalu tinggi. Ini mengurangi jumlah input data ke ukuran yang dapat dikelola sekaligus menjaga integritas data. Teknik ini sering digunakan dalam tahap prapemrosesan data, misalnya, ketika autoencoder menghilangkan ketidakakuratan dari data visual untuk meningkatkan kualitas gambar.

Perbedaan utama: data berlabel

Perbedaan utama antara kedua pendekatan ini adalah penggunaan kumpulan data berlabel. Sederhananya, pembelajaran diawasi menggunakan data input dan output berlabel, dan tidak demikian halnya dengan algoritma pembelajaran.

Dalam pembelajaran diawasi, algoritma "belajar" dari kumpulan data pelatihan dengan membuat prediksi secara berulang pada data dan menyesuaikan jawaban yang benar. Meskipun model pembelajaran diawasi cenderung lebih akurat daripada model pembelajaran tidak diawasi, model ini membutuhkan campur tangan manusia di awal untuk memberi label pada data dengan tepat. Sebagai contoh, model pembelajaran diawasi dapat memprediksi berapa lama perjalanan Anda berdasarkan waktu, kondisi cuaca, dan sebagainya. Tapi pertama-tama, Anda harus melatihnya untuk mengetahui bahwa cuaca hujan memperpanjang waktu mengemudi.

Model pembelajaran tanpa pengawasan, sebaliknya, bekerja sendiri untuk menemukan struktur yang melekat pada data yang tidak berlabel. Perhatikan bahwa mereka masih memerlukan beberapa intervensi manusia untuk memvalidasi variabel output. Sebagai contoh, model pembelajaran tanpa pengawasan dapat mengidentifikasi bahwa pembeli online sering kali membeli sekelompok produk pada waktu yang sama. Namun, seorang analis data perlu memvalidasi bahwa masuk akal jika mesin rekomendasi mengelompokkan pakaian bayi dengan pesanan popok, saus apel, dan gelas isap bayi.

Perbedaan utama lainnya

  • Tujuan: Dalam pembelajaran diawasi, tujuannya adalah untuk memprediksi hasil untuk data baru. Anda tahu sebelumnya jenis hasil yang diharapkan. Dengan algoritma pembelajaran tanpa pengawasan, tujuannya adalah untuk mendapatkan insight dari data baru dalam jumlah besar. Machine learning itu sendiri menentukan apa yang berbeda atau menarik dari kumpulan data.

  • Aplikasi: Model pembelajaran diawasi sangat ideal untuk, antara lain, mendeteksi spam, analisis sentimen, forecasting, dan memprediksi harga. Sebaliknya, pembelajaran tanpa pengawasan sangat cocok untuk mendeteksi anomali, mesin rekomendasi, persona pelanggan, dan pencitraan medis.

  • Kompleksitas: Pembelajaran yang diawasi adalah metode sederhana untuk machine learning, biasanya dihitung dengan menggunakan program seperti R atau Python. Dalam pembelajaran tanpa pengawasan, Anda memerlukan alat canggih untuk bekerja dengan sejumlah besar data yang tidak diklasifikasikan. Model pembelajaran tanpa pengawasan bersifat kompleks secara komputasi karena membutuhkan set pelatihan yang besar untuk menghasilkan hasil yang diinginkan.

  • Kekurangan: Model pembelajaran diawasi dapat memakan waktu untuk dilatih dan label untuk input dan output memerlukan keahlian. Sementara itu, metode pembelajaran tanpa pengawasan dapat memiliki hasil yang sangat tidak akurat kecuali Anda memiliki intervensi manusia untuk memvalidasi variabel output.

Pembelajaran diawasi versus tanpa pengawasan: Mana yang terbaik untuk Anda?

Memilih pendekatan yang tepat untuk situasi Anda bergantung pada bagaimana ilmuwan data Anda menilai struktur dan volume data Anda, serta contoh penggunaannya. Untuk membuat keputusan Anda, pastikan untuk melakukan hal berikut:

  • Evaluasi data input Anda: Apakah data berlabel atau tidak? Apakah Anda memiliki pakar yang dapat mendukung pelabelan tambahan?

  • Tentukan tujuan Anda: Apakah Anda memiliki masalah yang berulang dan ditetapkan dengan baik untuk dipecahkan? Atau apakah algoritma perlu memprediksi masalah baru?

  • Tinjau opsi Anda untuk algoritma: Apakah ada algoritma dengan dimensi yang sama yang Anda butuhkan (jumlah fitur, atribut, atau karakteristik)? Bisakah mereka mendukung volume dan struktur data Anda?

Mengklasifikasikan big data dapat menjadi tantangan nyata dalam pembelajaran yang diawasi, tetapi hasilnya sangat akurat dan dapat dipercaya. Sebaliknya, pembelajaran tanpa pengawasan dapat menangani volume data yang besar secara real-time. Namun, metode ini kurang transparan tentang bagaimana data dikelompokkan dan risiko hasil tidak akurat lebih tinggi. Di sinilah pembelajaran agak diawasi berperan.

Pembelajaran agak diawasi: Yang terbaik dari kedua sisi

Tidak dapat memutuskan apakah akan menggunakan pembelajaran yang diawasi atau tidak diawasi? Pembelajaran agak diawasi adalah media yang menyenangkan, di mana Anda menggunakan kumpulan data pelatihan dengan data berlabel dan tidak berlabel. Ini sangat berguna ketika sulit untuk mengekstraksi fitur yang relevan dari data dan ketika Anda memiliki volume data yang tinggi.

Pembelajaran agak diawasi sangat ideal untuk gambar medis, di mana sejumlah kecil data pelatihan dapat menghasilkan peningkatan akurasi yang signifikan. Sebagai contoh, seorang ahli radiologi dapat memberi label pada sebagian kecil CT scan untuk tumor atau penyakit sehingga mesin dapat memprediksi secara lebih akurat pasien mana yang mungkin memerlukan perhatian medis lebih lanjut.

Pelajari lebih lanjut tentang pembelajaran diawasi dan tanpa pengawasan

Model machine learning adalah cara ampuh untuk mendapatkan insight yang meningkatkan dunia kita. Untuk mempelajari lebih lanjut tentang algoritma spesifik yang digunakan dengan pembelajaran diawasi dan tidak diawasi, kami mendorong Anda untuk mempelajari artikel di Learn Hub tentang semua teknik ini. Kami juga merekomendasikan untuk membaca postingan blog yang membahas lebih jauh tentang pembelajaran mendalam dan neural networks.

 

Solusi terkait
IBM watsonx.ai

Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

Temukan watsonx.ai
Solusi kecerdasan buatan (AI)

Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI
Konsultasi dan layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

Jelajahi layanan AI
Ambil langkah selanjutnya

Dapatkan akses ke berbagai kemampuan dalam satu alat untuk seluruh siklus pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Jelajahi watsonx.ai Pesan demo langsung