Dunia semakin "pintar" setiap hari, dan untuk memenuhi harapan konsumen, perusahaan semakin banyak menggunakan machine learning untuk membuat segala sesuatunya menjadi lebih mudah. Anda dapat melihatnya digunakan di perangkat pengguna akhir (melalui pengenalan wajah untuk membuka ponsel cerdas) atau untuk mendeteksi penipuan kartu kredit (seperti memicu peringatan untuk pembelian yang tidak biasa).
Dalam kecerdasan buatan (AI) dan machine learning, ada dua pendekatan dasar: pembelajaran diawasi dan pembelajaran tidak diawasi. Perbedaan utama adalah bahwa yang satu menggunakan data berlabel untuk membantu memprediksi hasil, sementara yang lain tidak. Namun, ada beberapa nuansa antara kedua pendekatan dan area utama di mana satu pendekatan mengungguli pendekatan lainnya. Posting ini menjelaskan perbedaannya sehingga Anda dapat memilih pendekatan terbaik untuk situasi Anda.
Buletin industri
Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.
Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.
Pembelajaran diawasi adalah pendekatan machine learning yang ditentukan oleh penggunaan kumpulan data berlabel. Kumpulan data ini dirancang untuk melatih atau "mengawasi" algoritma dalam mengklasifikasikan data atau memprediksi hasil secara akurat. Menggunakan input dan output berlabel, model dapat mengukur akurasinya dan belajar dari waktu ke waktu.
Pembelajaran diawasi dapat dibagi menjadi dua jenis masalah dalam penambangan data: klasifikasi dan regresi:
Pembelajaran tanpa pengawasan menggunakan algoritma machine learning untuk menganalisis dan klaster kumpulan data tanpa label. Algoritma ini menemukan pola tersembunyi dalam data tanpa perlu campur tangan manusia (oleh karena itu, algoritma ini bersifat "tanpa pengawasan").
Model pembelajaran tanpa pengawasan digunakan untuk tiga tugas utama—pengelompokan, asosiasi, dan pengurangan dimensi:
Perbedaan utama antara kedua pendekatan ini adalah penggunaan kumpulan data berlabel. Sederhananya, pembelajaran diawasi menggunakan data input dan output berlabel, dan tidak demikian halnya dengan algoritma pembelajaran.
Dalam pembelajaran diawasi, algoritma "belajar" dari kumpulan data pelatihan dengan membuat prediksi secara berulang pada data dan menyesuaikan jawaban yang benar. Meskipun model pembelajaran diawasi cenderung lebih akurat daripada model pembelajaran tidak diawasi, model ini membutuhkan campur tangan manusia di awal untuk memberi label pada data dengan tepat. Sebagai contoh, model pembelajaran diawasi dapat memprediksi berapa lama perjalanan Anda berdasarkan waktu, kondisi cuaca, dan sebagainya. Tapi pertama-tama, Anda harus melatihnya untuk mengetahui bahwa cuaca hujan memperpanjang waktu mengemudi.
Model pembelajaran tanpa pengawasan, sebaliknya, bekerja sendiri untuk menemukan struktur yang melekat pada data yang tidak berlabel. Perhatikan bahwa mereka masih memerlukan beberapa intervensi manusia untuk memvalidasi variabel output. Sebagai contoh, model pembelajaran tanpa pengawasan dapat mengidentifikasi bahwa pembeli online sering kali membeli sekelompok produk pada waktu yang sama. Namun, seorang analis data perlu memvalidasi bahwa masuk akal jika mesin rekomendasi mengelompokkan pakaian bayi dengan pesanan popok, saus apel, dan gelas isap bayi.
Memilih pendekatan yang tepat untuk situasi Anda bergantung pada bagaimana ilmuwan data Anda menilai struktur dan volume data Anda, serta contoh penggunaannya. Untuk membuat keputusan Anda, pastikan untuk melakukan hal berikut:
Mengklasifikasikan big data dapat menjadi tantangan nyata dalam pembelajaran yang diawasi, tetapi hasilnya sangat akurat dan dapat dipercaya. Sebaliknya, pembelajaran tanpa pengawasan dapat menangani volume data yang besar secara real-time. Namun, metode ini kurang transparan tentang bagaimana data dikelompokkan dan risiko hasil tidak akurat lebih tinggi. Di sinilah pembelajaran agak diawasi berperan.
Tidak dapat memutuskan apakah akan menggunakan pembelajaran yang diawasi atau tidak diawasi? Pembelajaran agak diawasi adalah media yang menyenangkan, di mana Anda menggunakan kumpulan data pelatihan dengan data berlabel dan tidak berlabel. Ini sangat berguna ketika sulit untuk mengekstraksi fitur yang relevan dari data dan ketika Anda memiliki volume data yang tinggi.
Pembelajaran agak diawasi sangat ideal untuk gambar medis, di mana sejumlah kecil data pelatihan dapat menghasilkan peningkatan akurasi yang signifikan. Sebagai contoh, seorang ahli radiologi dapat memberi label pada sebagian kecil CT scan untuk tumor atau penyakit sehingga mesin dapat memprediksi secara lebih akurat pasien mana yang mungkin memerlukan perhatian medis lebih lanjut.
Model machine learning adalah cara ampuh untuk mendapatkan insight yang meningkatkan dunia kita. Untuk mempelajari lebih lanjut tentang algoritma spesifik yang digunakan dengan pembelajaran diawasi dan tidak diawasi, kami mendorong Anda untuk mempelajari artikel di Learn Hub tentang semua teknik ini. Kami juga merekomendasikan untuk membaca postingan blog yang membahas lebih jauh tentang pembelajaran mendalam dan neural networks.
Â
Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.
Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.
Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.