Apa yang dimaksud dengan pembelajaran terawasi?

Penyusun

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Apa yang dimaksud dengan pembelajaran terawasi?

Pembelajaran yang diawasi adalah machine learning yang menggunakan kumpulan data berlabel untuk melatih model AI untuk mengidentifikasi pola dan hubungan yang mendasarinya. Tujuan utama metode ini adalah menghasilkan model yang dapat secara akurat memprediksi hasil pada data baru di dunia nyata.

Kumpulan data berlabel terdiri dari contoh titik data beserta output atau jawaban yang benar. Saat data input dimasukkan ke algoritma machine learning, algoritma tersebut akan menyesuaikan bobotnya hingga model sesuai. Data pelatihan berlabel memberikan "kebenaran dasar", yang secara eksplisit mengajarkan model untuk mengidentifikasi hubungan antara fitur dan label data.

Machine learning diawasi membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar, seperti mengklasifikasikan spam atau memprediksi harga saham. Ini dapat digunakan untuk membangun model machine learning yang sangat akurat.

Apa itu kebenaran dasar data?

Data kebenaran dasar diverifikasi terhadap hasil dunia nyata, sering kali melalui anotasi atau pengukuran manusia, dan digunakan untuk melatih, memvalidasi, dan menguji model. Sesuai dengan namanya, data kebenaran dasar telah dikonfirmasi kebenarannya—data ini mencerminkan nilai dan hasil di dunia nyata. Kebenaran dasar mencerminkan output yang ideal untuk setiap data input yang diberikan.

Pembelajaran diawasi bergantung pada data kebenaran dasar untuk mengajarkan model hubungan antara input dan output. Kumpulan data berlabel yang digunakan dalam pembelajaran diawasi adalah data kebenaran dasar. Model terlatih menerapkan pemahaman mereka tentang data tersebut untuk membuat prediksi berdasarkan data baru yang tidak terlihat.

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Cara kerja pembelajaran yang diawasi

Teknik pembelajaran diawasi menggunakan kumpulan data pelatihan berlabel untuk memahami hubungan antara input dan output data. Ilmuwan data secara manual membuat kumpulan data pelatihan kebenaran dasar yang berisi data input beserta label yang sesuai. Pembelajaran diawasi melatih model untuk menerapkan output yang benar pada input baru dalam contoh penggunaan dunia nyata. 

Selama pelatihan, algoritma model memproses kumpulan data yang besar untuk mengeksplorasi potensi korelasi antara input dan output. Kemudian, kinerja model dievaluasi dengan data pengujian untuk mengetahui apakah berhasil dilatih. Validasi silang adalah proses pengujian model menggunakan bagian yang berbeda dari kumpulan data. 

Kelompok algoritma gradient descent, termasuk stochastic gradient descent (SGD), adalah algoritma pengoptimalan yang paling sering digunakan, atau algoritma pembelajaran, ketika melatih neural networks dan model machine learning lainnya. Algoritma optimasi model menilai akurasi melalui fungsi kesalahan: persamaan yang mengukur perbedaan antara prediksi model dan nilai aktual. 

Fungsi kesalahan mengukur seberapa jauh prediksi dari nilai aktual. Gradiennya menunjukkan arah di mana parameter model harus disesuaikan untuk mengurangi kesalahan. Selama pelatihan, algoritma optimasi memperbarui parameter model—aturan operasi atau “pengaturan”—untuk mengoptimalkan model.

Karena kumpulan data besar biasanya mengandung banyak fitur, ilmuwan data dapat menyederhanakan kompleksitas ini melalui reduksi dimensi. Teknik ilmu data ini mengurangi jumlah fitur menjadi yang paling penting untuk memprediksi label data, yang menjaga akurasi sekaligus meningkatkan efisiensi.

Contoh pembelajaran yang diawasi dalam tindakan

Sebagai contoh pembelajaran yang diawasi, pertimbangkan model klasifikasi gambar yang dibuat untuk mengenali gambar kendaraan dan menentukan jenis kendaraan tersebut. Model seperti itu dapat memberi daya CAPTCHA yang digunakan banyak situs web untuk mendeteksi bot spam. 

Untuk melatih model ini, ilmuwan data menyiapkan kumpulan data berlabel yang berisi banyak contoh kendaraan serta jenis kendaraan yang sesuai: mobil, sepeda motor, truk, sepeda, dan banyak lagi. Algoritma model mencoba mengidentifikasi pola dalam data pelatihan yang menyebabkan input—gambar kendaraan—menerima output yang ditetapkan—jenis kendaraan. 

Tebakan model diukur berdasarkan nilai data aktual dalam rangkaian pengujian untuk menentukan apakah prediksinya akurat. Jika tidak, siklus pelatihan dilanjutkan hingga kinerja model mencapai tingkat akurasi yang memuaskan. Prinsip generalisasi mengacu pada kemampuan model untuk membuat prediksi yang tepat pada data baru dari distribusi yang sama dengan data pelatihannya.

    Akademi AI

    Manfaatkan AI untuk layanan pelanggan

    Lihat bagaimana AI generatif dapat menyenangkan pelanggan dengan pengalaman yang lebih mulus dan meningkatkan produktivitas organisasi di tiga area utama ini: layanan mandiri, agen manusia, dan operasi pusat kontak.

    Jenis pembelajaran yang diawasi

    Tugas pembelajaran diawasi dapat dibagi secara luas menjadi masalah klasifikasi dan regresi:

      Klasifikasi

      Klasifikasi dalam machine learning menggunakan algoritma untuk mengurutkan data ke dalam kategori. Mengenali entitas tertentu dalam kumpulan data dan mencoba untuk menentukan bagaimana entitas tersebut harus diberi label atau didefinisikan. Algoritma klasifikasi yang umum digunakan adalah pengklasifikasi linier, support vector machine (SVM), struktur keputusan, k-nearest neighbor (KNN), regresi logistik, dan random forest.

      Neural networks unggul dalam menangani masalah klasifikasi yang kompleks. Neural Networks adalah arsitektur pembelajaran mendalam yang memproses data pelatihan dengan lapisan node yang meniru otak manusia. Setiap node terdiri atas input, bobot, bias (ambang batas), dan output. Jika nilai output melebihi ambang batas yang ditetapkan, node akan “menembak” atau mengaktifkan, meneruskan data ke lapisan berikutnya dalam jaringan. 

      Regresi

      Regresi digunakan untuk memahami hubungan antara variabel dependen dan independen. Dalam masalah regresi, output adalah nilai kontinu, dan model mencoba memprediksi output target. Tugas regresi termasuk proyeksi untuk pendapatan penjualan atau perencanaan keuangan.

      Algoritma regresi termasuk regresi linier, regresi laso, regresi ridge, dan regresi polinomial adalah tiga contoh algoritma regresi.

      Pembelajaran ansambel

      Pembelajaran ensambel adalah pendekatan meta untuk pembelajaran diawasi di mana beberapa model dilatih pada tugas klasifikasi atau regresi yang sama. Hasil dari semua model di dalam kumpulan model tersebut digabungkan untuk menemukan pendekatan terbaik secara keseluruhan dalam menyelesaikan tantangan tersebut.

      Algoritma individu dalam model ensambel yang lebih besar dikenal sebagai pembelajar lemah atau model dasar. Beberapa pembelajar lemah memiliki bias tinggi, sementara yang lain memiliki varians tinggi. Secara teoretis, hasil ini mengurangi kompromi bias-varians dengan menggabungkan bagian terbaik dari keduanya.

      Algoritma pembelajaran yang diawasi

      Algoritma optimasi seperti penurunan gradien melatih berbagai algoritma machine learning yang unggul dalam tugas pembelajaran yang diawasi. 

      • Naive Bayes: Naive Bayes adalah algoritme klasifikasi yang mengadopsi prinsip independensi bersyarat kelas dari teorema Bayes. Hal ini berarti bahwa kehadiran satu fitur tidak mempengaruhi kehadiran fitur lain dalam probabilitas suatu hasil, dan setiap prediktor memiliki efek yang sama terhadap hasil itu.

        Pengklasifikasi Bayes Naif termasuk multinomial, Bernoulli dan Gaussian Naive Bayes. Teknik ini sering digunakan dalam klasifikasi teks, identifikasi spam dan sistem rekomendasi. 

      • Regresi linier: Regresi linier digunakan untuk mengidentifikasi hubungan antara suatu variabel terikat yang berkesinambungan dengan satu atau lebih variabel bebas. Hal ini biasanya digunakan untuk membuat prediksi tentang hasil masa depan.

        Regresi linier menyatakan hubungan antar variabel sebagai garis lurus. Ketika hanya ada satu variabel independen dan satu variabel dependen, ini dikenal sebagai regresi linier sederhana. Ketika jumlah variabel independen meningkat, teknik ini disebut sebagai regresi linier ganda. 

      • Regresi nonlinier: Terkadang, output tidak dapat direproduksi dari input linier. Dalam kasus ini, output harus dimodelkan dengan fungsi nonlinier. Regresi nonlinier mengungkapkan hubungan antara variabel melalui garis nonlinier, atau melengkung. Model nonlinier dapat menangani hubungan kompleks dengan banyak parameter. 

      • Regresi logistik: Regresi logistik menangani variabel dependen kategori—ketika variabel tersebut memiliki output biner, seperti benar atau salah atau positif atau negatif. Sementara model regresi linear dan regresi logistik berupaya memahami hubungan antara input data, regresi logistik terutama memecahkan masalah klasifikasi biner, seperti identifikasi spam. 

      • Regresi polinomial: Mirip dengan model regresi lainnya, regresi polinomial memodelkan hubungan antara variabel pada grafik. Fungsi yang digunakan dalam regresi polinomial mengekspresikan hubungan ini melalui derajat eksponensial. Regresi polinomial adalah kasus khusus regresi di mana fitur input dipangkatkan, memungkinkan model linier untuk menyesuaikan pola nonlinier. 

      • Mesin vektor pendukung (Support Vector Machine/SVM):  Mesin vektor pendukung digunakan untuk klasifikasi dan regresi data. Konon, biasanya menangani masalah klasifikasi. Di sini, SVM memisahkan kelas titik data dengan batas keputusan atau hyperplane. Tujuan dari algoritma SVM adalah untuk memplot hyperplane yang memaksimalkan jarak antara kelompok-kelompok titik data. 

      • K-nearest neighbor: K-nearest neighbor (KNN) adalah algoritma nonparametrik yang mengklasifikasikan titik data berdasarkan kedekatan dan hubungannya dengan data lain yang tersedia. Algoritma ini mengasumsikan bahwa titik data serupa dapat ditemukan berdekatan saat ditampilkan secara matematis dalam grafik.

        Kemudahan penggunaan dan waktu kalkulasi yang rendah membuatnya efisien ketika digunakan untuk mesin rekomendasi dan pengenalan gambar. Tetapi seiring bertambahnya kumpulan data pengujian, waktu pemrosesan semakin memanjang, membuatnya kurang menarik untuk tugas klasifikasi. 

      • Random forest: Random forest adalah algoritma machine learning diawasi fleksibel yang digunakan untuk tujuan klasifikasi dan regresi. Istilah "forest" merujuk ke kumpulan struktur keputusan tidak berkorelasi yang digabungkan untuk mengurangi varians dan meningkatkan akurasi. 

        Pembelajaran yang diawasi versus metode pembelajaran lainnya

        Pembelajaran diawasi bukan satu-satunya metode pembelajaran untuk melatih model machine learning. Jenis machine learning lainnya meliputi: 

        • Pembelajaran tanpa pengawasan

        • Pembelajaran semi-diawasi 

        • Pembelajaran dengan pengawasan mandiri

        • Pembelajaran penguatan 

            Pembelajaran yang diawasi versus tanpa pengawasan

            Perbedaan antara pembelajaran diawasi dan pembelajaran tanpa pengawasan adalah bahwa machine learning tanpa pengawasan menggunakan data tidak berlabel tanpa kebenaran dasar yang objektif. Model dibiarkan menemukan sendiri pola dan hubungan dalam data. Banyak model AI generatif pada awalnya dilatih dengan pembelajaran tanpa pengawasan dan kemudian dengan pembelajaran diawasi untuk meningkatkan keahlian domain. 

            Pembelajaran yang tidak diawasi dapat membantu memecahkan masalah klaster atau asosiasi di mana properti umum dalam kumpulan data tidak pasti. Algoritma pengelompokan umum adalah hierarkis, K-mean, dan model campuran Gaussian.

              Kelebihan pembelajaran tanpa pengawasan

              • Analisis eksplorasi: Pembelajaran tanpa pengawasan berguna ketika "apa yang harus dicari" tidak diketahui. Dengan demikian pembelajaran dapat menemukan struktur tersembunyi atau anomali dalam data yang mungkin tidak diperkirakan manusia.

              • Tidak ada pelabelan data: Sebagian besar data di dunia nyata tidak diberi label dan pelabelan data membutuhkan banyak waktu dan upaya.

              • Fleksibilitas: Model pembelajaran tanpa pengawasan dapat dengan cepat beradaptasi dengan data baru karena kemampuannya memproses data secara mandiri.

              • Skalabilitas: Tanpa memerlukan label kebenaran dasar, teknik pembelajaran tanpa pengawasan dapat diskalakan dengan mudah ke kumpulan data masif.

              Kekurangan pembelajaran tanpa pengawasan

              • Hasil yang tidak tepat: Tanpa dasar kebenaran dasar, tidak langsung terlihat dengan jelas apakah model pembelajaran tanpa pengawasan telah dilatih dengan benar.

              • Sensitivitas: Kumpulan data yang tidak akurat dapat memengaruhi hasil pelatihan. Rekayasa fitur dapat membantu menormalkan kumpulan data untuk pembelajaran tanpa pengawasan yang lebih lancar.

              • Ketergantungan pada data yang baik: Semua pelatihan membutuhkan data yang baik. Namun tanpa adanya kebenaran dasar yang objektif, bias atau kesalahan lain dalam data dapat menghasilkan model yang memperkuat kesalahpahaman tersebut.

              Pembelajaran yang diawasi vs pembelajaran semi-diawasi

              Pembelajaran agak diawasi melibatkan pelatihan model pada sebagian kecil data input berlabel bersama dengan porsi yang lebih besar dari data tanpa label. Karena dapat memakan waktu dan biaya untuk mengandalkan keahlian domain untuk memberi label data dengan tepat untuk pembelajaran yang diawasi, pembelajaran agak diawasi dapat menjadi alternatif yang menarik.

                Kelebihan pembelajaran agak diawasi

                • Tidak terlalu bergantung pada pelabelan: Dibandingkan dengan pembelajaran diawasi, pembelajaran agak diawasi membutuhkan lebih sedikit pelabelan, yang menurunkan kesulitan untuk memulai pelatihan model.
                   

                • Penemuan pola tersembunyi: Seperti pembelajaran tanpa pengawasan, penggunaan data tidak berlabel dalam pembelajaran agak diawasi dapat mengarah pada penemuan pola, hubungan, dan anomali yang mungkin tidak diketahui.
                   

                • Lebih fleksibel: Pembelajaran agak diawasi menciptakan fondasi melalui data kebenaran dasar, kemudian menambahkannya dengan kumpulan data tidak berlabel untuk membuat model yang lebih dapat digeneralisasi.

                Kekurangan pembelajaran agak diawasi

                • Sensitivitas ketidakakuratan: Kumpulan data tidak berlabel dengan tingkat ketidakakuratan tinggi dapat mengganggu hasil pelatihan, sehingga melemahkan kinerja model.
                   

                • Sensitivitas bias: jika kumpulan data tidak berlabel tidak disaring untuk bias implisit, bias tersebut dapat ditransfer ke model yang sedang dilatih.
                   

                • Lebih kompleks: Menyatukan data berlabel dan tidak berlabel dalam satu proses pelatihan dapat melibatkan teknik pemrosesan data yang rumit atau membutuhkan lebih banyak sumber daya komputasi.

                Pembelajaran yang diawasi versus pembelajaran dengan pengawasan mandiri

                Pembelajaran pengawasan mandiri (SSL) sering digambarkan sebagai menjembatani pembelajaran diawasi dan tanpa pengawasan. Alih-alih menggunakan label yang dibuat secara manual dari kumpulan data pembelajaran yang diawasi, tugas SSL dikonfigurasikan sehingga model dapat menghasilkan sinyal pengawasannya sendiri, label implisit atau semu, dan membedakan kebenaran dasar dari data yang tidak terstruktur. Kemudian, fungsi kesalahan model menggunakan label tersebut sebagai pengganti label aktual untuk menilai kinerja model.

                SSL sering digunakan dengan pembelajaran transfer, sebuah proses di mana model terlatih diterapkan pada tugas hilir. Pembelajaran pengawasan mandiri melihat penggunaan luas dalam tugas visi komputer dan pemrosesan bahasa alami (NLP) yang membutuhkan kumpulan data besar yang sangat mahal dan memakan waktu untuk diberi label.

                Kelebihan pembelajaran pengawasan mandiri

                • Efisiensi: Alih-alih meminta ilmuwan data memberi label pada titik data, SSL mengotomatiskan proses pelabelan dengan mentransfer tugas tersebut ke model.

                • Skalabilitas: Ketergantungan SSL yang lebih rendah pada pelabelan data manual membuatnya cocok untuk penskalaan dengan kumpulan data tidak berlabel yang lebih besar.
                   

                • Ketergantungan yang rendah pada pelabelan: Dalam kasus di mana data kebenaran dasar yang berlabel jarang ditemukan, SSL menutupi kekurangan tersebut melalui pemahaman yang dihasilkan oleh model.
                   

                • Keserbagunaan: Model pengawasan mandiri mempelajari fitur yang kaya dan dapat ditransfer yang dapat disesuaikan dengan baik untuk berbagai tugas spesifik domain dan multimodal.

                Kekurangan pembelajaran pengawasan mandiri

                • Intensif komputasi: Memproses kumpulan data tidak berlabel dan menghasilkan label membutuhkan banyak daya komputasi.
                   

                • Kompleks: Proses pembuatan tugas-tugas pretext untuk pembelajaran diawasi, fase pembelajaran awal, memerlukan tingkat keahlian yang tinggi.
                   

                • Berpotensi tidak dapat diandalkan: Seperti teknik pembelajaran lainnya yang menghilangkan pengawasan manusia, hasilnya bergantung pada data yang bebas dari ketidakakuratan berlebihan, bias implisit, dan faktor lain yang dapat berdampak negatif pada pemahaman model.

                Pembelajaran yang diawasi versus pembelajaran dengan penguatan

                Pembelajaran penguatan melatih agen otonom, seperti robot dan mobil self-driving, untuk membuat keputusan melalui interaksi lingkungan. Pembelajaran penguatan tidak menggunakan data berlabel dan juga berbeda dari pembelajaran yang tidak diawasi karena pembelajaran ini dilakukan dengan cara coba-coba dan memberi penghargaan, bukan dengan mengidentifikasi pola yang mendasari di dalam kumpulan data.

                Kelebihan pembelajaran penguatan

                • Menyelesaikan tugas-tugas yang kompleks: Proses pelatihan coba-coba dapat menjadi model untuk mencari tahu cara mendekati tantangan strategis yang kompleks.
                   

                • Tidak bergantung pada pelabelan: Model belajar dari eksperimen, bukan teoretis, melalui pencocokan input dengan output.
                   

                • Koreksi sendiri: Model mengasah perilaku mereka sendiri saat mereka melakukan kesalahan selama pelatihan.
                   

                • Dapat beradaptasi: Model dapat beradaptasi dengan informasi baru dan keadaan yang berubah-ubah yang hasilnya tidak ditentukan sebelumnya.

                Kekurangan pembelajaran penguatan

                • Rentan terhadap hasil yang tidak konsisten: Belajar coba-coba dapat tampak serampangan dan tidak dapat diprediksi, terutama saat pertama kali memulai pelatihan.
                   

                • Kebutuhan data lingkungan: Pembelajaran penguatan membutuhkan model untuk belajar dari konsekuensi tindakan mereka, yang pada gilirannya membutuhkan data lingkungan dalam jumlah besar. Namun, agen juga dapat belajar di lingkungan simulasi.
                   

                • Peretasan imbalan: Model dapat mengeksploitasi celah dalam algoritma imbalan untuk menghasilkan hadiah tanpa menyelesaikan tugasnya dengan baik.
                   

                • Khusus untuk tugas tertentu: Pembelajaran penguatan unggul dalam model pelatihan untuk fungsi tertentu. Semua model tersebut bisa jadi kesulitan mentransfer apa yang telah mereka pelajari ke tugas baru.

                Contoh penggunaan pembelajaran yang diawasi dalam dunia nyata

                Model pembelajaran yang diawasi dapat membangun dan memajukan aplikasi bisnis, termasuk: 

                • Pengenalan gambar dan objek: Algoritma pembelajaran yang diawasi dapat digunakan untuk menemukan lokasi, mengisolasi, dan mengategorikan objek dari video atau gambar, menjadikannya berguna dengan visi komputer dan tugas analisis gambar. 

                • Analisis prediktif:Model pembelajaran yang diawasi membuat sistem analitik prediktif untuk memberikan insight. Hal ini memungkinkan perusahaan untuk mengantisipasi hasil berdasarkan variabel output dan membuat keputusan berbasis data, pada gilirannya membantu para pemimpin bisnis membenarkan pilihan mereka atau pivot untuk manfaat organisasi.

                  Regresi juga memungkinkan penyedia layanan kesehatan untuk memprediksi hasil berdasarkan kriteria pasien dan data historis. Model prediktif dapat menilai risiko pasien terhadap penyakit atau kondisi tertentu berdasarkan data biologis dan gaya hidup mereka. 

                • Analisis sentimen pelanggan: Organisasi dapat mengekstrak dan mengklasifikasikan informasi penting dari sejumlah besar data—termasuk konteks, emosi, dan niat—dengan intervensi manusia yang minimal. Analisis sentimen memberikan pemahaman yang lebih baik tentang interaksi pelanggan dan dapat digunakan untuk meningkatkan upaya keterlibatan merek. 

                • Segmentasi pelanggan: Model regresi dapat memprediksi perilaku pelanggan berdasarkan berbagai sifat dan tren historis. Bisnis dapat menggunakan model prediktif untuk menyegmentasikan basis pelanggan mereka dan menciptakan persona pembeli untuk meningkatkan upaya pemasaran dan pengembangan produk. 

                • Deteksi spam: Deteksi spam adalah contoh lain dari model pembelajaran yang diawasi. Dengan menggunakan algoritma klasifikasi yang diawasi, organisasi bisa melatih basis data untuk mengenali pola atau anomali pada data baru untuk mengatur korespondensi terkait spam dan non-spam secara efektif. 

                • Forecasting: Model regresif unggul dalam forecasting berdasarkan tren historis, sehingga cocok untuk digunakan dalam industri. Perusahaan juga dapat menggunakan regresi untuk memprediksi kebutuhan inventaris, memperkirakan gaji karyawan, dan menghindari potensi gangguan rantai pasokan. 

                • Mesin rekomendasi: Dengan model pembelajaran yang diawasi, penyedia konten dan pasar digital dapat menganalisis pilihan, preferensi, dan pembelian pelanggan serta membangun mesin rekomendasi yang menawarkan rekomendasi yang disesuaikan sehingga lebih mungkin untuk dikonversi.

                    Tantangan pembelajaran yang diawasi

                    Meskipun pembelajaran yang diawasi dapat menawarkan keuntungan bisnis seperti insight data yang mendalam dan otomatisasi yang ditingkatkan, itu mungkin bukan pilihan terbaik untuk semua situasi. 

                    • Batasan personal: Model pembelajaran yang diawasi dapat membutuhkan tingkat keahlian tertentu untuk menatanya secara akurat. 

                    • Keterlibatan manusia: Model pembelajaran yang diawasi tidak mampu belajar mandiri. Ilmuwan data harus memvalidasi output kinerja model. 

                    • Persyaratan waktu: Kumpulan data pelatihan berukuran besar dan harus diberi label secara manual, yang membuat proses pembelajaran yang diawasi memakan waktu. 

                    • Ketidakfleksibelan: Model pembelajaran terawasi sulit untuk memberi label pada data di luar batas-batas kumpulan data pelatihan mereka. Model pembelajaran tanpa pengawasan mungkin lebih mampu menangani data baru. 

                    • Bias: Kumpulan data memiliki risiko kemungkinan kesalahan manusia dan bias yang lebih tinggi, menyebabkan algoritma belajar secara tidak benar.  Bias dapat muncul dari kumpulan data pelatihan yang tidak seimbang, praktik anotasi yang buruk, atau ketidakadilan historis yang tercermin dalam data.

                    • Overfitting: Pembelajaran yang diawasi terkadang dapat mengakibatkan overfitting: di mana sebuah model menjadi terlalu disesuaikan dengan kumpulan data pelatihannya. Akurasi tinggi dalam pelatihan dapat mengindikasikan overfitting dibandingkan dengan kinerja yang umumnya kuat. Menghindari overfitting mengharuskan model diuji dengan data yang berbeda dari data pelatihan.

                      Solusi terkait
                      IBM watsonx.ai

                      Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

                      Temukan watsonx.ai
                      Solusi kecerdasan buatan (AI)

                      Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

                      Jelajahi solusi AI
                      Konsultasi dan layanan AI

                      Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

                      Jelajahi layanan AI
                      Ambil langkah selanjutnya

                      Dapatkan akses ke berbagai kemampuan dalam satu alat untuk seluruh siklus pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

                      Jelajahi watsonx.ai Pesan demo langsung