Machine learning (ML) adalah cabang kecerdasan buatan (AI) yang difokuskan untuk memungkinkan komputer dan mesin meniru cara manusia belajar, untuk melakukan tugas secara mandiri, dan untuk meningkatkan kinerja dan keakuratan melalui pengalaman dan paparan terhadap lebih banyak data.
UC Berkeleymembagi sistem pembelajaran algoritma machine learning menjadi tiga bagian utama.
Buletin industri
Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.
Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.
Karena pembelajaran mendalam dan machine learning cenderung digunakan secara bergantian, ada baiknya untuk memperhatikan perbedaan di antara keduanya. Machine learning, pembelajaran mendalam, dan neural network adalah sub-bidang kecerdasan buatan. Namun, neural network sebenarnya adalah sub-bidang machine learning, dan pembelajaran mendalam adalah sub-bidang neural network.
Perbedaan antara pembelajaran mendalam dan machine learning terletak pada cara belajar tiap-tiap algoritmanya. Machine learning “mendalam” dapat memanfaatkan kumpulan data berlabel, yang juga dikenal sebagai pembelajaran terawasi, untuk menginformasikan algoritmanya, tetapi tidak selalu membutuhkan kumpulan data berlabel. Pembelajaran mendalam dapat menyerap data yang tidak terstruktur dalam bentuk mentah (seperti teks atau gambar), dan secara otomatis dapat menentukan sekumpulan fitur yang membedakan kategori data yang berbeda satu sama lain. Ini menghilangkan beberapa campur tangan manusia yang diperlukan dan memungkinkan penggunaan sejumlah besar data. Anda dapat menganggap pembelajaran mendalam sebagai “machine learning yang dapat diskalakan” seperti catatan Lex Fridman dalam kuliah MIT 1 ini1.
Machine learning klasik atau "tidak mendalam" lebih bergantung pada campur tangan manusia untuk belajar. Pakar manusia menentukan hierarki fitur untuk memahami perbedaan antara input data, biasanya membutuhkan data yang lebih terstruktur untuk dipelajari.
Neural networks, atau neural networks tiruan (JST), terdiri dari lapisan-lapisan node, yang terdiri dari lapisan input, satu atau lebih lapisan tersembunyi, dan lapisan output. Setiap node, atau neuron buatan, terhubung ke yang lain dan memiliki bobot dan ambang batas yang terkait. Jika output dari setiap node individu berada di atas nilai ambang batas yang ditentukan, node itu diaktifkan, data dikirim ke lapisan jaringan berikutnya. Jika tidak, tidak ada data yang diteruskan ke lapisan jaringan berikutnya oleh node itu. “Mendalam” dalam pembelajaran mendalam hanya mengacu pada jumlah lapisan dalam neural networks. Neural network yang terdiri dari lebih dari tiga lapisan, yang akan mencakup input dan hasil, dapat dianggap sebagai algoritma pembelajaran mendalam. Neural network yang hanya memiliki dua atau tiga lapisan hanyalah neural network dasar.
Pembelajaran mendalam dan neural network dikreditkan dengan mempercepat kemajuan di berbagai bidang seperti visi komputer, pemrosesan bahasa alami (NLP), dan pengenalan suara.
Lihat postingan blog “AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?” (AI vs Machine Learning vs Pembelajaran Mendalam vs Neural Networks: Apa Perbedaannya?) untuk melihat lebih dekat bagaimana konsep yang berbeda berhubungan.
Model machine learning terbagi dalam tiga kategori utama.
Pembelajaran terawasi, juga dikenal sebagai machine learning terawasi, ditentukan oleh penggunaan kumpulan data berlabel untuk melatih algoritma guna mengklasifikasi data atau memprediksi hasil secara akurat. Saat data input dimasukkan ke dalam model, model menyesuaikan bobotnya hingga data tersebut dipasang dengan tepat. Hal ini terjadi sebagai bagian dari proses validasi silang untuk memastikan bahwa model menghindari overfitting atau underfitting. Pembelajaran terawasi membantu organisasi memecahkan berbagai masalah dunia nyata dalam skala besar, seperti mengklasifikasi spam dalam folder terpisah dari kotak masuk Anda. Beberapa metode yang digunakan dalam pembelajaran terawasi meliputi neural network, Naïve Bayes, regresi linear, regresi logistik, hutan acak, dan mesin vektor pendukung (SVM).
Pembelajaran tanpa pengawasan, juga dikenal sebagai machine learning tanpa pengawasan, menggunakan algoritma machine learning untuk menganalisis dan mengelompokkan kumpulan data tanpa label (subset yang disebut cluster). Algoritma ini menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia.
Kemampuan pembelajaran tanpa pengawasan untuk menemukan persamaan dan perbedaan informasi membuatnya ideal untuk analisis data eksplorasi, strategi penjualan silang, segmentasi pelanggan, serta pengenalan gambar dan pola. Ini juga digunakan untuk mengurangi jumlah fitur dalam model melalui proses pengurangan dimensi. Analisis komponen utama (PCA) dan dekomposisi nilai tunggal (SVD) adalah dua pendekatan umum untuk ini. Algoritma lain yang digunakan dalam pembelajaran tanpa pengawasan termasuk neural network, k-means clustering, dan metode clustering probabilistik.
Pembelajaran semi-terawasi menawarkan keseimbangan antara pembelajaran terawasi dan tanpa pengawasan. Selama pelatihan, sistem ini menggunakan kumpulan data berlabel yang lebih kecil untuk memandu klasifikasi dan ekstraksi fitur dari kumpulan data yang lebih besar dan tidak berlabel. Pembelajaran semi-terawasi dapat memecahkan masalah kekurangan data berlabel untuk algoritma pembelajaran terawasi. Ini juga membantu jika biaya terlalu mahal untuk memiliki data berlabel yang cukup.
Untuk menyelami lebih dalam perbedaan antara pendekatan ini, lihat "Supervised vs. Unsupervised Learning: What's the Difference?" (Pembelajaran dengan Pengawasan vs. Tanpa Pengawasan: Apa Perbedaannya?)
Pembelajaran penguatan adalah model machine learning yang mirip dengan pembelajaran terawasi, tetapi algoritmanya tidak dilatih menggunakan data sampel. Model ini belajar seiring berjalannya waktu dengan metode trial-error. Urutan hasil yang berhasil akan diperkuat untuk mengembangkan rekomendasi atau kebijakan terbaik untuk masalah tertentu.
Sistem IBM® Watson yang memenangkan tantangan Jeopardy! tahun 2011 adalah contoh yang baik. Sistem ini menggunakan pembelajaran penguatan untuk mempelajari kapan harus mencoba jawaban (atau pertanyaan, seolah-olah), kotak mana yang harus dipilih di papan tulis, dan berapa banyak yang harus dipertaruhkan—terutama pada ganda harian.
Sejumlah algoritma machine learning yang biasa digunakan. Ini termasuk:
Neural network mensimulasikan cara kerja otak manusia, dengan sejumlah besar node pemrosesan yang terhubung. Neural network sangat baik dalam mengenali pola dan memainkan peran penting dalam aplikasi termasuk penerjemahan bahasa alami, pengenalan gambar, pengenalan suara, dan pembuatan gambar.
Algoritma ini digunakan untuk memprediksi nilai numerik, berdasarkan hubungan linier antara nilai yang berbeda. Misalnya, teknik ini dapat digunakan untuk memprediksi harga rumah berdasarkan data historis untuk daerah tersebut.
Algoritma pembelajaran terawasi ini membuat prediksi untuk variabel respons kategoris, seperti jawaban “ya/tidak”. Ini dapat digunakan untuk aplikasi seperti mengklasifikasikan spam dan kontrol kualitas pada lini produksi.
Dengan menggunakan pembelajaran tanpa pengawasan, algoritma clustering dapat mengidentifikasi pola dalam data sehingga itu dapat dikelompokkan. Algoritma dapat membantu para ilmuwan data dengan mengidentifikasi perbedaan antara item data yang terlewatkan oleh manusia.
Decision trees dapat digunakan untuk memprediksi nilai numerik (regresi) dan mengklasifikasi data ke dalam kategori. Decision Trees menggunakan urutan percabangan keputusan terkait yang dapat direpresentasikan dengan diagram pohon. Salah satu keuntungan dari decision trees adalah kemudahannya untuk divalidasi dan diaudit, tidak seperti kotak hitam dari neural network.
Di hutan acak, algoritma machine learning memprediksi nilai atau kategori dengan menggabungkan hasil dari sejumlah decision trees.
Tergantung pada anggaran Anda, kebutuhan akan kecepatan dan presisi yang diperlukan, setiap jenis algoritma— dengan pengawasan, tanpa pengawasan, semi-diawasi, atau diperkuat — memiliki kelebihan dan kekurangannya sendiri.
Misalnya, algoritma decision trees digunakan untuk memprediksi nilai numerik (masalah regresi) dan mengklasifikasi data ke dalam kategori. Decision trees menggunakan urutan percabangan keputusan terkait yang dapat diwakili dengan diagram pohon. Keuntungan utama dari decision trees adalah kemudahannya untuk divalidasi dan diaudit daripada neural network. Kabar buruknya adalah itu bisa lebih tidak stabil daripada prediktor keputusan lainnya.
Secara keseluruhan, ada banyak keuntungan dari machine learning yang dapat dimanfaatkan bisnis untuk efisiensi baru. Ini termasuk machine learning yang mengidentifikasi pola dan tren dalam volume data besar yang mungkin sama sekali dilewatkan oleh manusia. Dan analisis ini membutuhkan sedikit intervensi manusia: cukup masukkan kumpulan data yang menarik dan biarkan sistem machine learning merakit dan menyempurnakan algoritmanya sendiri, yang akan terus meningkat dengan lebih banyak input data dari waktu ke waktu. Pelanggan dan pengguna dapat menikmati pengalaman yang lebih personal karena model belajar lebih banyak dengan setiap pengalaman dengan orang itu.
Sisi negatifnya, machine learning membutuhkan kumpulan data pelatihan besar yang akurat dan tidak bias. GIGO adalah faktor operasi: sampah masuk/sampah keluar. Mengumpulkan data yang cukup dan memiliki sistem yang cukup kuat untuk menjalankannya mungkin juga menguras sumber daya.
Machine learning juga rentan terhadap kesalahan, tergantung pada input. Dengan sampel yang terlalu kecil, sistem dapat menghasilkan algoritma logis sempurna yang sepenuhnya salah atau menyesatkan. Untuk menghindari pemborosan anggaran atau pelanggan yang tidak menyenangkan, organisasi harus bertindak berdasarkan jawaban hanya ketika ada kepercayaan yang tinggi pada hasil.
Berikut adalah beberapa contoh machine learning yang mungkin Anda temui setiap hari:
Pengenalan suara: Juga dikenal sebagai pengenalan ucapan otomatis (ASR), pengenalan ucapan komputer, atau ucapan-ke-teks, dan ini adalah kemampuan yang menggunakan pemrosesan bahasa alami (NLP) untuk memproses ucapan manusia ke dalam format tertulis. Banyak perangkat seluler yang menggabungkan pengenalan suara ke dalam sistem mereka untuk melakukan pencarian suara—misalnya Siri—atau tingkatkan aksesibilitas untuk SMS.
Layanan pelanggan: Chatbot online menggantikan agen manusia di sepanjang perjalanan pelanggan, mengubah cara kita berpikir tentang interaksi pelanggan di seluruh situs web dan platform media sosial. Chatbots menjawab pertanyaan umum (FAQ) tentang topik-topik seperti pengiriman, atau memberikan saran yang dipersonalisasi, produk cross-selling, atau menyarankan ukuran untuk pengguna. Contohnya termasuk agen virtual di situs e-commerce; bot layanan pesan, menggunakan Slack dan Facebook Messenger; dan tugas-tugas yang biasanya dilakukan oleh asisten virtual dan asisten suara.
Visi komputer: Teknologi AI ini memungkinkan komputer memperoleh informasi bermakna dari gambar digital, video, dan input visual lainnya, dan mengambil tindakan yang tepat. Didukung oleh neural network konvolusional, visi komputer memiliki aplikasi dalam tag foto di media sosial, pencitraan radiologi di bidang kesehatan, dan mobil tanpa pengemudi dalam industri otomotif.
Mesin rekomendasi: Dengan menggunakan data perilaku konsumsi di masa lalu, algoritma AI dapat membantu menemukan tren data yang dapat digunakan untuk mengembangkan strategi penjualan silang yang lebih efektif. Mesin rekomendasi digunakan oleh pengecer online untuk membuat rekomendasi produk yang relevan kepada pelanggan selama proses pembayaran.
Otomatisasi proses robotik (RPA): Juga dikenal sebagai robotika perangkat lunak, RPA menggunakan teknologi otomatisasi cerdas untuk melakukan tugas manual yang berulang.
Perdagangan saham otomatis: Dirancang untuk mengoptimalkan portofolio saham, platform trading frekuensi tinggi yang digerakkan oleh AI menghasilkan ribuan bahkan jutaan trade per hari tanpa campur tangan manusia.
Deteksi penipuan: Bank dan lembaga keuangan lainnya dapat menggunakan machine learning untuk mengenali transaksi mencurigakan. Pembelajaran dengan pengawasan dapat melatih model menggunakan informasi tentang transaksi penipuan yang diketahui. Deteksi anomali dapat mengidentifikasi transaksi yang terlihat tidak lazim dan memerlukan penyelidikan lebih lanjut.
Ketika teknologi machine learning telah berkembang, hidup kita menjadi lebih mudah. Namun, penerapan machine learning dalam bisnis juga menimbulkan sejumlah masalah etika tentang teknologi AI. Beberapa di antaranya termasuk:
Meskipun topik ini menarik banyak perhatian publik, banyak peneliti yang tidak peduli dengan gagasan AI yang melampaui kecerdasan manusia dalam waktu dekat. Singularitas teknologi juga disebut sebagai AI yang kuat atau kecerdasan super. Filsuf Nick Bostrum mendefinisikan kecerdasan super sebagai "kecerdasan apa pun yang jauh mengungguli otak manusia terbaik di hampir semua bidang, termasuk kreativitas ilmiah, kebijaksanaan umum, dan keterampilan sosial."
Terlepas dari kenyataan bahwa kecerdasan super tidak akan segera hadir di masyarakat, gagasan tentang hal ini menimbulkan beberapa pertanyaan menarik ketika kita mempertimbangkan penggunaan sistem otonom, seperti mobil tanpa pengemudi. Tidak realistis untuk berpikir bahwa mobil tanpa pengemudi tidak akan pernah mengalami kecelakaan, tetapi siapa yang bertanggung jawab dan berkewajiban dalam situasi seperti itu? Haruskah kita tetap mengembangkan kendaraan otonom, atau apakah kita membatasi teknologi ini pada kendaraan semi-otonom yang membantu orang mengemudi dengan aman? Juri masih belum memutuskan, tetapi ini adalah jenis perdebatan etis yang terjadi seiring dengan berkembangnya teknologi AI yang baru dan inovatif.
Meskipun banyak persepsi publik tentang kecerdasan buatan berpusat pada hilangnya pekerjaan, kekhawatiran ini mungkin harus diluruskan. Dengan setiap teknologi baru yang disruptif, kami melihat bahwa permintaan pasar untuk peran pekerjaan tertentu bergeser. Sebagai contoh, ketika kita melihat industri otomotif, banyak produsen, seperti GM, beralih untuk fokus pada produksi kendaraan listrik untuk menyelaraskan dengan inisiatif ramah lingkungan. Industri energi tidak akan hilang, tetapi sumber energi bergeser dari penghematan bahan bakar ke listrik.
Dengan cara yang sama, kecerdasan buatan akan menggeser permintaan pekerjaan ke area lain. Perlu ada individu untuk membantu mengelola sistem AI. Masih akan ada orang-orang yang dibutuhkan untuk mengatasi masalah yang lebih kompleks di dalam industri yang kemungkinan besar akan terpengaruh oleh pergeseran permintaan pekerjaan, seperti layanan pelanggan. Tantangan terbesar dengan kecerdasan buatan dan pengaruhnya terhadap pasar kerja adalah membantu orang untuk bertransisi ke peran baru yang diminati.
Privasi cenderung dibahas dalam konteks privasi data, perlindungan data, dan keamanan data. Kekhawatiran ini telah memungkinkan pembuat kebijakan untuk membuat lebih banyak langkah dalam beberapa tahun terakhir. Sebagai contoh, pada tahun 2016, undang-undang GDPR dibuat untuk melindungi data pribadi orang-orang di Uni Eropa dan Wilayah Ekonomi Eropa, sehingga memberikan kontrol lebih besar kepada individu atas data mereka. Di Amerika Serikat, setiap negara bagian mengembangkan kebijakan, seperti California Consumer Privacy Act (CCPA), yang diperkenalkan pada tahun 2018 dan mewajibkan perusahaan untuk memberi tahu konsumen tentang pengumpulan data mereka. Undang-undang seperti ini telah memaksa perusahaan untuk memikirkan kembali cara mereka menyimpan dan menggunakan informasi identifikasi pribadi (PII). Akibatnya, investasi dalam keamanan telah menjadi prioritas yang semakin meningkat bagi bisnis karena mereka berusaha menghilangkan kerentanan dan peluang untuk pengawasan, peretasan, dan serangan siber.
Contoh-contoh bias dan diskriminasi di sejumlah sistem machine learning telah menimbulkan banyak pertanyaan etis mengenai penggunaan kecerdasan buatan. Bagaimana kita dapat melindungi dari bias dan diskriminasi ketika data pelatihan itu sendiri mungkin dihasilkan oleh proses manusia yang bias? Sementara perusahaan biasanya memiliki niat baik untuk upaya otomatisasi mereka, Reuters2 menyoroti beberapa konsekuensi tak terduga dari penggunaan AI ke dalam praktik perekrutan. Dalam upaya mereka untuk mengotomatisasi dan menyederhanakan sebuah proses, Amazon secara tidak sengaja mendiskriminasi kandidat pekerja berdasarkan gender untuk posisi teknis, dan perusahaan akhirnya harus membatalkan proyek tersebut. Harvard Business Review3 telah mengangkat pertanyaan tajam lainnya tentang penggunaan AI dalam praktik perekrutan, seperti data apa yang harus dapat Anda gunakan saat mengevaluasi kandidat untuk suatu posisi.
Bias dan diskriminasi juga tidak terbatas pada fungsi sumber daya manusia; hal ini dapat ditemukan di sejumlah aplikasi mulai dari perangkat lunak pengenal wajah hingga algoritma media sosial.
Seiring dengan semakin sadarnya perusahaan akan risiko yang ditimbulkan oleh AI, mereka juga menjadi lebih aktif dalam diskusi seputar etika dan nilai-nilai AI. Misalnya, IBM telah meluncurkan produk pengenalan wajah dan analisis tujuan umum. CEO IBM Arvind Krishna menulis: "IBM dengan tegas menentang dan tidak akan membenarkan penggunaan teknologi apa pun, termasuk teknologi pengenal wajah yang ditawarkan oleh vendor lain, untuk pengawasan massal, pembuatan profil rasial, pelanggaran hak asasi dan kebebasan dasar manusia, atau tujuan apa pun yang tidak sesuai dengan nilai-nilai dan prinsip-prinsip kami tentang Kepercayaan dan Transparansi."
Karena tidak ada undang-undang yang signifikan untuk mengatur praktik AI, tidak ada mekanisme penegakan hukum yang nyata untuk memastikan bahwa AI yang etis dipraktikkan. Insentif saat ini bagi perusahaan untuk bersikap etis adalah dampak negatif dari sistem AI yang tidak etis terhadap keuntungan perusahaan. Untuk mengisi kesenjangan tersebut, kerangka kerja etika telah muncul sebagai bagian dari kolaborasi antara ahli etika dan peneliti untuk mengatur konstruksi dan distribusi model AI di masyarakat. Namun, saat ini, hal ini hanya berfungsi sebagai panduan. Beberapa penelitian4 menunjukkan bahwa kombinasi tanggung jawab yang terdistribusi dan kurangnya pandangan ke depan terhadap konsekuensi potensial tidak kondusif untuk mencegah bahaya bagi masyarakat.
Memilih platform dapat menjadi proses yang menantang, karena sistem yang salah dapat meningkatkan biaya, atau membatasi penggunaan alat atau teknologi berharga lainnya. Ketika meninjau beberapa vendor untuk memilih platform AI, sering ada kecenderungan untuk berpikir bahwa lebih banyak fitur = sistem yang lebih baik. Mungkin begitu, tetapi pengulas harus mulai dengan memikirkan apa yang akan dilakukan platform AI untuk organisasi mereka. Kemampuan machine learning apa yang perlu disampaikan dan fitur apa yang penting untuk mencapainya? Satu fitur yang hilang dapat merusak kegunaan seluruh sistem. Berikut adalah beberapa fitur yang perlu dipertimbangkan.
Kemampuan MLOps. Apakah sistem memiliki:
Kemampuan AI generatif. Apakah sistem memiliki:
Belajar konsep dasar dan bangun keterampilan Anda dengan laboratorium praktis, kursus, proyek terpandu, uji coba, dan lainnya.
Pelajari cara menggabungkan AI generatif dan machine learning dengan percaya diri ke dalam bisnis Anda.
Ingin mendapatkan laba yang lebih baik atas investasi AI Anda? Pelajari bagaimana meningkatkan AI gen di berbagai bidang utama mendorong perubahan dengan membantu para pemikir terbaik Anda membangun dan memberikan solusi baru yang inovatif.
Pelajari cara memilih model dasar AI yang paling sesuai untuk contoh penggunaan Anda.
IBM Granite adalah rangkaian model AI kami yang terbuka, berkinerja, dan tepercaya, yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Jelajahi opsi bahasa, kode, deret waktu, dan batasan.
Pelajari 3 elemen penting dari strategi AI yang kuat: menciptakan keunggulan kompetitif, meningkatkan skala AI di seluruh bisnis, dan mengembangkan AI tepercaya.
Kami menyurvei 2.000 organisasi tentang inisiatif AI mereka untuk mengetahui apa yang berhasil, apa yang tidak, dan cara Anda untuk maju.
Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.
Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.
Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.
1 Deep Learning Basics: Introduction and Overview
2 Insight - Amazon scraps secret AI recruiting tool that showed bias against women, Reuters, 10 Oktober 2018
3 The Legal and Ethical Implications of Using AI in Hiring, Harvard Business Review, 25 April 2019
4 The Ethics of AI Ethics, An Evaluation of Guidelines, Dr. Thilo Hagendorff