Neural network adalah model machine learning yang menumpuk "neuron" sederhana dalam lapisan dan mempelajari bobot pengenalan pola dan bias dari data untuk memetakan input ke output.
Neural networks adalah salah satu algoritma yang paling berpengaruh dalam machine learning dan kecerdasan buatan (AI). Mereka mendukung terobosan dalam visi komputer, pemrosesan bahasa alami (NLP), pengenalan suara, dan aplikasi yang tak terhitung jumlahnya mulai dari perkiraan hingga pengenalan wajah. Meski neural network mendalam (DNN) saat ini mendukung sistem yang bahkan serumittransformator dan jaringan saraf convolutional (CNN), asal-usul neural network dapat ditelusuri kembali ke model sederhana seperti regresi linier dan bagaimana otak manusia mencerna, memproses, dan memutuskan informasi yang disajikan kepadanya.
Pada tingkat tinggi, inspirasi untuk neural networks berasal dari neuron biologis dalam otak manusia yang berkomunikasi melalui sinyal listrik. Pada tahun 1943, Warren McCulloch dan Walter Pitts mengusulkan model matematis pertama dari sebuah neuron yang menunjukkan bahwa unit sederhana dapat melakukan komputasi suatu fungsi. Kemudian, pada tahun 1958 Frank Rosenblatt memperkenalkan perceptron, sebuah algoritma yang dirancang untuk melakukan pengenalan pola. Perceptron adalah nenek moyang historis dari jaringan saat ini: pada dasarnya model linier dengan output terbatas. Dalam bagian berikutnya kita akan membahas bagaimana neural networks meminjam inspirasi dari otak manusia untuk membuat keputusan dan mengenali pola.
Neural network dapat dipahami melalui contoh sederhana: deteksi spam. Sebuah email dimasukkan ke dalam jaringan, dan fitur-fitur seperti kata atau frasa seperti "hadiah", "uang", "sayang", atau "menang" digunakan sebagai masukan. Neuron awal dalam jaringan memproses pentingnya setiap sinyal, sedangkan lapisan berikutnya menggabungkan informasi ini menjadi isyarat di tingkat lebih tinggi yang menangkap konteks dan nada. Lapisan terakhir kemudian menghitung probabilitas apakah email tersebut adalah spam, dan jika probabilitasnya cukup tinggi, maka email tersebut ditandai. Pada intinya, jaringan belajar bagaimana mengubah fitur mentah menjadi pola yang berarti dan menggunakannya untuk membuat prediksi.
Proses ini didukung oleh dua konsep dasar: bobot dan bias. Bobot bertindak seperti dial yang mengontrol seberapa kuat setiap fitur input memengaruhi keputusan—kata seperti “hadiah” dapat diberi bobot lebih dari kata umum seperti “halo.” Bias adalah nilai bawaan yang menggeser ambang batas keputusan, yang memungkinkan neuron untuk diaktifkan meskipun input lemah. Bersama-sama, parameter model ini menentukan bagaimana setiap neuron berkontribusi pada perhitungan keseluruhan. Dengan menyesuaikan nilai-nilai ini selama pelatihan, jaringan secara bertahap belajar untuk membuat prediksi yang akurat—dalam hal ini, apakah sebuah email adalah spam atau bukan.
Secara matematis, neural networks mempelajari suatu fungsi dengan memetakan vektor input untuk memprediksi respons Apa yang membedakan neural network dari algoritma machine learning tradisional lainnya adalah struktur berlapis-lapis dan kemampuannya untuk melakukan transformasi.
Neural network terdiri dari:
Sama seperti algoritma machine learning lainnya, neural net memerlukan pelatihan yang ketat agar dapat melakukan pengujian dengan baik. Untuk melatih jaringan, satu neuron menghitung:
Di mana:
merupakan aktivasi pada output yang mengubah kombinasi linier agar sesuai dengan keputusan fungsi. Dengan menggunakan arsitektur ini, input X ditransformasikan menjadi output Y, yang berfungsi sebagai model machine learning prediktif.
Kekuatan jaringan saraf berasal dari kemampuannya untuk mempelajari bobot dan bias yang tepat dari data. Hal ini dilakukan dengan membandingkan prediksi jaringan ke label yang sebenarnya dan mengukur kesalahan menggunakan fungsi kehilangan. Misalnya, dalam tugas klasifikasi, kehilangan dapat mengukur seberapa jauh probabilitas yang diprediksi dari jawaban yang benar.
Untuk meminimalkan kerugian ini, jaringan menggunakan algoritma yang disebut propagasi balik. Neural network dilatih dalam empat langkah:
Proses ini diulang berkali-kali pada kumpulan data pelatihan. Setiap siklus membantu jaringan untuk “menyetel” parameter internal sehingga prediksinya semakin mendekati jawaban yang benar. Seiring waktu, jaringan akan menyatu dengan satu kumpulan bobot dan bias yang meminimalkan kesalahan dan menggeneralisasi dengan baik pada data yang tidak terlihat. Propagasi balik dikombinasikan dengan gradient descent adalah mesin yang membuat neural networks bekerja. Hal ini memungkinkan jaringan dengan jutaan (atau bahkan miliaran) parameter untuk mempelajari pola yang berarti dari kumpulan data yang sangat besar.
Namun, terlepas dari upaya praktisi untuk melatih model berkinerja tinggi, neural network masih menghadapi tantangan yang mirip dengan model machine learning lainnya—yang paling signifikan, overfitting. Ketika neural network menjadi terlalu kompleks dengan terlalu banyak parameter, model akan menjadi terlalu cocok dengan data pelatihan dan membuat prediksi yang buruk. Overfitting adalah masalah umum di semua jenis neural network, dan memperhatikan pertukaran bias-varian sangat penting untuk menciptakan model neural network berkinerja tinggi.
Arsitektur jaringan saraf modern—seperti transformator dan model encoder-decoder—mengikuti prinsip inti yang sama (bobot dan bias yang dipelajari, lapisan bertumpuk, aktivasi nonlinier, pelatihan ujung ke ujung dengan propagasi balik). Perbedaannya secara khusus terletak pad acara input digabung di seluruh lapisan. Alih-alih penggabungan yang sepenuhnya terhubung sendiri, transformator menggunakan atensi untuk membentuk kombinasi representasi tertimbang yang bergantung pada data, di samping koneksi residual, normalisasi, dan enkode posisi untuk memperkaya jaringan yang dibangun di atas dasar-dasar yang sama.
Meskipun perceptron multilayer adalah fondasinya, neural network telah berevolusi menjadi arsitektur khusus yang cocok untuk domain yang beragam:
Neural networks mendukung banyak sistem AI saat ini. Beberapa aplikasi terkemuka dari neural networks meliputi:
Aplikasi ini mendorong inovasi dunia nyata dalam perawatan kesehatan, keuangan, robotika, hiburan, dan lainnya.
Neural networks mempelajari representasi internal yang berguna langsung dari data, menangkap struktur nonlinier yang terlewat oleh model klasik. Dengan kapasitas yang memadai, tujuan suara, dan regularisasi terhadap overfitting, mereka meningkat dari tolok ukur kecil ke sistem produksi dalam visi komputer, pemrosesan bahasa alami, pengenalan suara, forecasting, dan banyak lagi—memberikan pencapaian terukur dalam akurasi dan ketahanan.
Pembelajaran mendalam modern memperluas fondasi ini. Kekhususan CNN adalah ekstraksi fitur spasial untuk gambar; RNN memodelkan ketergantungan temporal dalam urutan; transformator menggantikan perulangan dengan perhatian, dibantu oleh koneksi residual, normalisasi, dan paralelisme yang efisien pada GPU.
Terlepas dari perbedaan arsitektur, pelatihan tetap dilakukan secara menyeluruh dengan propagasi balik pada kumpulan data yang besar dan tampilan inti tetap memiliki: dipelajari dengan menyusun transformasi yang bergantung pada data dengan aktivasi nonlinier. AI generatif dibangun di atas prinsip yang sama dalam skala yang lebih besar. Model bahasa besar, model difusi, VAE, dan GAN mempelajari distribusi melalui data untuk menggabungkan teks, gambar, audio, dan kode.
Lompatan dari perceptron multilayer ke generator yang canggih pada dasarnya adalah salah satu yang berawal dari arsitektur, data, dan komputasi. Memahami fungsi aktivasi, persyaratan pelatihan, dan jenis utama jaringan memberikan jembatan praktis dari neural network klasik ke sistem generatif saat ini dan menjelaskan mengapa model ini menjadi elemen penting dari AI modern.
Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.
Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.
Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.