Apa itu model AI?

Apa itu model AI?

Model AI adalah program yang telah dilatih pada sekumpulan data untuk mengenali pola tertentu atau membuat keputusan tertentu tanpa campur tangan manusia lebih lanjut. Model kecerdasan buatan menerapkan algoritma yang berbeda untuk input data yang relevan untuk mencapai tugas, atau hasil, yang telah diprogram untuk mereka.

Sederhananya, model AI ditentukan oleh kemampuannya untuk membuat keputusan atau prediksi secara otonom, alih-alih mensimulasikan kecerdasan manusia. Di antara model AI pertama yang sukses adalah program bermain dam dan catur di awal tahun 1950-an: model ini memungkinkan program untuk melakukan gerakan sebagai respons langsung terhadap lawan manusia, ketimbang mengikuti serangkaian gerakan yang sudah ditentukan sebelumnya.

Jenis model AI yang berbeda lebih cocok untuk tugas-tugas tertentu, atau domain, yang mana logika pengambilan keputusannya paling berguna atau relevan. Sistem yang kompleks sering kali menggunakan beberapa model secara bersamaan, menggunakan teknik pembelajaran ensambel seperti bagging, boosting , atau stacking.

Seiring dengan pertumbuhan alat AI yang semakin kompleks dan serbaguna, alat ini membutuhkan jumlah data dan daya komputasi yang semakin menantang untuk dilatih dan dijalankan. Sebagai tanggapan, sistem yang dirancang untuk menjalankan tugas-tugas spesifik dalam satu domain memberi jalan kepada model dasar, yang telah dilatih sebelumnya pada kumpulan data yang besar dan tidak berlabel dan mampu melakukan beragam aplikasi. Model dasar serbaguna ini kemudian dapat disesuaikan untuk berbagai tugas tertentu.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru 


Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Algoritma vs. model

Meskipun kedua istilah tersebut sering digunakan secara bergantian dalam konteks ini, mereka tidak berarti hal yang sama.

  • Algoritma adalah prosedur, yang sering kali dijelaskan dalam bahasa matematika atau pseudocode, yang diterapkan pada kumpulan data untuk mencapai fungsi atau tujuan tertentu.
  • Model adalah output dari algoritma yang telah diterapkan pada kumpulan data.

Secara sederhana, model AI digunakan untuk membuat prediksi atau keputusan dan algoritma adalah logika yang digunakan untuk mengoperasikan model AI tersebut.

Akademi AI

Memilih model AI yang tepat untuk contoh penggunaan Anda

Lebih besar tidak selalu lebih baik dalam hal model AI. Pelajari cara menemukan model yang tepat untuk kebutuhan bisnis Anda. Kemudian dapatkan buku panduan untuk membantu Anda mengambil tindakan.

Model AI dan machine learning

Model AI dapat mengotomatiskan pengambilan keputusan, tetapi hanya model yang mampu melakukan machine learning (ML) yang dapat mengoptimalkan kinerjanya secara otonom dari waktu ke waktu.

Kendati semua model ML adalah AI, tidak semua AI melibatkan ML. Model AI yang paling dasar adalah serangkaian pernyataan jika-maka-lalu, dengan aturan yang diprogram secara eksplisit oleh ilmuwan data. Model-model seperti ini disebut juga mesin aturan, sistem pakar, grafik pengetahuan, atau AI simbolik.

Model machine learning menggunakan AI statistik dan bukan AI simbolis. Sementara model AI berbasis aturan harus diprogram secara eksplisit, model ML "dilatih" dengan menerapkan kerangka kerja matematis mereka ke kumpulan data sampel yang titik-titik datanya berfungsi sebagai dasar untuk prediksi dunia nyata di masa depan.

Teknik model ML secara umum dapat dibagi menjadi tiga kategori: pembelajaran yang diawasi, pembelajaran yang tidak diawasi , dan pembelajaran penguatan.

  • Pembelajaran yang diawasi: juga dikenal sebagai machine learning “klasik”, pembelajaran yang diawasi membutuhkan seorang pakar manusia untuk memberi label pada data pelatihan. Seorang ilmuwan data yang melatih model pengenalan gambar untuk mengenali anjing dan kucing harus memberi label pada gambar sampel sebagai “anjing” atau “kucing”, serta fitur-fitur utama—seperti ukuran, bentuk, atau bulu—yang menginformasikan label-label utama tersebut. model tersebut kemudian dapat menggunakan label-label tersebut selama pelatihan untuk menyimpulkan karakteristik visual yang khas untuk “anjing” dan “kucing”.
  • Pembelajaran yang tidak diawasi: Tidak seperti teknik pembelajaran yang diawasi, pembelajaran yang tidak diawasi tidak mengasumsikan adanya jawaban “benar” atau “salah” secara eksternal, dan dengan demikian tidak memerlukan pelabelan. Algoritma ini mendeteksi pola yang melekat dalam kumpulan data untuk mengelompokkan titik data ke dalam grup dan menginformasikan prediksi. Misalnya, bisnis ecommerce seperti Amazon menggunakan model asosiasi yang tidak diawasi untuk mendukung mesin rekomendasi.
  • Pembelajaran penguatan: dalam pembelajaran penguatan, sebuah model belajar secara holistik dengan cara trial and error melalui pemberian penghargaan sistematis terhadap hasil yang benar (atau hukuman terhadap hasil yang salah). Model penguatan digunakan untuk menginformasikan saran media sosial, perdagangan saham algoritmik, dan bahkan mobil tanpa pengemudi.

Pembelajaran mendalam adalah bagian dari pembelajaran tanpa pengawasan yang telah berkembang lebih jauh dengan struktur neural networks yang mencoba meniru struktur otak manusia. Beberapa lapisan node yang saling terhubung secara progresif menyerap data, mengekstrak fitur-fitur utama, mengidentifikasi hubungan, dan menyempurnakan keputusan dalam proses yang disebut propagasi maju. Proses lain yang disebut propagasi balik menerapkan model yang menghitung kesalahan dan menyesuaikan bobot dan bias sistem. Sebagian besar aplikasi AI canggih, seperti model bahasa besar (LLM) yang mendukung chatbot modern, memanfaatkan pembelajaran mendalam. Solusi ini membutuhkan sumber daya komputasi yang luar biasa.

Model generatif vs. model diskriminatif

Salah satu cara untuk membedakan model machine learning adalah dengan metodologi fundamentalnya: sebagian besar dapat dikategorikan sebagai generatif atau diskriminatif. Perbedaannya terletak pada bagaimana keduanya memodelkan data dalam ruang tertentu.

Model generatif

Algoritma generatif, yang biasanya memerlukan pembelajaran tanpa pengawasan, memodelkan distribusi titik data, yang bertujuan untuk memprediksi probabilitas bersama P(x,y) dari titik data tertentu yang muncul di ruang tertentu. Model visi komputer generatif dengan demikian dapat mengidentifikasi korelasi seperti “hal-hal yang terlihat seperti mobil biasanya memiliki empat roda” atau “mata tidak mungkin muncul di atas alis.”

Prediksi ini dapat memberikan informasi mengenai pembuatan outputs yang dianggap sangat mungkin oleh model. Misalnya, model generatif yang dilatih pada data teks dapat mendukung saran ejaan dan pelengkapan otomatis; pada tingkat yang paling rumit, model ini dapat menghasilkan teks yang sepenuhnya baru. Pada hakikatnya, ketika mengeluarkan teks, LLM telah menghitung probabilitas tinggi dari rangkaian kata tersebut yang akan dirangkai sebagai respons terhadap perintah yang diberikan.

Contoh penggunaan umum lainnya untuk model generatif termasuk sintesis gambar, komposisi musik, transfer gaya, dan terjemahan bahasa.

Contoh model generatif meliputi:

  • Model difusi: model difusi secara bertahap menambahkan noise Gaussian ke data pelatihan hingga tidak dapat dikenali, kemudian mempelajari proses “denoising” terbalik yang dapat menghasilkan output (biasanya gambar) dari noise seed yang acak.
  • Variational autoencoder (VAE): VAE terdiri atas encoder yang mengompresi data input dan decoder yang belajar membalikkan proses dan memetakan kemungkinan distribusi data.
  • Model transformator: Model transformator menggunakan teknik matematika yang disebut “perhatian” atau “perhatian diri” untuk mengidentifikasi bagaimana elemen yang berbeda dalam serangkaian data saling memengaruhi satu sama lain. “GPT” dalam Chat-GPT OpenAI adalah singkatan dari “Generative PreTransformer.”

Model diskriminatif

Algoritma diskriminatif , yang biasanya memerlukan pembelajaran terbimbing, memodelkan batas-batas antara kelas data (atau “batas keputusan”), yang bertujuan untuk memprediksi probabilitas bersyarat P(y|x) dari titik data tertentu (x) yang termasuk dalam kelas tertentu (y). Model visi komputer diskriminatif dapat mempelajari perbedaan antara "mobil" dan "bukan mobil" dengan melihat beberapa perbedaan utama (seperti "jika tidak memiliki roda, itu bukan mobil"), yang memungkinkannya untuk mengabaikan banyak korelasi yang harus diperhitungkan oleh model generatif. Model diskriminatif dengan demikian cenderung membutuhkan daya komputasi yang lebih sedikit.

Model diskriminatif, tentu saja, sangat cocok untuk tugas klasifikasi seperti analisis sentimen—tetapi model ini memiliki banyak kegunaan. Sebagai contoh, model decision trees dan hutan acak memecah proses pengambilan keputusan yang kompleks menjadi serangkaian node, di mana setiap “daun” mewakili keputusan klasifikasi yang potensial.

Contoh penggunaan

Sementara model diskriminatif atau generatif secara umum dapat mengungguli satu sama lain untuk contoh penggunaan tertentu, banyak tugas dapat dicapai dengan salah satu jenis model. Misalnya, model diskriminatif memiliki banyak kegunaan dalam pemrosesan bahasa alami (NLP) dan sering mengungguli AI generatif untuk tugas-tugas seperti terjemahan mesin (yang memerlukan pembuatan teks terjemahan).

Demikian pula, model generatif dapat digunakan untuk klasifikasi menggunakan teorema Bayes. Daripada menentukan di sisi mana dari batas keputusan sebuah instans berada (seperti yang dilakukan oleh model diskriminatif), model generatif dapat menentukan probabilitas dari setiap kelas yang menghasilkan instans dan memilih salah satu yang memiliki probabilitas yang lebih tinggi.

Banyak sistem AI menggunakan keduanya secara bersamaan. Dalam jaringan permusuhan generatif, misalnya, model generatif menghasilkan data sampel dan model diskriminatif menentukan apakah data itu “nyata” atau “palsu.” Hasil dari model diskriminatif digunakan untuk melatih model generatif hingga diskriminator tidak dapat lagi membedakan data yang dihasilkan “palsu”.

Model klasifikasi vs. model regresi

Cara lain untuk mengkategorikan model adalah berdasarkan sifat tugas yang digunakan. Sebagian besar algoritma model AI klasik melakukan klasifikasi atau regression. Beberapa cocok untuk keduanya, dan sebagian besar model dasar memanfaatkan kedua jenis fungsi.

Terminologi ini, kadang-kadang, bisa membingungkan. Misalnya, regresi logistik adalah model diskriminatif yang digunakan untuk klasifikasi.

Model Regresi

Model Regression memprediksi nilai kontinu (seperti harga, usia, ukuran atau waktu). Nilai-nilai itu terutama digunakan untuk menentukan hubungan antara satu atau lebih variabel independen (x) dan variabel dependen (y): diberikan x, prediksi nilai y.

  • Algoritma seperti regresi linear, dan varian terkait seperti regresi kuantil, berguna untuk tugas-tugas seperti forecasting, menganalisis elastisitas harga, dan menilai risiko.
  • Algoritma seperti regresi polinomial dan regresi vektor pendukung (SVR) memodelkan hubungan non-linear yang kompleks antar-variabel.
  • Model generatif tertentu, seperti autoregresi dan variational autoencoder, tidak hanya menjelaskan hubungan korelatif antara nilai masa lalu dan masa depan, tetapi juga hubungan sebab akibat . Hal ini membuat mereka sangat berguna untuk forecasting skenario cuaca dan memprediksi peristiwa iklim ekstrem.

Model klasifikasi

Model klasifikasi memprediksi nilai diskrit . Dengan demikian, mereka terutama digunakan untuk menentukan label yang sesuai atau untuk mengkategorikan (yaitu, mengklasifikasikan). Ini bisa berupa klasifikasi biner —seperti “ya atau tidak,” “terima atau tolak”—atau klasifikasi multi-kelas (seperti mesin rekomendasi yang menyarankan Produk A, B, C, atau D).

Algoritma klasifikasi memiliki beragam kegunaan, mulai dari kategorisasi langsung hingga mengotomatiskan ekstraksi fitur dalam jaringan pembelajaran mendalam hingga kemajuan perawatan kesehatan seperti klasifikasi gambar diagnostik dalam radiologi.

Contoh umum meliputi:

  • Naïve bayes: algoritma pembelajaran yang diawasi generatif yang biasa digunakan dalam pemfilteran spam dan klasifikasi dokumen.
  • Analisis diskriminan linier: digunakan untuk menyelesaikan tumpang tindih yang kontradiktif antara beberapa fitur yang memengaruhi klasifikasi.
  • Regresi logistik: memprediksi probabilitas kontinu yang kemudian digunakan sebagai proksi untuk rentang klasifikasi.

Melatih model AI

“Pembelajaran” dalam machine learning dicapai dengan model pelatihan pada kumpulan data sampel. Tren dan korelasi probabilistik yang terlihat dalam kumpulan data sampel tersebut kemudian diterapkan pada kinerja fungsi sistem.

Dalam pembelajaran yang diawasi dan semi diawasi, data pelatihan ini harus diberi label dengan cermat oleh para ilmuwan data untuk mengoptimalkan hasil. Dengan ekstraksi fitur yang tepat, pembelajaran yang diawasi membutuhkan jumlah data pelatihan yang lebih rendah secara keseluruhan daripada pembelajaran yang tidak diawasi.

Idealnya, model ML dilatih dengan data dunia nyata. Hal ini, secara intuitif, paling baik memastikan bahwa model mencerminkan keadaan dunia nyata yang dirancang untuk dianalisis atau direplikasi. Namun, hanya mengandalkan data dunia nyata tidak selalu memungkinkan, praktis atau optimal.

Meningkatkan ukuran dan kompleksitas model

Meningkatkan ukuran dan kompleksitas model Makin banyak parameter yang dimiliki model, makin banyak data yang dibutuhkan untuk melatihnya. Seiring bertambahnya ukuran model pembelajaran mendalam, memperoleh data ini menjadi makin sulit. Hal ini terutama terlihat pada LLM: baik GPT-3 Open-AI dan sumber terbuka BLOOM memiliki lebih dari 175 miliar parameter.

Terlepas dari kemudahannya, menggunakan data yang tersedia untuk umum dapat memunculkan masalah regulasi, seperti ketika data harus dianonimkan, serta masalah kepraktisan. Sebagai contoh, model bahasa yang dilatih di utas media sosial dapat "mempelajari" kebiasaan atau ketidakakuratan yang tidak ideal untuk digunakan oleh perusahaan.

Data sintetis menawarkan solusi alternatif: sekumpulan data nyata yang lebih kecil digunakan untuk menghasilkan data pelatihan yang sangat mirip dengan data asli dan menghindari masalah privasi.

Menghilangkan bias

Model ML yang dilatih pada data dunia nyata mau tidak mau akan menyerap bias sosial yang akan tercermin dalam data tersebut. Jika tidak dihilangkan, bias semacam itu akan melanggengkan dan memperburuk ketidakadilan di bidang apa pun yang diinformasikan oleh model-model tersebut, seperti perawatan kesehatan atau perekrutan. Penelitian ilmu data telah menghasilkan algoritma seperti FairIJ dan teknik penyempurnaan model seperti FairReprogram untuk mengatasi ketidaksetaraan yang melekat pada data.

Overfitting dan underfitting

Overfitting terjadi ketika model ML terlalu cocok dengan data pelatihan, menyebabkan informasi yang tidak relevan (atau “kebisingan”) dalam kumpulan data sampel memengaruhi kinerja model. Underfitting adalah kebalikannya: pelatihan yang tidak tepat atau tidak memadai.

Model dasar

Juga disebut sebagai model basis atau model yang sudah dilatih sebelumnya, model dasar adalah model pembelajaran mendalam yang sudah dilatih sebelumnya pada kumpulan data berskala besar untuk mempelajari fitur dan pola umum. Mereka berfungsi sebagai titik awal untuk disempurnakan atau disesuaikan untuk aplikasi AI yang lebih spesifik.

Daripada membangun model dari awal, pengembang dapat mengubah lapisan Neural Networks, menyesuaikan parameter, atau mengadaptasi arsitektur agar sesuai dengan kebutuhan spesifik domain. Ditambah dengan keluasan dan kedalaman pengetahuan dan keahlian dalam model yang besar dan telah terbukti, hal ini menghemat waktu dan sumber daya yang signifikan dalam pelatihan model. Model dasar dengan demikian memungkinkan pengembangan dan penerapan sistem AI yang lebih cepat.

Fine-tuning pada model yang sudah terlatih untuk tugas-tugas khusus baru-baru ini telah memberi peluang munculnya teknik prompt-tuning, yang memperkenalkan isyarat front-end pada model untuk memandu model menuju jenis keputusan atau prediksi yang diinginkan.

Menurut David Cox, salah satu direktur MIT-IBM Watson AI Lab, penerapan ulang model pembelajaran mendalam yang terlatih (ketimbang melatih atau melatih ulang model baru) dapat memangkas penggunaan komputer dan energi lebih dari 1.000 kali lipat, sehingga menghemat biaya yang signifikan1.

Menguji model AI

Pengujian tingkat lanjut sangat penting untuk pengoptimalan, karena hal ini mengukur apakah suatu model sudah terlatih dengan baik untuk mencapai tugas yang diharapkan. Model dan tugas yang berbeda cocok untuk metrik dan metodologi yang berbeda.

Validasi silang

Menguji kinerja model memerlukan kelompok kontrol untuk menilainya, karena menguji model dengan data yang sama dengan data yang dilatih dapat menyebabkan overfitting. Dalam validasi silang, sebagian data pelatihan disisihkan atau dilakukan sampling ulang untuk membuat grup kontrol. Variannya meliputi metode yang tidak lengkap seperti k-fold, holdout, dan monte carlo cross-validation atau metode yang lengkap seperti leave-p-out cross-validation.

Metrik model klasifikasi

Metrik umum ini menggabungkan nilai hasil diskrit seperti true positive (TP), true negative (TN), false positive (FP), dan false negative (FN).

  • Akurasi adalah rasio prediksi yang benar terhadap prediksi total: (TP+TN) / (TP+TN+FP+FN). Ini tidak berfungsi dengan baik untuk kumpulan data yang tidak seimbang.
  • Presisi mengukur seberapa sering prediksi positif akurat: TP/(TP+FP).
  • Recall mengukur seberapa sering positif berhasil ditangkap: TP/(TP+FN).
  • Skor F1 adalah rata-rata harmonik presisi dan keingatan: (2×Presisi×Recall)/(Presisi+Recall). Skor ini menyeimbangkan tradeoff antara presisi (yang mendorong negatif palsu) dan penarikan (yang mendorong positif palsu).
  • Matriks kebingungan secara visual merepresentasikan keyakinan (atau kebingungan) algoritma Anda untuk setiap klasifikasi potensial.

Metrik model regresi2

Karena algoritma regresi memprediksikan nilai-nilai kontinu daripada nilai-nilai diskrit, maka nilai-nilai tersebut diukur dengan metrik yang berbeda di mana “N” mewakili jumlah observasi. Berikut ini adalah metrik umum yang digunakan untuk mengevaluasi model regression.

  • Mean absolute error (MAE) mengukur perbedaan rata-rata antara nilai prediksi( ypred) dan nilai aktual ( yactual) secara absolut: ∑( ypred - yactual) /N.
  • Mean squared error (MSE) mengkuadratkan kesalahan rata-rata untuk menghukum outlier secara agresif: ∑(ypred – yactual)2 /N.
  • Root mean square error (RSME ) mengukur deviasi standar dalam unit yang sama dengan hasil: √ (∑(ypred – yactual)2 /N).
  • Kesalahan persentase absolut rata-rata (MAPE) menyatakan kesalahan rata-rata sebagai persentase.

Menerapkan model AI

Untuk menerapkan dan menjalankan model AI, dibutuhkan perangkat komputasi atau server dengan daya pemrosesan dan kapasitas penyimpanan yang memadai. Kegagalan dalam merencanakan pipeline AI dan sumber daya komputasi secara memadai dapat mengakibatkan prototipe yang berhasil menjadi gagal melampaui fase proof-of-concept.

  • Kerangka kerja machine learning sumber terbuka seperti PyTorch, Tensorflow, dan Caffe2 dapat menjalankan model ML dengan beberapa baris kode.
  • Unit pemrosesan pusat (CPU) adalah sumber daya komputasi yang efisien untuk algoritma pembelajaran yang tidak memerlukan komputasi paralel yang ekstensif.
  • Unit pemrosesan grafis (GPU) memiliki kapasitas yang lebih besar untuk pemrosesan paralel, sehingga lebih cocok untuk kumpulan data yang sangat besar dan kompleksitas matematis neural networks jaringan mendalam.
Solusi terkait
Model dasar

Jelajahi perpustakaan model dasar IBM di portfolio watsonx untuk menskalakan AI generatif untuk bisnis Anda dengan percaya diri.

Temukan watsonx.ai
Solusi kecerdasan buatan (AI)

Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI
Konsultasi dan layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

Jelajahi layanan AI
Ambil langkah selanjutnya

Jelajahi perpustakaan model dasar IBM dalam portofolio IBM watsonx untuk menskalakan AI generatif untuk bisnis Anda dengan penuh percaya diri.

Temukan watsonx.ai Jelajahi model AI IBM Granite
Catatan kaki

1 "What is prompt tuning?", IBM Research, 15 Februari 2023.

2 "Machine learning model evaluation", Geeksforgeeks.org, 2022.