Seperti namanya, AI generatif menghasilkan gambar, musik, ucapan, kode, video atau teks, sementara itu menafsirkan dan memanipulasi data yang sudah ada sebelumnya. AI generatif bukanlah konsep baru: teknik machine learning di balik AI generatif telah berkembang selama dekade terakhir. Pendekatan terbaru didasarkan pada arsitektur Neural Networks, yang diciptakan “transformator.” Menggabungkan arsitektur transformator dengan pembelajaran tanpa pengawasan, model dasar besar muncul yang mengungguli tolok ukur yang ada yang mampu menangani beberapa modalitas data.

Model-model besar ini disebut model dasar, karena berfungsi sebagai titik awal untuk pengembangan model yang lebih maju dan kompleks. Dengan membangun di atas model dasar, kita dapat membuat model yang lebih khusus dan canggih yang disesuaikan dengan contoh penggunaan atau domain tertentu. Contoh awal model, seperti GPT-3, BERT, T5 atau DALL-E, telah menunjukkan apa yang mungkin: input prompt singkat dan sistem menghasilkan seluruh esai, atau gambar kompleks, berdasarkan parameter Anda.

Model Bahasa Besar (LLM) secara eksplisit dilatih pada data teks dalam jumlah besar untuk tugas-tugas NLP dan berisi sejumlah besar parameter, biasanya melebihi 100 juta. Mereka memfasilitasi pemrosesan dan pembuatan teks bahasa alami untuk beragam tugas. Setiap model memiliki kelebihan dan kekurangannya masing-masing, dan pilihan model mana yang akan digunakan bergantung pada tugas NLP yang spesifik dan karakteristik data yang sedang dianalisis. Memilih LLM yang tepat untuk digunakan untuk pekerjaan tertentu membutuhkan keahlian dalam LLM.

BERT dirancang untuk memahami hubungan dua arah antara kata-kata dalam kalimat dan terutama digunakan untuk klasifikasi tugas, menjawab pertanyaan dan named entity recognition. GPT, di sisi lain, adalah model berbasis transformator searah yang terutama digunakan untuk tugas-tugas pembuatan teks seperti terjemahan bahasa, ringkasan, dan pembuatan konten. T5 juga merupakan model berbasis transformator, namun berbeda dari BERT dan GPT karena dilatih menggunakan pendekatan teks-ke-teks dan dapat disesuaikan untuk berbagai tugas pemrosesan bahasa alami seperti terjemahan bahasa, ringkasan dan menanggapi pertanyaan.