LLM adalah model kecerdasan buatan inti untuk banyak aplikasi bisnis, seperti agen AI, penjawab pertanyaan yang didukung RAG, atau chatbot layanan pelanggan dengan pembuatan teks otomatis. Pemrosesan bahasa alami (NLP) adalah penggunaan algoritma machine learning untuk memahami dan menghasilkan bahasa manusia, dan LLM adalah jenis model NLP yang spesifik.
LLM yang terkenal termasuk keluarga GPT OpenAI, seperti GPT-4o dan GPT-3.5, beberapa model di balik ChatGPT, serta Claude dari Anthropic, Gemini dari Google, dan Llama 3 dari Meta. Semua LLM mampu menangani tugas-tugas yang kompleks, tetapi kebutuhan spesifik dari proyek machine learning dapat membantu menentukan LLM yang tepat untuk pekerjaan tersebut.
Memilih LLM yang tepat tergantung pada berbagai faktor termasuk:
- Contoh penggunaan tertentu: Tantangan machine learning langsung memengaruhi proses pemilihan LLM. Satu model LLM mungkin lebih unggul dalam memahami dan merangkum dokumen yang panjang, sementara model lain mungkin lebih mudah disempurnakan untuk penggunaan spesifik bidang tertentu.
- Kinerja: Sama seperti model lainnya, LLM dapat dibandingkan satu sama lain untuk mengevaluasi kinerja. Tolok ukur LLM mencakup metrik untuk penalaran, pengodean, matematika, latensi, pemahaman, dan pengetahuan umum. Membandingkan antara kebutuhan proyek dengan kinerja tolok ukur dapat membantu menentukan LLM terbaik yang sesuai untuk menghasilkan output berkualitas tinggi.
- Sumber terbuka versus sumber tertutup: Model sumber terbuka memungkinkan pengamat untuk memantau cara model mencapai keputusannya. LLM yang berbeda dapat rentan terhadap bias dan halusinasi dalam berbagai cara: ketika mereka menghasilkan prediksi yang tidak mencerminkan hasil dunia nyata. Ketika moderasi konten dan pencegahan bias menjadi hal yang terpenting, membatasi pilihan pada penyedia sumber terbuka dapat membantu membentuk proses pemilihan LLM.
- Penggunaan sumber daya dan harga: LLM adalah model yang haus sumber daya. Banyak LLM didukung oleh pusat data hyperscale yang diisi dengan ratusan ribu unit pemrosesan grafis (GPU) atau lebih. Penyedia LLM juga mengenakan biaya yang berbeda untuk koneksi API ke model mereka. Skalabilitas model dan sistem Harga secara langsung memengaruhi ruang lingkup proyek.