Generasi dengan dukungan pengambilan data (RAG) menghubungkan LLM dengan sumber data eksternal untuk memperluas basis pengetahuannya. Ketika pengguna kirim kueri, sistem RAG mencari informasi yang relevan dalam basis data yang dipasangkan, lalu menggabungkannya dengan kueri untuk memberikan konteks lebih banyak kepada LLM ketika menghasilkan respons.

RAG menggunakan penanaman untuk mengubah basis data, kode sumber, atau informasi lain dalam basis data vektor yang dapat dicari. Penanaman secara matematis memplot setiap titik data dalam ruang vektor tiga dimensi. Untuk menemukan data yang relevan, model pengambilan informasi dalam sistem RAG mengubah kueri pengguna menjadi menanamkan dan menemukan menanamkan serupa dalam basis data vektor.

Sistem RAG biasanya mengikuti urutan standar yang sama:

Prompting: Pengguna mengirimkan prompt ke antarmuka pengguna, seperti chatbot yang didukung AI. Querying: Model pengambilan informasi mengubah prompt menjadi menanamkan dan mengkueri database untuk data serupa. Pengambilan: Model pengambilan mengambil data yang relevan dari database. Generation: Sistem RAG menggabungkan data yang diambil dengan kueri pengguna dan mengirimnya ke LLM, yang menghasilkan respons. Pengiriman: Sistem RAG mengembalikan respons yang dihasilkan kepada pengguna.

RAG mendapatkan namanya karena cara sistem RAG mengambil data yang relevan dan menggunakannya untuk menambah respons yang dihasilkan LLM. Sistem RAG yang lebih kompleks memperkenalkan komponen tambahan untuk menyempurnakan proses dan lebih meningkatkan kualitas respons.