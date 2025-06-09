Cache prompt adalah cara untuk menyimpan dan kemudian menggunakan kembali respons yang dihasilkan dari prompt yang dieksekusi saat bekerja dengan model bahasa seperti model IBM® Granite. Jika input (prompt) yang sama ditemui kembali, alih-alih membuat panggilan API baru, aplikasi akan mengambil respons yang disimpan sebelumnya di cache prompt.

Bayangkan cache prompt sebagai semacam "memori" untuk aplikasi Anda. Sistem menyimpan hasil dari kueri sebelumnya untuk menghemat waktu komputasi karena tidak perlu membuat permintaan berulang pada input yang sama.