Langkah ini penting karena akan menghasilkan contoh yang jelas tentang perilaku agen dengan dan tanpa sumber data eksternal. Mari kita mulai dengan mengatur parameter.

Parameter model yang tersedia dapat ditemukan di sini. Kita bereksperimen dengan berbagai parameter model, termasuk suhu, jumlah token baru minimum dan maksimum, serta urutan penghentian. Pelajari lebih lanjut tentang parameter model dan apa artinya di dokumen watsonx. Penting untuk mengatur stop_sequences kita di sini untuk membatasi halusinasi agen. Pengaturan ini memberi tahu agen untuk berhenti menghasilkan output lebih lanjut setelah menemukan substring tertentu. Dalam kasus ini, kita menginginkan agar agen menghentikan responsnya setelah mencapai suatu observasi dan tidak membuat halusinasi respons manusia. Oleh karena itu, salah satu stop_sequences kita adalah 'Manusia:' dan yang lainnya adalah Pengamatan agar berhenti setelah respons akhir dihasilkan.

Untuk tutorial ini, kami sarankan menggunakan model Granite-3.0-8B-Instruct dari IBM sebagai LLM untuk mencapai hasil yang serupa. Anda bebas menggunakan model AI apa pun pilihan Anda. Model dasar yang tersedia melalui watsonx dapat ditemukan di sini. Tujuan dari semua model ini dalam aplikasi LLM adalah untuk menjadi mesin penalaran yang memutuskan tindakan apa yang harus diambil.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

Kita akan menyiapkan templat prompt jika Anda ingin mengajukan beberapa pertanyaan.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

Dan sekarang kita dapat menyiapkan rantai dengan prompt dan LLM kita. Hal ini memungkinkan model generatif menghasilkan respons.

agent = prompt | llm

Mari kita uji untuk melihat bagaimana agen kita merespons kueri dasar.

agent.invoke({"query": 'What sport is played at the US Open?'})

Output: ' Jangan mencoba menduga jawaban.



Olahraga yang dimainkan di AS Terbuka adalah tenis.'

Agen berhasil menanggapi kueri dasar dengan jawaban yang benar. Dalam langkah selanjutnya dari tutorial ini, kita akan membuat alat RAG agar agen dapat mengakses informasi yang relevan tentang keterlibatan IBM dalam AS Terbuka 2024. Seperti yang telah kami bahas, LLM tradisional tidak dapat memperoleh informasi terkini sendiri. Mari kita verifikasi hal ini.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

Output: ' Jangan menduga jawaban.



Kejuaraan Tenis AS Terbuka 2024 belum diumumkan secara resmi, jadi lokasinya belum dikonfirmasi. Oleh karena itu, saya tidak tahu jawaban pertanyaan ini.'

Jelaslah bahwa LLM tidak dapat memberi kita informasi yang relevan. Data pelatihan yang digunakan untuk model ini berisi informasi sebelum AS Terbuka 2024 dan tanpa alat yang sesuai agen tidak memiliki akses ke informasi ini.