Orkestrasi agen LLM mengacu pada proses mengelola dan mengoordinasikan interaksi antara model bahasa besar (LLM) dan berbagai alat, API atau proses untuk melakukan berbagai tugas kompleks dalam sistem AI. Ini melibatkan penataan alur kerja di mana agen AI, yang didukung oleh kecerdasan buatan, bertindak sebagai pembuat keputusan atau mesin penalaran pusat, mengatur tindakannya berdasarkan input, konteks, dan output dari sistem eksternal. Menggunakan kerangka kerja orkestrasi, LLM dapat dengan lancar berintegrasi dengan API, basis data, dan aplikasi AI lainnya, yang memungkinkan fungsionalitas seperti chatbot dan alat otomatisasi. Kerangka kerja agen sumber terbuka semakin meningkatkan fleksibilitas sistem ini, membuat LLM lebih efektif dalam skenario dunia nyata.
Banyak orang salah memahami perbedaan antara orkestrasi LLM dan orkestrasi agen LLM. Ilustrasi berikut menyoroti perbedaan utama:
Dalam tutorial ini, Anda akan mempelajari cara membangun agen otonom yang didukung oleh model bahasa besar (LLM) menggunakan model IBM® Granite dan LangChain. Kita akan menjelajahi bagaimana agen memanfaatkan komponen kunci seperti memori, perencanaan, dan tindakan untuk melakukan berbagai tugas cerdas. Anda juga akan menerapkan sistem praktis yang memproses teks dari buku, menjawab kueri secara dinamis dan mengevaluasi kinerjanya menggunakan metrik akurasi seperti BLEU, presisi, recall, dan skor F1.
Kerangka kerja yang disajikan dalam gambar-1 memberikan desain holistik untuk agen otonom berbasis model bahasa besar (LLM), menekankan interaksi antara komponen utama: profil, memori, perencanaan, dan tindakan. Setiap komponen mewakili tahap penting dalam membangun agen otonom yang dapat menggunakan nalar, mengambil keputusan, dan berinteraksi dengan lingkungan dinamis.1
1. Profil: menentukan identitas agen
Profil memberikan identitas kepada agen dengan menanamkan informasi seperti data demografis, ciri kepribadian, dan konteks sosial. Proses ini memastikan bahwa agen dapat berinteraksi dengan cara yang dipersonalisasi. Profil dapat dibuat secara manual, dihasilkan oleh model gen AI seperti model Granite IBM atau GPT dari OpenAI (transformator generatif yang dilatih sebelumnya), atau diselaraskan dengan kumpulan data tertentu untuk memenuhi persyaratan tugas. Memanfaatkan rekayasa prompt, profil dapat disempurnakan secara dinamis untuk mengoptimalkan respons. Selain itu, dalam orkestrasi multiagen, profil membantu menentukan peran dan perilaku, memastikan koordinasi yang mulus di seluruh algoritma AI dan sistem pengambilan keputusan.
2. Memori: menyimpan dan menggunakan konteks
Memori membantu agen mempertahankan dan mengambil interaksi masa lalu yang memungkinkan respons kontekstual. Memori dapat disatukan (semua data di satu tempat) atau hybrid (terstruktur dan tidak terstruktur). Operasi yang meliputi membaca, menulis, dan merenung memungkinkan agen untuk belajar dari pengalaman dan memberikan output yang konsisten dan tepat. Memori yang terstruktur dengan baik meningkatkan orkestrasi multiagen dengan memastikan bahwa agen yang berbeda, termasuk agen khusus yang dirancang untuk tugas tertentu, dapat berbagi dan mengambil data yang relevan secara efisien. Dalam kerangka kerja seperti AutoGen dan Crew AI, memori memainkan peran penting dalam menjaga kontinuitas dalam ekosistem agen yang berkolaborasi, memastikan koordinasi yang mulus dan eksekusi tugas yang dioptimalkan.
3. Perencanaan: menyusun strategi tindakan
Komponen perencanaan memungkinkan agen menyusun strategi untuk mencapai tujuan. Komponen ini dapat mengikuti langkah-langkah yang telah ditentukan atau beradaptasi secara dinamis berdasarkan masukan dari lingkungan, manusia, atau LLM itu sendiri. Dengan mengintegrasikan algoritma AI dan memanfaatkan basis pengetahuan, perencanaan dapat dioptimalkan untuk meningkatkan efisiensi penalaran dan akurasi pemecahan masalah. Dalam aplikasi LLM, perencanaan memainkan peran penting dalam memastikan natural language understanding dan bahwa proses pengambilan keputusan selaras dengan tujuan agen. Selain itu, teknik pengambilan informasi yang ditingkatkan memperbaiki kemampuan agen untuk mengakses informasi yang relevan secara dinamis, sehingga meningkatkan akurasi respons. Fleksibilitas ini memastikan bahwa agen tetap efektif dalam skenario yang berubah-ubah, terutama dalam orkestrasi multiagen, di mana berbagai agen mengoordinasikan rencana mereka untuk mencapai tujuan kompleks sekaligus mempertahankan skalabilitas untuk menangani berbagai tugas besar dan beragam.
4. Tindakan: melaksanakan keputusan
Tindakan adalah cara agen berinteraksi dengan dunia, baik dengan menyelesaikan tugas, mengumpulkan informasi, atau berkomunikasi. Sistem ini menggunakan memori dan perencanaan untuk memandu eksekusi, menggunakan berbagai alat jika perlu, dan menyesuaikan keadaan internalnya berdasarkan hasil untuk perbaikan berkelanjutan. Mengoptimalkan algoritma eksekusi tindakan memastikan efisiensi, terutama ketika mengintegrasikan model penalaran yang didukung GPT dan teknik gen AI untuk pengambilan keputusan secara real-time.
Dengan menggabungkan semua komponen ini, kerangka kerja mengubah LLM menjadi agen yang dapat beradaptasi dan mampu menggunakan nalar, belajar, dan melakukan tugas secara mandiri. Desain modular ini membuatnya sangat cocok untuk aplikasi seperti layanan pelanggan, bantuan penelitian, dan pemecahan masalah kreatif.
Tutorial ini menunjukkan pembuatan agen pengetahuan yang dapat ditanya, yang dirancang untuk memproses dokumen teks besar (seperti buku) dan menjawab kueri pengguna dengan akurat. Menggunakan model IBM Granite dan LangChain, agen dibangun mengikuti prinsip yang diuraikan dalam kerangka kerja untuk agen otonom berbasis LLM. Komponen kerangka kerja ini selaras dengan lancar dengan alur kerja agen untuk memastikan adaptabilitas dan respons cerdas.
Mari kita pahami bagaimana kerangka kerja berlaku dalam contoh penggunaan kita.
Profil: Agen ini dirancang dengan profil "asisten pengetahuan", berfokus pada tugas perangkuman, menjawab pertanyaan, dan penalaran. Konteksnya dipersonalisasi untuk memproses dokumen tertentu (misalnya, The Adventures of Sherlock Holmes).
Memori: Agen menggunakan memori hybrid dengan menanamkan potongan buku ke dalam penyimpanan vektor FAISS. Kemampuan ini memungkinkannya untuk mengambil konteks yang relevan secara dinamis selama kueri diajukan. Operasi memori seperti membaca (pengambilan) dan menulis (memperbarui penanaman) memastikan bahwa agen dapat beradaptasi dengan kueri baru dari waktu ke waktu.
Perencanaan: Penyelesaian kueri melibatkan penalaran jalur tunggal. Agen mengambil potongan teks yang relevan, menghasilkan jawaban menggunakan Granite LLM dari IBM, dan mengevaluasi output untuk akurasi. Perencanaan tanpa masukan memastikan kesederhanaan, sementara modularitas sistem memungkinkan siklus masukan untuk diintegrasikan dalam iterasi mendatang.
Tindakan: Agen melaksanakan penyelesaian kueri dengan mengintegrasikan pengambilan memori dan pemrosesan LLM. Agen menyelesaikan berbagai tugas seperti menghasilkan jawaban, menghitung metrik akurasi (BLEU, presisi, recall, dan skor F1), dan memvisualisasikan hasil untuk ditafsirkan pengguna. Output ini mencerminkan kemampuan agen untuk bertindak cerdas berdasarkan penalaran dan perencanaan.
Anda memerlukan akun IBM® Cloud untuk membuat proyek watsonx.ai .
Meskipun terdapat pilihan beberapa alat, tutorial ini akan memandu Anda untuk menyiapkan akun IBM menggunakan Jupyter Notebook.
Langkah ini akan membuka lingkungan notebook tempat Anda dapat menyalin kode dari tutorial ini. Atau, Anda dapat mengunduh aplikasi notebook ini ke sistem lokal Anda dan mengunggahnya ke proyek watsonx.ai sebagai aset. Untuk melihat tutorial Granite lain, lihat Komunitas Granite IBM. Tutorial ini juga tersedia di GitHub.
Untuk bekerja dengan kerangka kerja LangChain dan mengintegrasikan IBM WatsonXLLM, kita perlu menginstal beberapa pustaka penting. Mari kita mulai dengan menginstal paket yang diperlukan:
Catatan: Jika Anda menggunakan versi lama
Di sel kode sebelumnya,
Langkah ini memastikan bahwa lingkungan Anda siap untuk berbagai tugas selanjutnya.
Sekarang setelah menginstal pustaka yang diperlukan, mari kita impor modul yang diperlukan untuk tutorial ini:
Di sel kode sebelumnya,
Langkah ini menyiapkan semua alat dan modul yang kita butuhkan untuk memproses teks, membuat penanaman, menyimpannya dalam basis data vektor, dan berinteraksi dengan WatsonxLLM dari IBM.
Kode ini menyiapkan kredensial untuk mengakses API IBM Watson machine learning (WML) dan memastikan bahwa ID proyek dikonfigurasi dengan benar.
Kode ini mengawali IBM WatsonXLLM untuk digunakan dalam aplikasi:
Langkah ini mempersiapkan WatsonXLLM untuk menghasilkan respons dalam alur kerja.
Untuk memproses teks dari dokumen, kita memerlukan fungsi yang dapat membaca dan mengekstrak isinya. Fungsi berikut dirancang untuk menangani file teks biasa:
Fungsi ini,
Seluruh konten file dibaca menjadi variabel bernama
Fungsi ini memungkinkan kita untuk memproses file input (The Adventures of Sherlock Holmes) dan mengekstrak kontennya untuk operasi lebih lanjut seperti pemotongan teks dan penanaman. Ini memastikan bahwa teks mentah tersedia untuk dianalisis.
Untuk memproses dan mengindeks blok teks besar secara efisien, kita perlu membagi teks menjadi potongan yang lebih kecil dan dapat dikelola. Fungsi berikut menangani tugas ini:
Kemampuan
Fungsi ini memastikan kelangsungan kontekstual di seluruh potongan. Fungsi ini memanfaatkan
Hal ini sangat penting saat bekerja dengan dokumen besar, karena model bahasa sering kali memiliki batasan token dan tidak dapat memproses teks yang panjang secara langsung.
Untuk memungkinkan pencarian semantik yang efisien, kita perlu mengubah potongan teks menjadi penanaman vektor dan menyimpannya dalam indeks yang dapat dicari. Langkah ini menggunakan penanaman FAISS dan HuggingFace untuk membuat indeks vektor, yang menjadi dasar untuk mengambil informasi relevan berdasarkan kueri.
Kemampuan
Pertama, awali model HuggingFaceEmbeddings
Fungsi tersebut kemudian menggunakan
Hasil penyimpanan vektor ditampilkan dan akan digunakan untuk menemukan potongan yang relevan berdasarkan kueri pengguna, menjadi fondasi bagi proses pencarian dan pengambilan data oleh agen.
Langkah ini melibatkan meminta indeks vektor untuk mengambil informasi yang relevan dan menggunakan Granite LLM IBM untuk menghasilkan respons yang disempurnakan. Dengan mengintegrasikan pencarian kemiripan dan penalaran LLM, fungsi ini menyediakan proses penyelesaian kueri yang dinamis dan cerdas.
Kemampuan
Pencarian kemiripan akan dilakukan terlebih dahulu pada indeks vektor untuk mengambil potongan teks yang paling relevan. Semua potongan ini yang disebut sebagai
Fungsi kemudian membuat prompt dengan menggabungkan kueri dan konteks yang diambil. Prompt ini diteruskan ke
Sepanjang proses, langkah-langkah perantara seperti
Akhirnya, fungsi ini menampilkan sebuah kamus yang berisi semua komponen, termasuk proses berpikir, tindakan yang dilakukan, pengamatan yang diambil, dan jawaban akhir.
Langkah ini penting untuk mengubah pengambilan data mentah menjadi insight yang dapat ditindaklanjuti dan bermakna dengan menggunakan kemampuan penalaran LLM.
Langkah ini secara dinamis memproses beberapa kueri, mengambil informasi yang relevan, dan menyimpan hasil dalam format terstruktur untuk dianalisis. Fungsi ini mengintegrasikan kemampuan kueri, penyusunan data, dan ekspor.
Kemampuan
Untuk setiap kueri menggunakan
Setelah semua kueri diproses, daftar hasil diubah menjadi panel data DataFrame. Format tabel ini memungkinkan analisis dan visualisasi hasil kueri yang mudah. DataFrame dicetak untuk ditinjau dan disimpan sebagai file CSV untuk digunakan pada masa mendatang.
Langkah ini sangat penting untuk menata output dalam format yang mudah digunakan, sehingga memudahkan berbagai tugas selanjutnya seperti evaluasi akurasi dan visualisasi.
Langkah ini menggabungkan semua langkah sebelumnya ke dalam satu alur kerja untuk memproses file teks, menjawab kueri pengguna, dan menyimpan hasil dalam format terstruktur. Fungsi
Mari kita pahami bagaimana alur kerja ini dijalankan:
Masukkan file teks:
Ekstraksi teks:
Pemotongan teks: Teks yang diekstrak dibagi menjadi potongan yang lebih kecil menggunakan
Buat indeks vektor: Potongan teks diubah menjadi penanaman dan disimpan dalam
Tetapkan kueri: Daftar sampel kueri disediakan, masing-masing dirancang untuk mengambil informasi spesifik dari teks. Kueri ini akan dijawab oleh agen.
Proses kueri: Fungsi
Langkah ini mengintegrasikan semua komponen tutorial ke dalam alur kerja yang kohesif. Langkah ini mengotomatiskan proses dari ekstraksi teks ke penyelesaian kueri, sehingga Anda dapat menguji kemampuan agen dan memeriksa hasil dalam format terstruktur.
Untuk menjalankan alur kerja, cukup panggil
Output
> Entering new AgentExecutor chain... Thought: The query 'What is the plot of 'A Scandal in Bohemia'?' requires context from the book to provide an accurate response. Action: Search FAISS Vector Store Action Input: "What is the plot of 'A Scandal in Bohemia'?" Observation: I. A SCANDAL IN BOHEMIA I. “I was aware of it,” said Holmes dryly. “The circumstances are of great delicacy, and every precaution has to be taken to quench what might grow to be an immense scandal and seriously compromise one of the reigning families of Europe. To speak plainly, the matter implicates the great House of Ormstein, hereditary kings of Bohemia.” “I was also aware of that,” murmured Holmes, settling himself down in his armchair and closing his eyes. Contents I. A Scandal in Bohemia II. The Red-Headed League III. A Case of Identity IV. The Boscombe Valley Mystery V. The Five Orange Pips VI. The Man with the Twisted Lip VII. The Adventure of the Blue Carbuncle VIII. The Adventure of the Speckled Band IX. The Adventure of the Engineer’s Thumb X. The Adventure of the Noble Bachelor XI. The Adventure of the Beryl Coronet XII. The Adventure of the Copper Beeches Thought: Combining retrieved context with the query to generate a detailed answer. /var/folders/4w/smh16qdx6l98q0534hr9v52r0000gn/T/ipykernel_2648/234523588.py:23: LangChainDeprecationWarning: The method `BaseLLM.__call__` was deprecated in langchain-core 0.1.7 and will be removed in 1.0. Use :meth:`~invoke` instead. final_answer = llm(prompt) Final Answer: Step 1: Identify the main characters and their roles. - Sherlock Holmes: The detective who is approached by a client with a delicate matter. - An unnamed client: A representative of the great House of Ormstein, hereditary kings of Bohemia, who seeks Holmes' help to prevent a potential scandal. Step 2: Understand the main issue or conflict. - The main issue is a delicate matter that, if exposed, could lead to a massive scandal and compromise one of the reigning families of Europe, specifically the House of Ormstein. Step 3: Ident > Finished chain. > Entering new AgentExecutor chain... Thought: The query 'Who is Dr. Watson, and what role does he play in the stories?' requires context from the book to provide an accurate response. Action: Search FAISS Vector Store Action Input: "Who is Dr. Watson, and what role does he play in the stories?" Observation: “Sarasate plays at the St. James’s Hall this afternoon,” he remarked. “What do you think, Watson? Could your patients spare you for a few hours?” “I have nothing to do to-day. My practice is never very absorbing.” “Try the settee,” said Holmes, relapsing into his armchair and putting his fingertips together, as was his custom when in judicial moods. “I know, my dear Watson, that you share my love of all that is bizarre and outside the conventions and humdrum routine of everyday life. You have shown your relish for it by the enthusiasm which has prompted you to chronicle, and, if you will excuse my saying so, somewhat to embellish so many of my own little adventures.” “My God! It’s Watson,” said he. He was in a pitiable state of reaction, with every nerve in a twitter. “I say, Watson, what o’clock is it?” “Nearly eleven.” “Of what day?” “Of Friday, June 19th.” “Good heavens! I thought it was Wednesday. It is Wednesday. What d’you want to frighten a chap for?” He sank his face onto his arms and began to sob in a high treble key. “I tell you that it is Friday, man. Your wife has been waiting this two days for you. You should be ashamed of yourself!” Thought: Combining retrieved context with the query to generate a detailed answer. Final Answer: Dr. Watson is a character in the Sherlock Holmes stories, written by Sir Arthur Conan Doyle. He is a former military surgeon who becomes the narrator and chronicler of Holmes' adventures. Watson is a close friend and confidant of Holmes, often accompanying him on cases and providing a more human perspective to the stories. He is known for his enthusiasm for the bizarre and unconventional, as well as his skill in recording the details of their investigations. Watson's role is crucial in presenting the narrative and offering insights into Holmes' character and methods. > Finished chain. Final DataFrame: Thought \ 0 The query 'What is the plot of 'A Scandal in B... 1 The query 'Who is Dr. Watson, and what role do... 2 The query 'Describe the relationship between S... 3 The query 'What methods does Sherlock Holmes u... Action \ 0 Search FAISS Vector Store 1 Search FAISS Vector Store 2 Search FAISS Vector Store 3 Search FAISS Vector Store Action Input \ 0 What is the plot of 'A Scandal in Bohemia'? 1 Who is Dr. Watson, and what role does he play ... 2 Describe the relationship between Sherlock Hol... 3 What methods does Sherlock Holmes use to solve... Observation \ 0 I. A SCANDAL IN BOHEMIA\n\n\nI.\n“I was aware ... 1 “Sarasate plays at the St. James’s Hall this a... 2 “You have really got it!” he cried, grasping S... 3 to learn of the case was told me by Sherlock H... Final Answer 0 Step 1: Identify the main characters and their... 1 Dr. Watson is a character in the Sherlock Holm... 2 Sherlock Holmes and Irene Adler have a profess... 3 Sherlock Holmes uses a variety of methods to s... Output saved to output.csv
Setelah menjalankan
Selain itu, hasil untuk semua kueri telah disusun menjadi DataFrame dan disimpan sebagai
Dalam proses ini, kami menggabungkan pengambilan teks dengan penalaran LLM untuk menjawab pertanyaan kompleks tentang buku tersebut. Agen mengambil informasi yang relevan secara dinamis, menggunakan konteks untuk menghasilkan jawaban yang akurat, dan menyusun output dalam format terstruktur untuk memudahkan analisis.
Dengan output yang dibuat, kita sekarang akan melanjutkan untuk memvisualisasikan hasil kueri dan metrik akurasi terkait sehingga memberikan insight yang lebih dalam tentang kinerja agen.
Di sel kode berikut, kita memuat hasil kueri yang disimpan dari
OUTPUT
Thought \ 0 The query 'What is the plot of 'A Scandal in B... 1 The query 'Who is Dr. Watson, and what role do... 2 The query 'Describe the relationship between S... 3 The query 'What methods does Sherlock Holmes u... Action \ 0 Search FAISS Vector Store 1 Search FAISS Vector Store 2 Search FAISS Vector Store 3 Search FAISS Vector Store Action Input \ 0 What is the plot of 'A Scandal in Bohemia'? 1 Who is Dr. Watson, and what role does he play ... 2 Describe the relationship between Sherlock Hol... 3 What methods does Sherlock Holmes use to solve... Observation \ 0 I. A SCANDAL IN BOHEMIA\n\n\nI.\n“I was aware ... 1 “Sarasate plays at the St. James’s Hall this a... 2 “You have really got it!” he cried, grasping S... 3 to learn of the case was told me by Sherlock H... Final Answer 0 Step 1: Identify the main characters and their... 1 Dr. Watson is a character in the Sherlock Holm... 2 Sherlock Holmes and Irene Adler have a profess... 3 Sherlock Holmes uses a variety of methods to s...
Dalam kode ini, DataFrame menyertakan komponen utama seperti
Untuk membuat visualisasi hasil kueri, kita mengimpor pustaka yang diperlukan:
Catatan penting: Jika Anda menemui kesalahan
Kode ini membuat diagram batang horizontal untuk membandingkan panjang pengamatan (konteks yang diambil) dan jawaban (tanggapan yang dihasilkan) untuk setiap kueri. Visualisasi ini memberikan insight tentang seberapa banyak konteks yang digunakan agen dibandingkan dengan panjang jawaban yang dibuat.
Fungsi ini,
Fungsi ini menghitung panjang karakter dari pengamatan dan jawaban, menambahkannya sebagai kolom baru (
Grafik batang ini menggunakan kode warna untuk membedakan antara durasi pengamatan dan panjang jawaban, serta dilengkapi dengan label, legenda, dan judul untuk kejelasan.
Visualisasi ini membantu menganalisis keseimbangan antara ukuran konteks yang diambil dan tingkat detail dalam respons yang dibuat, memberikan insight tentang cara agen memproses dan merespons kueri.
Langkah ini menggambarkan berapa banyak teks total yang diproses oleh agen yang digunakan dalam pengamatan (konteks yang diambil) dibandingkan dengan teks yang tersisa. Diagram lingkaran dibuat untuk memberikan representasi intuitif dari proporsi.
Kemampuan
Data ini divisualisasikan dalam diagram lingkaran dengan label yang jelas untuk
Visualisasi ini memberikan gambaran umum tingkat tinggi tentang berapa banyak teks yang digunakan agen sebagai konteks selama pemrosesan kueri, sehingga memberikan insight tentang efisiensi dan fokus proses pengambilan informasi.
Kode ini menghasilkan dua awan kata untuk menampilkan secara visual kata-kata yang paling sering muncul dalam
Kode ini menghasilkan dua awan kata untuk menampilkan secara visual kata-kata yang paling sering muncul dalam
Untuk membuat visualisasi berdampingan, subplot digunakan: subplot pertama menampilkan awan kata untuk
Di bagian ini, kita mengevaluasi kinerja agen menggunakan beberapa metrik akurasi:
Sebelum memulai pengujian, kita mengimpor pustaka yang diperlukan untuk mengevaluasi akurasi.
Pustaka ini mencakup alat untuk pencocokan kata kunci, perhitungan skor BLEU, evaluasi presisi dan recall. Pastikan Anda telah menginstal pustaka ini di lingkungan Anda untuk menghindari kesalahan pengimporan.
Tes ini mengevaluasi seberapa baik jawaban yang dibuat menyertakan kata kunci dari kueri. Tes ini menggunakan
Pengujian ini mengukur sejauh mana jawaban yang dibuat cocok dengan pengamatan yang diambil.
Presisi dan recall dihitung untuk mengevaluasi relevansi dan kelengkapan jawaban. Presisi mengukur proporsi kata-kata diambil yang relevan dalam jawaban, sementara recall mengukur proporsi kata-kata relevan dalam pengamatan yang muncul dalam jawaban.
Metrik ini ditambahkan ke DataFrame di bawah
Skor F1 menggabungkan presisi dan recall menjadi satu metrik tunggal, memberikan evaluasi yang seimbang atas relevansi dan kelengkapan. Rumus untuk skor F1 adalah:
Skor
Terakhir, fungsi ringkasan mengonsolidasikan semua metrik untuk memberikan gambaran umum tentang kinerja agen. Fungsi ini menghitung jumlah total kueri, jumlah dan persentase respons yang akurat, serta skor rata-rata BLEU dan F1.
OUTPUT
Total Entries: 4 Accurate Entries: 4 (100.00%) Average BLEU Score: 0.04 Average F1 Score: 0.24
Tes akurasi ini menawarkan evaluasi terperinci tentang kemampuan agen untuk membuat respons yang relevan dan akurat. Setiap tes berfokus pada aspek tertentu, mulai dari penyertaan kata kunci hingga kemiripan teks dan kelengkapan respons. Ringkasan mengonsolidasikan metrik ini untuk memberikan cuplikan kinerja secara keseluruhan.
Tutorial ini memandu Anda untuk membangun agen otonom yang didukung oleh Granite LLM dan LangChain IBM. Mulai dari ekstraksi teks hingga vektorisasi dan penyelesaian kueri, kami telah mencakup seluruh proses desain dan implementasi agen berbasis LLM yang berfungsi. Langkah-langkah utama termasuk manajemen memori dengan penyimpanan vektor, pemrosesan kueri, dan pembuatan respons menggunakan Granite.
Kita mengevaluasi kinerja agen dengan menggunakan metrik akurasi seperti pencocokan kata kunci, skor BLEU, presisi, recall, dan skor F1. Visualisasi seperti diagram batang, diagram lingkaran, dan awan kata memberikan insight tambahan mengenai perilaku dan efektivitas agen.
Dengan menyelesaikan tutorial ini, Anda mempelajari cara merancang, menguji, dan memvisualisasikan kinerja agen LLM. Fondasi ini dapat diperluas untuk menangani kumpulan data yang lebih kompleks, meningkatkan akurasi, dan menjelajahi berbagai fitur canggih seperti sistem multiagen.
Bangun, terapkan, dan kelola asisten dan agen AI yang kuat yang mengotomatiskan alur kerja dan proses dengan AI generatif.
Bangun masa depan bisnis Anda dengan solusi AI yang dapat Anda percaya.
Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.