Apa itu pemanggilan alat?

Penyusun

Cole Stryker

Staff Editor, AI Models

IBM Think

Apa yang dimaksud dengan pemanggilan alat?

Pemanggilan alat merujuk pada kemampuan model kecerdasan buatan (AI) untuk berinteraksi dengan alat eksternal, antarmuka pemrograman aplikasi (APIs) atau sistem untuk meningkatkan fungsinya.

Sistem AI dengan kemampuan pemanggilan alat tidak hanya mengandalkan pengetahuan yang telah dilatih, melainkan juga dapat mengajukan pertanyaan pada basis data, mengambil informasi real-time, menjalankan fungsi, atau melakukan operasi kompleks yang melebihi kemampuan aslinya.

Pemanggilan alat, terkadang disebut sebagai pemanggilan fungsi, adalah pendorong utama AI agen. Kemampuan ini memungkinkan sistem otonom untuk menyelesaikan berbagai tugas kompleks dengan mengakses dan bertindak secara dinamis pada sumber daya eksternal.

Alih-alih hanya menjawab pertanyaan, model bahasa besar (LLM) dengan pemanggilan alat dapat mengotomatiskan alur kerja, berinteraksi dengan basis data, melakukan pemecahan masalah dalam banyak langkah, membuat keputusan real-time, dan banyak lagi.

Pergeseran ini mengubah LLM dari asisten pasif menjadi agen digital proaktif yang mampu melaksanakan berbagai tugas kompleks.

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Mengapa pemanggilan alat penting?

Model bahasa besar (LLM) biasanya dibatasi oleh data yang digunakan untuk melatihnya, sebuah proses yang dapat memakan waktu dan melibatkan komputasi yang kompleks.

Meskipun LLM terkemuka dilatih pada kumpulan data yang luas, kebutuhan akan komputasi eksternal dengan data real-time dan interaksi yang ditingkatkan mengarah pada integrasi kemampuan pemanggilan alat.

LLM awal, termasuk GPT-2 OpenAI, bersifat statis. Mereka menghasilkan respons berdasarkan data pelatihan mereka tanpa kemampuan untuk mengambil informasi baru.

Meskipun mengesankan, mereka kurang memahami situasi nyata dan sulit mengatasi kueri yang dinamis yang membutuhkan data langsung, seperti peristiwa terkini, harga saham, atau tindakan spesifik pengguna.

Untuk mengatasi keterbatasan ini, para pengembang mulai mengintegrasikan plug-in eksternal, API, dan basis data, yang memungkinkan model untuk meminta dan memproses informasi waktu nyata daripada hanya mengandalkan data pelatihan statis.

Pengembang melatih LLM untuk mengenali kapan kueri memerlukan bantuan eksternal. Selain itu, sistem eksternal sering kali memiliki skema input tertentu. Pemanggilan alat meminta respons model yang sesuai dengan skema tertentu yang digunakan oleh sistem eksternal.

Agen AI

5 Jenis Agen AI: Fungsi Otonom & Aplikasi Dunia Nyata

Pelajari bagaimana AI berbasis tujuan dan berbasis utilitas beradaptasi dengan alur kerja dan lingkungan yang kompleks.

Bagaimana cara kerja pemanggilan alat?

Pemanggilan alat melibatkan beberapa komponen utama yang bekerja sama untuk memfasilitasi interaksi AI dengan alat eksternal. LLM modern termasuk Claude dari Anthropic, Llama 3 dari Meta, Mistral, dan IBM® Granite, semuanya memiliki kemampuan pemanggilan alat tetapi masing-masing menanganinya dengan sedikit berbeda.

Komponen pertamanya adalah model AI itu sendiri, yang mengenali kapan dirinya tidak memiliki pengetahuan yang cukup atau memerlukan fungsi eksternal untuk menyelesaikan permintaan.

Selanjutnya, mekanisme pemilihan alat mengidentifikasi ketergantungan yang sesuai untuk menangani tugas tertentu, apakah itu mesin pencari, basis data, atau sumber daya komputasi.

Ketika sebuah alat dipilih, antarmuka API ikut berperan, memungkinkan AI untuk mengirim kueri terstruktur dan menerima respons dalam format yang dapat dibaca mesin.

Terakhir, sistem pemrosesan respons membantu memastikan bahwa data yang diambil diformat dengan benar dan disajikan kepada pengguna dengan cara yang bermakna.

Langkah 1. Mengenali kebutuhan akan alat

Katakanlah seorang pengguna bertanya kepada LLM “Bagaimana cuaca di San Francisco sekarang?” AI menggunakan natural language understanding untuk mengenali bahwa data cuaca real-time diperlukan, yang tidak dapat diperoleh dari basis pengetahuan statisnya.

ID pemanggilan alat yang unik diberikan secara otomatis pada permintaan yang dibuat oleh model untuk menggunakan alat, yang bertindak sebagai nomor pelacakan untuk menghubungkan permintaan dengan hasil yang sesuai.

Langkah 2. Memilih alat

AI mengidentifikasi alat terbaik untuk tugas tersebut, dalam hal ini memeriksa basis data cuaca terkini. Langkah ini membantu memastikan bahwa informasi yang diambil akurat dan relevan.

Setiap alat berisi metadata dan informasi terstruktur seperti nama alat unik (atau nama fungsi), yang membantu model dan sistem mengidentifikasinya dengan benar. Metadata lainnya termasuk deskripsi, parameter alat, serta jenis input dan output yang diperlukan.

Model ini melakukan pemilihan alat setelah menentukan bahwa data harus diperoleh dari pilihan alat yang tersedia.

Templat adalah format prompt terstruktur yang memberi tahu model alat mana yang akan digunakan dan argumen (atau "arg") apa yang harus diberikan, yang memungkinkan interaksi yang lebih terkendali dan terstruktur dengan API.

Dalam konteks pemanggilan alat, argumen merujuk pada input terstruktur yang diteruskan ke alat atau fungsi ketika dimulai oleh model generatif. Argumen ini menentukan parameter yang diperlukan alat untuk menjalankannya dengan benar.

Menggabungkan pemanggilan alat dengan generasi dengan dukungan pengambilan data (RAG) meningkatkan kemampuan AI dengan memungkinkan sistem untuk mengambil data terstruktur dan tidak terstruktur sebelum menghasilkan output terstruktur.

Pendekatan ini meningkatkan relevansi kontekstual dengan mengambil data yang paling relevan sebelum menghasilkan respons, yang mengarah pada output yang lebih terinformasi dan akurat.

Ini juga meminimalkan overhead API dengan mengonsolidasikan beberapa pengambilan menjadi satu langkah, mengurangi latensi dan biaya. RAG lebih fleksibel daripada pemanggilan alat tradisional, memungkinkan model untuk mengambil dari berbagai sumber dan membuatnya sangat mudah beradaptasi di berbagai domain.

Berbeda dengan struktur kaku penggunaan alat tradisional, RAG memungkinkan integrasi pengetahuan yang diambil yang lebih lancar dengan penalaran dan generasi, menghasilkan respons yang lebih dinamis dengan insight yang luas.

Langkah 3. Membuat dan mengirim kueri

AI kemudian merumuskan permintaan terstruktur yang dapat dipahami oleh alat atau API.

Setiap alat dikaitkan dengan fungsi alat tertentu, yang mendefinisikan apa yang dilakukan alat tersebut. Fungsi-fungsi ini bergantung pada referensi API, yang menyediakan dokumentasi tentang cara berinteraksi dengan API alat, termasuk URL titik akhir, metode permintaan, dan format respons.

Untuk mengakses API eksternal, banyak layanan memerlukan kunci API, pengenal unik yang memberikan izin untuk membuat permintaan. Ketika alat dipilih dan parameter ditetapkan, panggilan API dibuat untuk mengambil data yang diminta. Permintaan ini biasanya dikirim melalui HTTP ke server eksternal.

Langkah 4. Menerima dan memproses tanggapan

Alat eksternal mengembalikan data. AI kemudian harus mengurai hasil alat. Untuk permintaan cuaca, API mungkin merespons dengan objek skema JSON yang berisi suhu, kelembapan, dan kecepatan angin. AI menyaring dan menyusun data ini untuk meringkas respons yang bermakna bagi pengguna.

Langkah 5. Menyajikan informasi atau mengambil tindakan

AI memberikan informasi yang diproses dengan cara yang intuitif. Jika permintaan melibatkan otomatisasi, seperti pengaturan pengingat, AI akan mengonfirmasi bahwa tindakan telah dijadwalkan.

Langkah 6. Menyempurnakan pencarian

Jika pengguna meminta detail atau modifikasi lebih lanjut, AI dapat mengulangi proses dengan kueri yang disesuaikan, membantu memastikan untuk terus menyempurnakan responsnya berdasarkan kebutuhan pengguna.

LangChain umumnya digunakan dalam pemanggilan alat dengan menyediakan sumber terbuka kerangka kerja untuk mengintegrasikan alat eksternal, API, dan fungsi dengan LLM. Ini membantu mengelola eksekusi alat, penanganan input atau output, dan pengambilan keputusan yang sadar konteks.

Sebagai contoh, LangChain menangani argumen fungsi dengan pengurai untuk kueri pengguna, mengekstrak parameter yang relevan dan memformatnya dengan benar untuk alat ini. Tidak seperti pemanggilan alat sederhana, LangChain dapat menyimpan dan memanggil kembali output alat sebelumnya, sehingga memungkinkan interaksi multigiliran yang lebih baik.

LangChain memungkinkan kombinasi beberapa alat dalam satu urutan, memungkinkan alur kerja yang lebih kompleks. Misalnya, pertama-tama dapat mengambil data dari API cuaca dan kemudian menggunakan alat terpisah untuk merekomendasikan pakaian berdasarkan perkiraan cuaca.

Jenis pemanggilan alat

Pemanggilan alat memungkinkan LLM untuk melakukan semua jenis tugas. Ada contoh penggunaan tanpa batas untuk aplikasi AI yang menggunakan pemanggilan alat, tetapi berikut adalah 5 kategori dengan beberapa contoh dunia nyata.

Pengambilan dan pencarian informasi

AI mengambil data real-time dari web, sumber berita, database akademik, atau pasar keuangan. Misalnya, model obrolan AI dapat memanggil API pencarian untuk menyediakan harga saham terbaru atau artikel penelitian AI dan menyampaikan informasi melalui chatbot

Eksekusi kode

Hal ini memungkinkan AI untuk melakukan perhitungan kompleks atau menjalankan skrip menggunakan mesin matematika seperti lingkungan eksekusi Wolfram Alpha atau Python. Ini berguna untuk memecahkan persamaan, menjalankan simulasi, atau mengeksekusi cuplikan kode kecil.

Otomatisasi Proses

AI mengotomatiskan alur kerja seperti penjadwalan rapat, pengiriman email, atau pengelolaan daftar tugas melalui integrasi dengan platform seperti Google Calendar dan Zapier. Agen AI dapat berinteraksi dengan CRM, keuangan, dan alat analitik seperti Salesforce dan QuickBooks, yang memungkinkan bisnis untuk mengotomatiskan proses termasuk pengambilan data pelanggan atau pelaporan keuangan.

Perangkat pintar dan pemantauan IoT

Sistem AI agen dapat memantau dan mengontrol sistem otomatisasi rumah, perangkat IoT industri, dan robotika. Kita dapat dengan mudah membayangkan bahwa suatu hari seluruh alur kerja ujung ke ujung ditangani oleh agen otonom.

Solusi terkait
Agen AI untuk bisnis

Bangun, terapkan, dan kelola asisten dan agen AI yang kuat yang mengotomatiskan alur kerja dan proses dengan AI generatif.

    Menjelajahi watsonx Orchestrate
    Solusi agen AI IBM

    Bangun masa depan bisnis Anda dengan solusi AI yang dapat Anda percaya.

    Jelajahi solusi agen AI
    Layanan AI IBM Consulting

    Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.

    Jelajahi layanan kecerdasan buatan
    Ambil langkah selanjutnya

    Baik Anda memilih untuk menyesuaikan aplikasi dan keterampilan yang dibangun sebelumnya atau membangun dan menerapkan layanan agen khusus menggunakan studio AI, platform IBM watsonx siap membantu Anda.

    Menjelajahi watsonx Orchestrate Jelajahi watsonx.ai