Il tool calling nei modelli linguistici di grandi dimensioni (LLM) è la capacità dell'LLM di interagire con strumenti, servizi o API esterni per eseguire attività. Ciò consente agli LLM di estendere le loro funzionalità, migliorando la loro capacità di gestire attività reali che potrebbero richiedere l'accesso a dati esterni, informazioni in tempo reale o applicazioni specifiche. Quando un LLM utilizza uno strumento di ricerca web, può richiamare il web per recuperare dati in tempo reale che non sono disponibili nei dati di addestramento del modello. Altri tipi di strumenti potrebbero includere Python per i calcoli, l'analisi o la visualizzazione dei dati o la chiamata a un endpoint di servizio per i dati. Il tool calling possono rendere un chatbot più dinamico e adattabile, consentendogli di fornire risposte più accurate, pertinenti e dettagliate sulla base di dati in tempo reale o attività specializzate al di fuori della sua base di conoscenza immediata. I framework più diffusi per il tool calling includono Langchain e ora Ollama.

Ollama è una piattaforma che offre modelli AI open source da utilizzare su dispositivi personali in modo che gli utenti possano eseguire gli LLM direttamente sui propri computer. A differenza di un servizio come l'API OpenAI, non è necessario un account poiché il modello si trova sul computer locale. Ollama si concentra sulla privacy, sulle prestazioni e sulla facilità d'uso, consentendo agli utenti di accedere e interagire con i modelli AI senza inviare dati a server esterni. Questo può essere particolarmente interessante per chi è preoccupato per la privacy dei dati o che vuole evitare di fare affidamento su API esterne. La piattaforma di Ollama è progettata per essere facile da configurare e utilizzare e supporta vari modelli, offrendo agli utenti una gamma di strumenti per l'elaborazione del linguaggio naturale, la generazione di codice e altre attività di AI direttamente sul proprio hardware. È adatto a un'architettura di tool calling perché può accedere a tutte le funzionalità di un ambiente locale, inclusi dati, programmi e software personalizzato.

In questo tutorial imparerai come impostare il tool calling utilizzando Ollama per esaminare un file di sistema locale, un'attività che sarebbe difficile da eseguire con un LLM remoto. Molti modelli Ollama sono disponibili per il tool calling e la creazione di agenti AI come Mistral e Llama 3.2, un elenco completo è disponibile sul sito web Ollama. In questo caso utilizzeremo IBM Granite 3.2 Dense che supporta gli strumenti. I modelli 2B e 8B sono LLM ad alta densità di testo addestrati su cui sono stati addestrati e progettati per supportare casi d'uso basati su strumenti e per la retrieval-augmented generation (RAG), che semplificano la generazione di codice, la traduzione e la correzione dei bug.

Il notebook per questo tutorial può essere scaricato da Github qui.