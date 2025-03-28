Tool-Calling in großen Sprachmodellen (LLMs) ist die Fähigkeit des LLM, mit externen Tools, Diensten oder APIs zu interagieren, um Aufgaben auszuführen. Dadurch kann die Funktionalität von LLMs erweitert und ihre Fähigkeit verbessert werden, reale Aufgaben zu bewältigen, die den Zugriff auf externe Daten, Echtzeitinformationen oder bestimmte Anwendungen erfordern. Wenn ein LLM ein Web-Suchtool verwendet, kann es das Web aufrufen, um Echtzeitdaten abzurufen, die in den Trainingsdaten des Modells nicht verfügbar sind. Andere Arten von Tools können Python für Berechnungen, Datenanalysen oder Visualisierung oder das Aufrufen eines Endgeräts für Daten enthalten. Durch Tool-Calling kann ein Chatbot dynamischer und anpassungsfähiger werden, sodass er genauere, relevantere und detailliertere Antworten auf der Grundlage von Live-Daten oder speziellen Aufgaben außerhalb seiner unmittelbaren Wissensbasis geben kann. Beliebte Frameworks für den Tool-Aufruf sind Langchain und jetzt auch ollama.

Ollama ist eine Plattform, die lokale Open-Source-KI-Modelle für den Einsatz auf persönlichen Geräten bereitstellt, sodass Benutzer LLMs direkt auf ihren Computern ausführen können. Im Gegensatz zu einem Dienst wie der OpenAI-API ist kein Konto erforderlich, da sich das Modell auf Ihrem lokalen Computer befindet. Ollama konzentriert sich auf Datenschutz, Leistung und Benutzerfreundlichkeit und ermöglicht Benutzern den Zugriff auf und die Interaktion mit KI-Modellen, ohne Daten an externe Server zu senden. Dies kann besonders für diejenigen attraktiv sein, die sich Gedanken über den Datenschutz machen oder die Abhängigkeit von externen APIs vermeiden möchten. Die Plattform von Ollama ist so konzipiert, dass sie einfach einzurichten und zu bedienen ist. Sie unterstützt verschiedene Modelle, um den Benutzern eine Reihe von Tools für die Verarbeitung natürlicher Sprache, die Generierung von Code und andere KI-Aufgaben direkt auf ihrer eigenen Hardware zur Verfügung zu stellen. Es eignet sich gut für eine Tool-Calling-Architektur, da es auf alle Funktionen einer lokalen Umgebung zugreifen kann, einschließlich Daten, Programme und benutzerdefinierte Software.

In diesem Tutorial erfahren Sie, wie Sie einen Tool-Aufruf einrichten, indem Sie mit ollama ein lokales Dateisystem durchsuchen – eine Aufgabe, die mit einem Remote-LLM nur schwer zu bewerkstelligen wäre. Viele Ollama-Modelle sind für den Aufruf von Tools und die Erstellung von KI-Agenten wie Mistral und Llama 3.2 verfügbar. Eine vollständige Liste finden Sie auf der Ollama-Website. In diesem Fall verwenden wir IBM Granite 3.2 Dense mit Tool-Unterstützung. Bei den 2B- und 8B-Modellen handelt es sich um dichte reine Text-LLMs, die auf toolbasierten Anwendungsfällen und für die Retrieval Augmented Generation (RAG) trainiert wurden, um die Codegenerierung, Übersetzung und Fehlerbehebung zu optimieren.

Das Notebook für dieses Tutorial kann hier von Github heruntergeladen werden.