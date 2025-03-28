L’appel d’outil dans les grands modèles de langage (LLM) est la capacité du LLM à interagir avec des outils, services ou API externes pour effectuer des tâches. Cela permet aux LLM d’étendre leurs fonctionnalités et d’améliorer leur capacité à gérer des tâches du monde réel qui peuvent nécessiter l’accès à des données externes, à des informations en temps réel ou à des applications spécifiques. Lorsqu’un LLM utilise un outil de recherche Web, il peut appeler le Web pour récupérer des données en temps réel qui ne sont pas disponibles dans les données d’entraînement du modèle. D’autres types d’outils peuvent inclure Python pour les calculs, l’analyse de données ou la visualisation, ou l’appel d’un point de terminaison pour les données. L’appel d’outil peut rendre un chatbot plus dynamique et plus adaptable, lui permettant de fournir des réponses plus précises, pertinentes et détaillées sur la base de données en direct ou de tâches spécialisées ne relevant pas de sa base de connaissances immédiate. Parmi les frameworks populaires d’appel d’outil, citons notamment Langchain et maintenant Ollama.

Ollama est une plateforme qui propose des modèles d’IA open source pour une utilisation sur des appareils personnels qui permet aux utilisateurs d’exécuter des LLM directement sur leurs ordinateurs. Contrairement à un service tel que l’API OpenAI, il n’est pas nécessaire de créer un compte, car le modèle se trouve sur votre ordinateur local. Ollama se concentre sur la confidentialité, la performance et la facilité d’utilisation, permettant aux utilisateurs d’accéder et d’interagir avec des modèles IA sans envoyer de données à des serveurs externes. Cette approche peut être particulièrement intéressante pour les personnes soucieuses de la confidentialité des données ou qui souhaitent éviter de dépendre d’API externes. Facile à configurer et à utiliser, la plateforme d’Ollama prend en charge divers modèles, offrant aux utilisateurs une gamme d’outils pour le traitement automatique du langage naturel, la génération de code et d’autres tâches d’IA, directement sur leur propre matériel. Elle convient bien aux architectures d’appel d’outil, car elle permet d’accéder à toutes les capacités d’un environnement local, y compris les données, les programmes et les logiciels personnalisés.

Dans ce tutoriel, vous apprendrez à configurer l’appel d’outil en utilisant Ollama pour examiner un système de fichiers local, une tâche qui serait difficile à effectuer avec un LLM distant. De nombreux modèles Ollama sont disponibles pour l’appel d’outil et la création d’agents d’IA comme Mistral et Llama 3.2. Une liste complète est disponible sur le site Web d’Ollama. Dans ce cas, nous utiliserons IBM Granite 3.2 Dense qui est compatible avec les outils. Les modèles 2B et 8B sont des LLM denses textuels entraînés spécifiquement pour prendre en charge les cas d’utilisation basés sur des outils et pour la génération augmentée par récupération (RAG), rationalisant la génération de code, la traduction et la correction des bugs.

Le notebook pour ce tutoriel peut être téléchargé sur Github ici.