大型语言模型 (LLM) 中的工具调用是 LLM 与外部工具、服务或 API 交互以执行任务的能力。这使得 LLM 可以扩展其功能，增强处理现实世界任务的能力，这些任务可能需要访问外部数据、实时信息或特定应用程序。当 LLM 使用 Web 搜索工具时，它可以调用 Web 来获取模型训练数据中没有的实时数据。其他类型的工具可能包括用于计算、数据分析或可视化的 Python，或者用于获取数据的服务端点调用。工具调用可以让聊天机器人更加灵活和适应性更强，使其能够基于实时数据或超出其直接知识库的专门任务，提供更准确、更相关和更详细的回答。流行的工具调用框架包括 Langchain 和现在的 ollama。

Ollama 是一个提供开源、本地 AI 模型的平台，可在个人设备上使用，这样用户就可以直接在电脑上运行 LLM。与 OpenAI API 等服务不同的是，由于模型在本地机器上，因此无需帐户。Ollama 注重隐私、性能和易用性，使用户能够访问 AI 模型并与之交互，而无需将数据发送到外部服务器。这对于关注数据隐私的人或希望避免依赖外部 API 的人来说特别有吸引力。Ollama 平台易于设置和使用，并且支持各种模型，为用户提供了一系列工具，用于直接在自己的硬件上执行自然语言处理、代码生成和其他 AI 任务。该平台非常适合工具调用架构，因为它可以访问本地环境的所有功能，包括数据、程序和自定义软件。

在本教程中，您将学习如何通过使用 ollama 查看本地文件系统来设置工具调用，而这项任务对于远程 LLM 来说很难完成。许多 llama 模型可用于工具调用和构建 AI 智能体，例如 Mistral 和 Llama 3.2，完整列表可在 llama 网站上找到。在这种情况下，我们将使用具有工具支持的 IBM Granite 3.2 Dense。2B 和 8B 模型是经过训练的纯文本密集型 LLM，旨在支持基于工具的用例和检索增强生成 (RAG)，简化代码生成、翻译和错误修复。

本教程的笔记本可从 Github 下载 点击此处。