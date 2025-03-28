A chamada de ferramentas em grandes modelos de linguagem (LLMs) é a capacidade do LLM de interagir com ferramentas, serviços ou APIs externos para executar tarefas. Isso permite que os LLMs ampliem sua funcionalidade, aprimorando sua capacidade de lidar com tarefas do mundo real que podem exigir acesso a dados externos, informações em tempo real ou aplicações específicas. Quando um LLM usa uma ferramenta de pesquisa na web, ele pode chamar a web para buscar dados em tempo real que não estão disponíveis nos dados de treinamento do modelo. Outros tipos de ferramentas podem incluir Python para cálculos, análise de dados ou visualização, ou chamar um endpoint de serviço para dados. A chamada de ferramentas pode tornar um chatbot mais dinâmico e adaptável, permitindo que apresente respostas mais precisas, relevantes e detalhadas com base em dados em tempo real ou tarefas especializadas fora de sua base de conhecimento imediata. Frameworks populares para chamada de ferramentas incluem o Langchain e, agora, o Ollama.

O Ollama é uma plataforma que oferece modelos de IA locais de código aberto para uso em dispositivos pessoais, para que os usuários possam executar LLMs diretamente em seus computadores. Diferentemente de serviços como a API da OpenAI, não há necessidade de uma conta, pois o modelo está na sua máquina local. O Ollama se concentra na privacidade, no desempenho e na facilidade de uso, permitindo que os usuários acessem e interajam com os modelos de IA sem enviar dados para servidores externos. Isso pode ser particularmente atraente para aqueles que se preocupam com a privacidade de dados ou que desejam evitar a dependência de APIs externas. A plataforma do Ollama foi projetada para ser fácil de configurar e usar, e é compatível com vários modelos, oferecendo aos usuários uma variedade de ferramentas para processamento de linguagem natural, geração de código e outras tarefas de IA diretamente em seu próprio hardware. É adequado para uma arquitetura de chamada de ferramentas, porque pode acessar todos os recursos de um ambiente local, incluindo dados, programas e software personalizado.

Neste tutorial, você aprenderá a configurar a chamada de ferramentas usando o Ollama para examinar um sistema de arquivos local, uma tarefa que seria difícil de realizar com um LLM remoto. Muitos modelos do Ollama estão disponíveis para chamada de ferramentas e criação de agentes de IA, como o Mistral e o Llama 3.2. Há uma lista completa disponível no site do Ollama. Neste caso, usaremos o IBM Granite 3.2 Densi, que é compatível com a ferramenta. Os modelos 2B e 8B são LLMs densos somente de texto, treinados para compatibilidade com casos de uso baseados em ferramentas e para geração aumentada de recuperação (RAG), simplificando a geração de código, tradução e correção de bugs.

O bloco de notas deste tutorial pode ser baixado do Github aqui.