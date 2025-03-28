La llamada a herramientas en modelos de lenguaje grandes (LLM) es la capacidad del LLM para interactuar con herramientas, servicios o API externos para realizar tareas. Esto permite a los LLM ampliar su funcionalidad, mejorando su capacidad para manejar tareas del mundo real que pueden requerir acceso a datos externos, información en tiempo real o aplicaciones específicas. Cuando un LLM utiliza una herramienta de búsqueda web, puede llamar a la web para obtener datos en tiempo real que no están disponibles en los datos de entrenamiento del modelo. Otros tipos de herramientas pueden incluir Python para cálculos, análisis de datos o visualización, o llamar a un endpoint de servicio para obtener datos. Las llamadas a herramientas pueden hacer que un chatbot sea más dinámico y adaptable, lo que le permite proporcionar respuestas más precisas, relevantes y detalladas basadas en datos en vivo o tareas especializadas fuera de su base de conocimientos inmediata. Los marcos populares para la llamada a herramientas incluyen Langchain y ahora Ollama.

Ollama es una plataforma que ofrece modelos de IA local de código abierto para su uso en dispositivos personales para que los usuarios puedan ejecutar LLM directamente en sus computadoras. A diferencia de un servicio como la API de OpenAI, no es necesario tener una cuenta, ya que el modelo está en su máquina local. Ollama se centra en la privacidad, el rendimiento y la facilidad de uso, lo que permite a los usuarios acceder e interactuar con modelos de IA sin enviar datos a servidores externos. Esto puede ser particularmente atractivo para aquellos preocupados por la privacidad de datos o que desean evitar la dependencia de API externas. La plataforma de Ollama está diseñada para ser fácil de configurar y usar, y admite varios modelos, lo que brinda a los usuarios una gama de herramientas para el procesamiento de lenguaje natural, la generación de código y otras tareas de IA directamente en su propio hardware. Se adapta bien a una arquitectura de llamada de herramientas porque puede acceder a todas las capacidades de un entorno local, incluidos datos, programas y software personalizado.

En este tutorial, aprenderá a configurar la llamada a herramientas mediante el uso de Ollama para examinar un sistema de archivos local, una tarea que sería difícil de realizar con un LLM remoto. Muchos modelos de Ollama están disponibles para llamar a herramientas y crear agentes de IA como Mistral y Llama 3.2. Una lista completa está disponible en el sitio web de Ollama. En este caso, utilizaremos IBM Granite 3.2 Dense, que tiene soporte para herramientas. Los modelos 2B y 8B son LLM densos de solo texto entrenados y diseñados para admitir casos de uso y para la generación aumentada por recuperación (RAG), agilizando la generación de código, la traducción y la corrección de errores.

El cuaderno para este tutorial se puede descargar desde Github aquí.