대규모 언어 모델(LLM)에서의 도구 호출은 LLM이 외부 도구, 서비스, API와 상호 작용하여 작업을 수행하는 능력입니다. 이를 통해 LLM은 기능을 확장하여 외부 데이터, 실시간 정보 또는 특정 애플리케이션에 대한 액세스가 필요할 수 있는 실제 작업에 대한 처리 능력을 향상시킬 수 있습니다. LLM이 웹 검색 도구를 사용하는 경우, 웹을 호출하여 모델의 학습 데이터에서 제공되지 않는 실시간 데이터를 가져올 수 있습니다. 다른 도구 유형으로 생각할 수 있는 Python은 계산, 데이터 분석, 시각화, 데이터를 위한 서비스 엔드포인트 호출에 사용됩니다. 도구 호출을 하면 챗봇의 역동성과 적응 능력을 높여서, 자체적인 지식 기반 바깥의 전문화된 작업 또는 실시간 데이터를 바탕으로 더욱 정확하고 관련성이 높으며 상세한 응답을 제공할 수 있습니다. 인기 있는 도구 호출용 프레임워크에는 Langchain이 있고, 이제 ollama도 주목 받고 있습니다.

Ollama는 개인 장치에서 사용할 수 있는 오픈 소스 로컬 AI 모델을 제공하는 플랫폼입니다. 그래서 사용자가 자신의 컴퓨터에서 직접 LLM을 실행할 수 있습니다. OpenAI API 같은 서비스와 달리 모델이 로컬 컴퓨터에 있으므로 계정이 필요하지 않습니다. Ollama는 개인정보 보호, 성능, 사용 편의성에 중점을 두고 사용자가 외부 서버로 데이터를 전송하지 않고도 AI 모델을 이용하며 상호 작용할 수 있도록 지원합니다. 이는 데이터 프라이버시를 중시하거나 외부 API에 의존하지 않으려는 사람들에게 특히 매력적일 수 있습니다. Ollama 플랫폼은 설정하고 사용하기 쉽게 설계되었으며 다양한 모델을 지원합니다. 사용자는 자연어 처리, 코드 생성을 비롯한 AI 작업을 위한 다양한 도구를 자신의 하드웨어에서 바로 사용할 수 있습니다. 데이터, 프로그램, 맞춤 소프트웨어 등 로컬 환경의 모든 기능을 이용할 수 있기 때문에 도구 호출 아키텍처에 적합합니다.

로컬 파일 시스템을 살펴보는 ollama를 사용하여 도구 호출을 설정하는 방법을 배우는 튜토리얼입니다. 원격 LLM으로는 수행하기 어려운 작업입니다. olllama에는 도구 호출과 AI 에이전트 구축에 사용할 수 있는 Mistral과 Llama 3.2 등 많은 모델이 있습니다. ollama 웹사이트에서 모든 모델을 확인하세요. 우리가 사용해볼 모델은 도구 지원이 되는 IBM Granite 3.2 Dense입니다. 2B 모델과 8B 모델은 텍스트 전용 고밀도 LLM입니다. 도구 기반 사용 사례와 검색 증강 생성(RAG)을 지원하고 코드 생성, 번역, 버그 수정을 간소화하도록 설계되었습니다.

이 튜토리얼에 대한 노트북은 Github에서 내겨받을 수 있습니다.