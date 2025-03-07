도구 호출에는 AI가 외부 도구와 상호 작용할 수 있도록 함께 작동하는 몇 가지 핵심 구성 요소가 포함됩니다. Anthropic의 Claude, Meta의 Llama, Mistral, IBM® Granite 등 최신 LLM은 모두 도구 호출 기능을 갖추고 있지만, 각각 처리 방식이 조금 다릅니다.

첫 번째 구성 요소는 AI 모델 자체로, 요청을 완료하기 위해 충분한 지식이 부족하거나 외부 기능이 필요한 경우를 인식합니다.



다음으로 도구 선택 메커니즘은 검색 엔진, 데이터베이스 또는 컴퓨팅 리소스 등 특정 작업을 처리하기 위한 적절한 종속성을 파악합니다.



도구를 선택하면 API 인터페이스가 작동하여 AI가 구조화된 쿼리를 보내고 기계가 읽을 수 있는 형식으로 응답을 받을 수 있습니다.



마지막으로, 응답 처리 시스템은 검색된 데이터가 올바르게 형식화되어 사용자에게 의미 있는 방식으로 제공되도록 도와줍니다.

1단계. 도구의 필요성 인식

사용자가 LLM에 “지금 샌프란시스코의 날씨는 어떻습니까?”라고 묻는다고 가정해 보겠습니다. AI는 natural language understanding을 사용하여 정적 지식 기반에서 도출할 수 없는 실시간 날씨 데이터가 필요하다는 사실을 인식합니다.

고유한 도구 호출 ID는 도구를 사용하기 위한 모델의 요청에 자동으로 할당되며, 이는 요청을 해당 결과와 연결하는 추적 번호 역할을 합니다.

2단계. 도구 선택하기

AI는 현재 날씨 데이터베이스를 확인하는 등 작업에 가장 적합한 도구를 파악합니다. 이 단계는 검색된 정보가 정확하고 관련성이 있는지 확인하는 데 도움이 됩니다.

각 도구에는 고유한 도구 이름(또는 함수 이름)과 같은 정형 정보 및 메타데이터가 포함되어 있어 모델 및 시스템이 도구를 올바르게 식별하는 데 도움이 됩니다. 기타 메타데이터에는 설명, 도구 매개변수, 필수 입력 및 아웃풋 유형이 포함됩니다.

모델은 선별한 가용 도구에서 데이터를 가져와야 함을 파악한 후 도구 선택을 수행합니다.

템플릿은 모델에게 어떤 도구를 사용하고 어떤 인수(또는 "args")를 제공해야 하는지 알려주는 구조화된 프롬프트 형식으로, API와의 보다 통제되고 구조화된 상호작용을 가능하게 합니다.



도구 호출의 맥락에서 args는 생성형 모델에 의해 시작될 때 도구 또는 함수에 전달되는 정형 입력을 의미합니다. 이러한 인수는 도구가 올바르게 실행되는 데 필요한 매개변수를 정의합니다.

도구 호출과 검색 증강 생성(RAG)을 결합하면 시스템이 구조화된 아웃풋을 생성하기 전에 구조화된 데이터와 비정형 데이터를 모두 검색할 수 있으므로 AI의 능력이 향상됩니다.

이러한 접근 방식은 응답을 생성하기 전에 가장 관련성 있는 데이터를 가져와서 맥락적 관련성을 높이고, 보다 정보에 기반하고 정확한 아웃풋을 제공합니다.



또한 여러 검색을 단일 단계로 통합하여 API 오버헤드를 최소화하여 지연 시간과 비용을 줄입니다. RAG는 기존 도구 호출보다 유연하여 모델이 다양한 소스에서 가져올 수 있고 다양한 영역에서 적응성이 뛰어납니다.



기존 도구 사용의 엄격한 구조와 달리, RAG는 검색된 지식과 추론 및 생성을 보다 유연하게 통합하여 더욱 역동적이고 통찰력 있는 응답을 제공합니다.

3단계. 쿼리 생성 및 전송

그런 다음 AI는 도구 또는 API가 이해할 수 있는 구조화된 요청을 공식합니다.

각 도구는 도구가 수행하는 작업을 정의하는 특정 도구 함수와 연결되어 있습니다. 이러한 함수는 도구의 API와 상호 작용하는 방법에 대한 문서를 제공하는 API 참조에 의존하며, 여기에는 엔드포인트 URL, 요청 방법 및 응답 형식이 포함됩니다.

외부 API에 액세스하려면 많은 서비스에서 요청을 수행할 수 있는 권한을 부여하는 고유 식별자인 API 키가 필요합니다. 도구가 선택되고 매개변수가 설정되면 요청된 데이터를 가져오기 위해 API 호출이 이루어집니다. 이 요청은 일반적으로 HTTP를 통해 외부 서버로 전송됩니다.

4단계. 응답 수신 및 처리

외부 도구는 데이터를 반환합니다. 그러면 AI가 도구 결과를 파싱해야 합니다. 날씨 요청의 경우 API는 온도, 습도 및 풍속을 포함하는 JSON 스키마 객체로 응답할 수 있습니다. AI는 이 데이터를 필터링하고 구조화하여 사용자를 위한 의미 있는 응답을 요약합니다.

5단계. 정보 제시 또는 조치 취하기

AI는 처리된 정보를 직관적인 방식으로 제공합니다. 자동화된 요청의 경우, AI는 해당 작업이 예약되었음을 확인합니다.

6단계. 검색 구체화

사용자가 더 많은 세부 사항이나 수정을 요청하면, AI는 조정된 쿼리를 통해 프로세스를 반복할 수 있으며, 이는 사용자의 필요에 따라 응답을 계속해서 세분화하는 데 도움이 됩니다.

LangChain은 외부 도구, API 및 함수를 LLM과 통합하기 위한 오픈소스 프레임워크를 제공하여 도구 호출에 널리 사용됩니다. 도구 실행, 입력 또는 아웃풋 처리, 그리고 상황 인식 의사 결정에 도움을 줍니다.



예를 들어, LangChain은 사용자 쿼리를 위한 파서로 함수 인수를 처리하여 관련 매개변수를 추출하고 도구에 맞게 올바르게 형식화합니다. 간단한 도구 호출과 달리 LangChain은 이전 도구 아웃풋을 저장하고 호출하여 더 나은 멀티턴 상호작용을 가능하게 합니다.



LangChain은 여러 도구를 순차적으로 조합하여 더욱 복잡한 에이전틱 워크플로를 구현할 수 있도록 지원합니다. 예를 들어, 먼저 날씨 API에서 데이터를 가져온 후 별도의 도구를 사용하여 예보에 따라 복장을 추천할 수 있습니다.로