업계 뉴스레터
전문가의 인사이트를 바탕으로 한 최신 기술 뉴스
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
도구 호출은 인공 지능(AI) 모델이 외부 도구, 애플리케이션 프로그래밍 인터페이스(API) 또는 시스템과 상호 작용하여 기능을 향상시키는 능력을 말합니다.
도구 호출 기능을 갖춘 AI 시스템은 사전 학습된 지식에만 의존하는 대신 데이터베이스를 쿼리하고, 실시간 정보를 가져오며, 기능을 실행하거나, 본래의 기능을 넘어서는 복잡한 작업을 수행할 수 있습니다.
기능 호출이라고도 하는 도구 호출은 에이전틱 AI를 지원하는 핵심적인 요소입니다. 이를 통해 자율 시스템은 외부 리소스에 동적으로 액세스하고 이에 대한 조치를 취하여 복잡한 작업을 완료할 수 있습니다.
도구 호출 기능이 있는 대형 언어 모델(LLM)은 단순히 질문에 답하는 대신 워크플로를 자동화하고, 데이터베이스와 상호 작용하며, 다단계 문제 해결을 수행하고, 실시간 의사 결정을 내리는 등의 작업을 수행할 수 있습니다.
이러한 변화로 인해 LLM은 수동적 비서에서 복잡한 작업을 수행할 수 있는 사전 예방적 디지털 에이전트로 변모하고 있습니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
대규모 언어 모델(LLM)은 전통적으로 학습되는 데이터에 의해 제한되며, 이는 시간과 계산 집약적인 프로세스일 수 있습니다.
주요 LLM은 데이터 세트로 학습되었지만 실시간 데이터, 외부 계산 및 향상된 상호작용의 필요성으로 인해 도구 호출 기능이 통합되었습니다.
OpenAI의 GPT-2를 포함한 초기 LLM은 정적이었습니다. 새로운 정보를 가져올 수 없는 상태에서 학습 데이터를 기반으로 응답을 생성했습니다.
인상적이었지만 실제 인식이 부족하고 현재 이벤트, 주가 또는 사용자별 행동과 같은 실시간 데이터가 필요한 동적 쿼리에 어려움을 겪었습니다.
이러한 한계를 극복하기 위해 개발자들은 외부 플러그인, API 및 데이터베이스를 통합하기 시작했으며, 이를 통해 모델이 정적 학습 데이터에만 전적으로 의존하는 대신 실시간 정보를 요청하고 처리할 수 있도록 했습니다.
개발자는 쿼리에 외부 지원이 필요한 경우 이를 인식하도록 LLM을 학습시켰습니다. 또한 많은 경우 외부 시스템에는 특정 입력 스키마가 있습니다. 도구 호출은 외부 시스템에서 사용하는 특정 스키마와 일치하는 모델 응답을 요청합니다.
도구 호출에는 AI가 외부 도구와 상호 작용할 수 있도록 함께 작동하는 몇 가지 핵심 구성 요소가 포함됩니다. Anthropic의 Claude, Meta의 Llama, Mistral, IBM® Granite 등 최신 LLM은 모두 도구 호출 기능을 갖추고 있지만, 각각 처리 방식이 조금 다릅니다.
첫 번째 구성 요소는 AI 모델 자체로, 요청을 완료하기 위해 충분한 지식이 부족하거나 외부 기능이 필요한 경우를 인식합니다.
다음으로 도구 선택 메커니즘은 검색 엔진, 데이터베이스 또는 컴퓨팅 리소스 등 특정 작업을 처리하기 위한 적절한 종속성을 파악합니다.
도구를 선택하면 API 인터페이스가 작동하여 AI가 구조화된 쿼리를 보내고 기계가 읽을 수 있는 형식으로 응답을 받을 수 있습니다.
마지막으로, 응답 처리 시스템은 검색된 데이터가 올바르게 형식화되어 사용자에게 의미 있는 방식으로 제공되도록 도와줍니다.
사용자가 LLM에 “지금 샌프란시스코의 날씨는 어떻습니까?”라고 묻는다고 가정해 보겠습니다. AI는 natural language understanding을 사용하여 정적 지식 기반에서 도출할 수 없는 실시간 날씨 데이터가 필요하다는 사실을 인식합니다.
고유한 도구 호출 ID는 도구를 사용하기 위한 모델의 요청에 자동으로 할당되며, 이는 요청을 해당 결과와 연결하는 추적 번호 역할을 합니다.
AI는 현재 날씨 데이터베이스를 확인하는 등 작업에 가장 적합한 도구를 파악합니다. 이 단계는 검색된 정보가 정확하고 관련성이 있는지 확인하는 데 도움이 됩니다.
각 도구에는 고유한 도구 이름(또는 함수 이름)과 같은 정형 정보 및 메타데이터가 포함되어 있어 모델 및 시스템이 도구를 올바르게 식별하는 데 도움이 됩니다. 기타 메타데이터에는 설명, 도구 매개변수, 필수 입력 및 아웃풋 유형이 포함됩니다.
모델은 선별한 가용 도구에서 데이터를 가져와야 함을 파악한 후 도구 선택을 수행합니다.
템플릿은 모델에게 어떤 도구를 사용하고 어떤 인수(또는 "args")를 제공해야 하는지 알려주는 구조화된 프롬프트 형식으로, API와의 보다 통제되고 구조화된 상호작용을 가능하게 합니다.
도구 호출의 맥락에서 args는 생성형 모델에 의해 시작될 때 도구 또는 함수에 전달되는 정형 입력을 의미합니다. 이러한 인수는 도구가 올바르게 실행되는 데 필요한 매개변수를 정의합니다.
도구 호출과 검색 증강 생성(RAG)을 결합하면 시스템이 구조화된 아웃풋을 생성하기 전에 구조화된 데이터와 비정형 데이터를 모두 검색할 수 있으므로 AI의 능력이 향상됩니다.
이러한 접근 방식은 응답을 생성하기 전에 가장 관련성 있는 데이터를 가져와서 맥락적 관련성을 높이고, 보다 정보에 기반하고 정확한 아웃풋을 제공합니다.
또한 여러 검색을 단일 단계로 통합하여 API 오버헤드를 최소화하여 지연 시간과 비용을 줄입니다. RAG는 기존 도구 호출보다 유연하여 모델이 다양한 소스에서 가져올 수 있고 다양한 영역에서 적응성이 뛰어납니다.
기존 도구 사용의 엄격한 구조와 달리, RAG는 검색된 지식과 추론 및 생성을 보다 유연하게 통합하여 더욱 역동적이고 통찰력 있는 응답을 제공합니다.
그런 다음 AI는 도구 또는 API가 이해할 수 있는 구조화된 요청을 공식합니다.
각 도구는 도구가 수행하는 작업을 정의하는 특정 도구 함수와 연결되어 있습니다. 이러한 함수는 도구의 API와 상호 작용하는 방법에 대한 문서를 제공하는 API 참조에 의존하며, 여기에는 엔드포인트 URL, 요청 방법 및 응답 형식이 포함됩니다.
외부 API에 액세스하려면 많은 서비스에서 요청을 수행할 수 있는 권한을 부여하는 고유 식별자인 API 키가 필요합니다. 도구가 선택되고 매개변수가 설정되면 요청된 데이터를 가져오기 위해 API 호출이 이루어집니다. 이 요청은 일반적으로 HTTP를 통해 외부 서버로 전송됩니다.
외부 도구는 데이터를 반환합니다. 그러면 AI가 도구 결과를 파싱해야 합니다. 날씨 요청의 경우 API는 온도, 습도 및 풍속을 포함하는 JSON 스키마 객체로 응답할 수 있습니다. AI는 이 데이터를 필터링하고 구조화하여 사용자를 위한 의미 있는 응답을 요약합니다.
AI는 처리된 정보를 직관적인 방식으로 제공합니다. 자동화된 요청의 경우, AI는 해당 작업이 예약되었음을 확인합니다.
사용자가 더 많은 세부 사항이나 수정을 요청하면, AI는 조정된 쿼리를 통해 프로세스를 반복할 수 있으며, 이는 사용자의 필요에 따라 응답을 계속해서 세분화하는 데 도움이 됩니다.
LangChain은 외부 도구, API 및 함수를 LLM과 통합하기 위한 오픈소스 프레임워크를 제공하여 도구 호출에 널리 사용됩니다. 도구 실행, 입력 또는 아웃풋 처리, 그리고 상황 인식 의사 결정에 도움을 줍니다.
예를 들어, LangChain은 사용자 쿼리를 위한 파서로 함수 인수를 처리하여 관련 매개변수를 추출하고 도구에 맞게 올바르게 형식화합니다. 간단한 도구 호출과 달리 LangChain은 이전 도구 아웃풋을 저장하고 호출하여 더 나은 멀티턴 상호작용을 가능하게 합니다.
LangChain은 여러 도구를 순차적으로 조합하여 더욱 복잡한 에이전틱 워크플로를 구현할 수 있도록 지원합니다. 예를 들어, 먼저 날씨 API에서 데이터를 가져온 후 별도의 도구를 사용하여 예보에 따라 복장을 추천할 수 있습니다.로
도구 호출을 통해 LLM은 다양한 작업을 수행할 수 있습니다. 도구 호출을 활용하는 AI 애플리케이션의 활용 사례는 무궁무진하지만, 여기서는 몇 가지 실제 사례와 함께 일반적인 카테고리 5가지를 소개합니다.
AI는 웹, 뉴스 소스, 학술 데이터베이스 또는 금융 시장에서 실시간 데이터를 가져옵니다. 예를 들어, AI 채팅 모델은 검색 API를 호출하여 최신 주가나 AI 연구 논문을 제공하고 챗봇을 통해 정보를 전달할 수 있습니다.
이를 통해 AI는 Wolfram Alpha 또는 Python 실행 환경과 같은 수학적 엔진을 사용하여 복잡한 계산을 수행하거나 스크립트를 실행할 수 있습니다. 이는 방정식을 풀고, 시뮬레이션을 실행하거나 작은 코드 조각을 실행하는 데 유용합니다.
AI는 Google 캘린더 및 Zapier와 같은 플랫폼과의 통합을 통해 회의 예약, 이메일 전송 또는 할 일 목록 관리와 같은 워크플로를 자동화합니다. AI 에이전트는 Salesforce 및 QuickBooks와 같은 CRM, 재무 및 분석 도구와 상호 작용하여 기업이 고객 데이터 검색 또는 재무 보고를 포함한 프로세스를 자동화할 수 있도록 합니다.
에이전틱 AI 시스템은 홈 자동화 시스템, 산업용 IoT 기기 및 로보틱스를 모니터링하고 제어할 수 있습니다. 언젠가는 전체 워크플로가 자율 에이전트에 의해 처리되는 모습을 쉽게 상상할 수 있습니다.
생성형 AI로 워크플로와 프로세스를 자동화하는 강력한 AI 어시스턴트 및 에이전트를 구축, 배포, 관리하세요.
믿을 수 있는 AI 솔루션으로 비즈니스의 미래를 설계하세요.
IBM Consulting AI 서비스는 기업이 AI 활용 방식을 재구상하여 혁신을 달성하도록 지원합니다.