청구 및 사용량 추적에 대한 이해
비용을 관리하고 사용량을 효과적으로 추적하려면 API 활동이 청구 가능한 단위로 변환되는 방식을 이해하는 것이 중요합니다. 청구 모델은 배포 플랫폼( IBM Cloud 또는 AWS )에 따라 다릅니다. 또한 월간 활성 사용자 수(MAU), 월간 활성 음성 사용자 수(MAVU), 메시지, 분, 리소스 단위(RU) 등 다양한 지표를 기반으로 합니다.
플랫폼별 사용량 지표
watsonx Orchestrate 의 청구 방식은 watsonx Orchestrate 가 배포된 플랫폼에 따라 다릅니다. 사용자 상호작용 추적 및 문서 처리와 같은 핵심 개념은 동일하지만, 이러한 활동이 측정되고 요금이 부과되는 방식은 IBM Cloud 와 AWS 간에 차이가 있습니다.
다음 섹션에서는 각 플랫폼별 주요 사용량 지표와 청구 전환에 대해 간략하게 설명합니다.
IBM Cloud
IBM Cloud 에서 청구는 주로 월간 활성 사용자(MAU)를 기준으로 이루어집니다:
월간 활성 사용자(MAU) :
각 MAU는 한 달 동안 watsonx Orchestrate 을 이용하는 고유한 사용자를 의미합니다. MAU를 정확하게 추적하려면 API 요청 컨텍스트에 customer_id 를 포함해야 합니다. 이 시스템은 이 식별자를 사용하여 각 사용자를 식별하며, 해당 사용자가 몇 번의 상호작용을 시도하든 상관없이 한 달에 한 customer_id 번만 집계합니다.
각 MAU에는 한 달에 최대 50개의 메시지가 포함됩니다. 사용자가 50개 이상의 메시지를 보내면 50개 이상의 메시지가 추가될 때마다 시스템에서 MAU를 추가로 계산합니다.
월간 활성 음성 사용자(MAVU) :
사용자가 전화와 같은 음성 채널을 통해 상호작용하는 경우, 시스템에서는 이를 MAU 외에 MAVU로 계산합니다. 각 음성 기반 MAU도 MAVU로 계산됩니다.
문서 처리 :
문서 관련 도구를 통해 처리된 페이지 수를 기준으로 문서 처리를 추적합니다. 배포 플랫폼에 따라 이 사용량을 내부적으로 MAU 또는 기타 청구 단위로 변환합니다. IBM Cloud 에서 전환율은 15페이지 = 1 MAU(월간 활성 사용자)입니다.
AWS
AWS 에서 청구는 리소스 단위(RU)를 기준으로 합니다:
MAU를 RU로 전환합니다 :
에센셜 요금제: 6 MAU = 1 RU
음성 상호작용: 10 MAVU = 1 RU
문서 처리 : MAU와 별도로 청구되며, 100페이지 = 1RU의 비율로 청구됩니다
사용자 추적 및 식별
watsonx Orchestrate 의 사용량 추적은 API 요청 컨텍스트를 통해 전달되는 식별자에 의존합니다. 요청이 API에 /runs 도달하면, 요청의 발신 채널(Orchestrate Chat, ADK, 임베디드 채팅 또는 기타 통합 인터페이스 등)에 관계없이 시스템은 요청 컨텍스트에서 customer_id 를 확인합니다.
이 도구는 매월 customer_idwatsonx Orchestrate 을 이용하는 고유 사용자 수를 추적하는 데 사용되며, 이를 통해 지원되는 모든 채널에 걸쳐 정확한 이용 지표를 확인할 수 있습니다.
시스템에서는 다음 로직을 적용하여 사용자를 식별합니다:
_해당 정보를
customer_id컨텍스트에 포함하는 경우_: 시스템은 이를 고유 식별자로 사용하여 MAU(월간 활성 사용자) 계산을 위해 통합 청구 서비스로 전달합니다._포함하지 않을
customer_id경우_: 시스템은 기본적으로 를 식별자로thread_id사용합니다. 이 대체 메커니즘은 모든 상호작용을 추적하는 데 도움이 되지만, 동일한 사용자가 일관된 식별자 없이 여러 개의 스레드를 시작하면 MAU 수가 부풀려질 수 있습니다.