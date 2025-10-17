이 단계는 외부 데이터 소스가 있거나 없는 에이전트의 행동에 대한 명확한 예를 생성하므로 중요합니다. 먼저 매개변수를 설정해 보겠습니다.

사용 가능한 모델 매개변수는 여기에서 확인할 수 있습니다. 온도, 최소 및 최대 신규 토큰, 중지 시퀀스를 포함한 다양한 모델 매개변수를 실험했습니다. watsonx 문서에서 모델 매개변수와 그 의미에 대해 자세히 알아보세요. 에이전트 할루시네이션을 제한하기 위해 여기에 stop_sequences를 설정하는 것이 중요합니다. 이는 에이전트에게 특정 하위 문자열을 발견하면 추가 아웃풋 생성을 중지하도록 지시합니다. 이 사례에서는 에이전트가 관찰에 도달하면 반응을 종료하고 인간의 반응을 할루시네이션하지 않게 하고자 합니다. 따라서 여기의 stop_sequences 중 하나는 'Human:'이고 다른 하나는 최종 반응이 생성되면 Observation을 중단하는 것입니다.

이 튜토리얼에서는 유사한 결과를 얻기 위해 IBM의 Granite-3.0-8B-Instruct 모델을 LLM으로 사용할 것을 권장합니다. 물론 원하는 AI 모델을 자유롭게 사용해도 됩니다. watsonx를 통해 사용할 수 있는 파운데이션 모델은 여기에서 확인할 수 있습니다. LLM 애플리케이션에서 이러한 모델의 목적은 어떤 조치를 취할지 결정하는 추론 엔진 역할을 하는 것입니다.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

여러 개의 질문을 하고 싶은 경우를 위한 프롬프트 템플릿을 설정해 드리겠습니다.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

이제 프롬프트와 LLM을 사용하여 체인을 설정할 수 있습니다. 이를 통해 생성형 모델이 응답을 생성할 수 있습니다.

agent = prompt | llm

에이전트가 기본 쿼리에 어떻게 응답하는지 테스트해 보겠습니다.

agent.invoke({"query": 'What sport is played at the US Open?'})

아웃풋: ' 답을 지어내려고 하지 마십시오.



US Open의 경기 종목은 테니스입니다.'

에이전트가 기본 쿼리에 정답으로 성공적으로 응답했습니다. 이 튜토리얼의 다음 단계에서는 에이전트가 2024년 US Open에 대한 관련 정보에 액세스할 수 있는 RAG 툴을 만듭니다. 앞서 다뤘듯이, 기존 LLM은 자체적으로 최신 정보를 얻을 수 없습니다. 이를 확인해 보겠습니다.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

아웃풋: ' 답을 지어내지 마십시오.



2024년 US Open 테니스 챔피언십은 아직 공식적으로 발표되지 않았기 때문에 장소는 확정되지 않았습니다. 따라서 저는 이 질문에 대한 답을 모릅니다.'

보시다시피 LLM은 관련 정보를 제공할 수 없습니다. 이 모델에 사용된 훈련 데이터에는 2024년 US Open 이전의 정보가 포함되어 있으며, 적절한 툴이 없으면 에이전트는 이 정보에 액세스할 수 없습니다.