Essa etapa é importante, pois produzirá um exemplo claro do comportamento de um agente com e sem fontes de dados externas. Vamos começar definindo nossos parâmetros.

Os parâmetros dos modelos disponíveis podem ser encontrados aqui. Experimentamos vários parâmetros dos modelos, incluindo temperatura, mínimo e máximo de novos tokens e sequências de parada. Saiba mais sobre os parâmetros dos modelos e o que eles significam na documentação do watsonx. É importante definir nossas stop_sequences aqui para limitar as alucinações do agente. Isso diz ao agente para parar de produzir mais saídas ao encontrar subsequências de caracteres específicas. Em nosso caso, queremos que o agente termine sua resposta ao chegar a uma observação e não alucinar uma resposta humana. Portanto, uma das nossas stop_sequences é 'Human:' e outra é Observation , para parar assim que uma resposta final for produzida.

Para este tutorial, sugerimos o uso do modelo Granite-3.0-8B-Instruct da IBM como o LLM para alcançar resultados semelhantes. Você é livre para usar qualquer modelo de IA de sua escolha. Os modelos de base disponíveis no watsonx podem ser encontrados aqui. O objetivo desses modelos nas aplicações de LLM é servir como o mecanismo de raciocínio que decide quais ações tomar.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

Configuraremos um modelo de prompts caso você queira fazer várias perguntas.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

E agora podemos configurar uma cadeia com nosso prompt e nosso LLM. Isso permite que o modelo generativo produza uma resposta.

agent = prompt | llm

Vamos testar para ver como nosso agente responde a uma consulta básica.

agent.invoke({"query": 'What sport is played at the US Open?'})

Output: ' Não tente inventar uma resposta.



O esporte disputado no US Open é o tênis.'

O agente respondeu com sucesso à consulta básica com a resposta correta. Na próxima etapa deste tutorial, criaremos uma ferramenta de RAG para o agente acessar informações relevantes sobre o envolvimento da IBM no US Open de 2024. Conforme abordamos, os LLMs tradicionais não conseguem obter informações atuais por conta própria. Vamos verificar isso.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

Output: ' Não invente uma resposta.



O US Open Tennis Championship de 2024 ainda não foi oficialmente anunciado; assim, o local não está confirmado. Portanto, não sei a resposta para essa pergunta.'

Evidentemente, o LLM não pode nos fornecer as informações relevantes. Os dados de treinamento usados para esse modelo continham informações anteriores ao US Open de 2024 e, sem as ferramentas adequadas, o agente não tem acesso a essas informações.