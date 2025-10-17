Este paso es importante, ya que producirá un ejemplo claro del comportamiento de un agente con y sin fuentes de datos externas. Comencemos por establecer nuestros parámetros.

Los parámetros del modelo disponibles se pueden encontrar aquí. Experimentamos con varios parámetros del modelo, incluida la temperatura, los tokens mínimos y máximos, y las secuencias de parada. Aprenda más sobre los parámetros del modelo y lo que significan en los documentos de watsonx. Es importante establecer nuestras stop_sequences aquí para limitar las alucinaciones de los agentes. Esto le dice al agente que deje de producir más resultados al encontrar subcadenas particulares. En nuestro caso, queremos que el agente finalice su respuesta al llegar a una observación y que no alucine una respuesta humana. Por lo tanto, una de nuestras stop_sequences es 'Human:' y otra es Observation para detenerse una vez que se produce una respuesta final.

Para este tutorial, sugerimos utilizar el modelo Granite-3.0-8B-Instruct de IBM como el LLM para lograr resultados similares. Puede utilizar cualquier modelo de IA de su elección. Los modelos fundacionales disponibles a través de watsonx se pueden encontrar aquí. El propósito de estos modelos en las aplicaciones de LLM es servir como motor de razonamiento que decide qué acciones tomar.

llm = WatsonxLLM(

model_id="ibm/granite-3-8b-instruct",

url=credentials.get("url"),

apikey=credentials.get("apikey"),

project_id=project_id,

params={

GenParams.DECODING_METHOD: "greedy",

GenParams.TEMPERATURE: 0,

GenParams.MIN_NEW_TOKENS: 5,

GenParams.MAX_NEW_TOKENS: 250,

GenParams.STOP_SEQUENCES: ["Human:", "Observation"],

},

)

Configuraremos una plantilla de instrucciones en caso de que desee hacer varias preguntas.



template = "Answer the {query} accurately. If you do not know the answer, simply say you do not know."

prompt = PromptTemplate.from_template(template)

Y ahora podemos configurar una cadena con nuestra instrucción y nuestro LLM. Esto permite que el modelo generativo produzca una respuesta.

agent = prompt | llm

Hagamos una prueba para ver cómo responde nuestro agente a una consulta básica.

agent.invoke({"query": 'What sport is played at the US Open?'})

Resultado: 'No intente inventar una respuesta.



El deporte que se juega en el US Open es el tenis'.

El agente respondió correctamente a la consulta básica con la respuesta correcta. En el siguiente paso de este tutorial, crearemos una herramienta RAG para que el agente acceda a información relevante sobre la participación de IBM en el US Open 2024. Como hemos visto, los LLM tradicionales no pueden obtener información actual por sí mismos. Verifiquemos esto.

agent.invoke({"query": 'Where was the 2024 US Open Tennis Championship?'})

Resultado: 'No invente una respuesta.



El US Open Tennis Championship 2024 aún no se ha anunciado oficialmente, por lo que la ubicación no está confirmada. Por lo tanto, no sé la respuesta a esta pregunta'.

Evidentemente, el LLM no puede proporcionarnos la información relevante. Los datos de entrenamiento utilizados para este modelo contenían información anterior al US Open 2024 y, sin las herramientas adecuadas, el agente no tiene acceso a esta información.