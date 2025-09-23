Eine weitere Innovation des IBM Teams ist das „Evaluation Studio“. Diese Funktion bietet zwei wichtige Funktionen:

Prompt-Optimierung durch Nebeneinander-Vergleich verschiedener Versionen von Prompts Verfolgung von Experimenten für Agenten

Evaluation Studio hilft Entwicklern, verschiedene Versionen des Prompts anhand eines Datensatzes zu bewerten und die Ergebnisse in einer intuitiven Benutzeroberfläche zu vergleichen. Es bietet auch Unterstützung für eine einzigartige benutzerdefinierte Rangliste, bei der Benutzer ein individuelles Bewertungsschema erstellen können, indem sie Metriken auswählen und ihnen je nach Wichtigkeit Gewichte zuweisen. Dies hilft Benutzern, einen Prompt, der in einem Tool oder Agenten verwendet werden soll, einfach zu optimieren.

watsonx.governance, Evaluation Studio unterstützt auch die Experimentverfolgung, ein leistungsstarkes Tool zum Erstellen besserer agentischer KI-Systeme. Sie können schnell Experimente einrichten, verschiedene Varianten (des Agenten) ausprobieren und sie mit Details wie dem Modell, dem Retriever oder dem Prompt, den Sie verwendet haben, kennzeichnen. Gegenüberstellung der Daten basierend auf Latenz, Kosten und Qualität (z. B. Wiedergabetreue) macht es leicht zu erkennen, was am besten funktioniert. Wichtig ist, dass die Plattform Ihnen dabei hilft, den genauen Code für jede Ausführung zu speichern. So haben die Entwickler Zeit, jede Version zu speichern, und können sich auf die Entwicklung und Verbesserung des Agenten konzentrieren.