Gründliche Tests sind entscheidend, um zu validieren, dass das bereitgestellte Modell wie beabsichtigt funktioniert und Edge-Cases und fehlerhafte Instanzen bewältigen kann. Das Testen umfasst die Überprüfung der Vorhersagen des Modells gegen die erwarteten Ausgaben anhand eines Datensatzes und die Sicherstellung, dass die Leistung mit den wichtigsten Metriken und Benchmarks übereinstimmt.
Integration-Tests sind eine weitere notwendige Komponente der Suite. Diese Tests überprüfen, ob sich das Modell nahtlos in die Produktionsumgebung einfügt und reibungslos mit anderen Systemen interagiert. Zusätzlich werden Stresstests durchgeführt, um zu beobachten, wie das Modell hohe Workloads bewältigt.
Wie bei der Einrichtungsphase ist es wichtig, zu dokumentieren, welche Tests durchgeführt wurden und welche Ergebnisse sie erzielt haben. So können Verbesserungen ermittelt werden, die vor der Auslieferung oder Freigabe des Modells an die Benutzer vorgenommen werden können.