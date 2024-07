Dieses Service-Framework Data Quality for AI„ (kurz: DQAI) bietet alle Tools, die es Modellentwicklern und Data Scientists ermöglichen, ein formalisiertes und systematisches Programm zur Datenvorbereitung zu implementieren, dem ersten und zeitaufwändigsten Schritt im Lebenszyklus der Modellentwicklung. Dieses Framework eignet sich für Daten, die für überwachte Klassifizierungs- oder Regressionsaufgaben vorbereitet werden. Es enthält die notwendige Software, um:



- Qualitätsprüfungen durchzuführen,

– Abhilfemaßnahmen durchzuführen,

– Audit-Berichte zu erstellen,

– all dies zu automatisieren.



Während das Pipe-Lining von Aufgaben für die Skalierbarkeit und Wiederholbarkeit unerlässlich ist, können die enthaltenen Funktionen auch für die benutzerdefinierte Datenexploration und die von Menschen geführte Verbesserung von Modellen verwendet werden. Die Nutzung der enthaltenen Dienste kann in jeder Phase des Lebenszyklus der Modellentwicklung produktiv sein. Das Angebot ist so konzipiert, dass es besonders in der frühen Phase der Datenverarbeitung, in der Phase der Datenvorbereitung, wertvoll ist.



Zusätzlich zu all dem, was mit Originaldatenquellen erreicht werden kann, gibt es Methoden, die ausgehend von einem Eingabedatensatz bei der Synthetisierung von neuen Daten helfen können – entweder zur Ergänzung oder als Ersatz –, indem sie Einschränkungen in den Originaldaten lernen oder indem diese von einem Entwickler spezifiziert werden. Dies kann hilfreich sein, wenn regulatorische oder vertragliche Gründe die direkte Verwendung von Daten bei der Modellierung verbieten, wenn es wünschenswert ist, Datensätze mit unterschiedlichen Einschränkungen zu untersuchen, oder wenn mehr Daten für Schulungen benötigt werden.



Dieses Angebot eignet sich sowohl für tabellarische Daten als auch für Zeitreihendaten und neue unterstützte Modalitäten, die derzeit entwickelt werden.