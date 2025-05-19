Damit eine Software als Open Source gilt, muss jeder ihren Quellcode nach eigenem Ermessen und in der Regel kostenlos nutzen, untersuchen, verändern und weitergeben können. Der Anwendungsbereich von Open-Source-KI ist jedoch viel weiter gefasst als der von Open-Source-Software.

KI-Systeme umfassen nicht nur die KI-Modelle selbst, sondern auch die während des Trainings verwendeten Datensätze, die Modellgewichte und Parameter sowie den Quellcode. Dieser Quellcode enthält Code zum Filtern und Verarbeiten von Trainingsdaten, Code für Modelltraining und -tests, unterstützende Bibliotheken sowie den Inferenzcode zum Ausführen des Modells. Alle diese Komponenten müssen den Bedingungen für Open-Source-KI entsprechen und verfügbar gemacht werden.

Die Open-Source-KI-Definition der OSI erlaubt den Ausschluss von nicht teilbaren, nicht-öffentlichen Trainingsdaten, wie beispielsweise personenbezogenen Daten (PII).3 Für diese Art von Daten muss eine detaillierte Beschreibung bereitgestellt werden, einschließlich Herkunft, Eigenschaften und Umfang, wie die Daten erhoben und ausgewählt wurden, etwaige Kennzeichnungsverfahren sowie Datenverarbeitung und Filtermethoden.4