Was ist Open-Source-KI?

Offenes Buch mit leuchtendem Licht, das in alle Richtungen fließt

Was ist Open-Source-KI?

Open-Source-KI bezieht sich auf Systeme der künstlichen Intelligenz, die für jeden Zweck verwendet, untersucht, verändert und verbreitet werden können, ohne dass eine Genehmigung eingeholt werden muss.

Diese Freiheiten entsprechen der Definition von Open-Source-KI, die von der Open Source Initiative (OSI) festgelegt wurde, die weltweit als Hüter von Open-Source-Prinzipien und -Richtlinien gilt.1

Der Aufstieg von generativer KI hat dazu beigetragen, die Ära von Open-Source-KI zu katalysieren. Laut einem Bericht von Economist Impact waren zwei Drittel der 2023 veröffentlichten Large Language Models (LLMs) – eine Kategorie von Grundmodellen, die häufig zur Entwicklung von GenAI-Anwendungen wie Chatbots und Programmierassistenten verwendet werden – Open-Source-Software.2

Open-Source-KI versus Open-Source-Software

Damit eine Software als Open Source gilt, muss jeder ihren Quellcode nach eigenem Ermessen und in der Regel kostenlos nutzen, untersuchen, verändern und weitergeben können. Der Anwendungsbereich von Open-Source-KI ist jedoch viel weiter gefasst als der von Open-Source-Software.

KI-Systeme umfassen nicht nur die KI-Modelle selbst, sondern auch die während des Trainings verwendeten Datensätze, die Modellgewichte und Parameter sowie den Quellcode. Dieser Quellcode enthält Code zum Filtern und Verarbeiten von Trainingsdaten, Code für Modelltraining und -tests, unterstützende Bibliotheken sowie den Inferenzcode zum Ausführen des Modells. Alle diese Komponenten müssen den Bedingungen für Open-Source-KI entsprechen und verfügbar gemacht werden.

Die Open-Source-KI-Definition der OSI erlaubt den Ausschluss von nicht teilbaren, nicht-öffentlichen Trainingsdaten, wie beispielsweise personenbezogenen Daten (PII).3 Für diese Art von Daten muss eine detaillierte Beschreibung bereitgestellt werden, einschließlich Herkunft, Eigenschaften und Umfang, wie die Daten erhoben und ausgewählt wurden, etwaige Kennzeichnungsverfahren sowie Datenverarbeitung und Filtermethoden.4

Open-Source-KI im Vergleich zu offenen Gewichtungen

Gewichtungen sind die zentralen Parameter vortrainierter Modelle. Sie werden beim Training gelernt und bestimmen, wie ein Modell neue Daten interpretiert und Vorhersagen trifft.

Open Weights sind öffentlich geteilt und in der Regel unter Open-Source-Lizenzen verfügbar, was einen Einblick in den Endzustand eines Deep-Learning-Modells gibt. Und obwohl sie einen schrittweisen Fortschritt hin zu mehr Transparenz in der KI signalisieren, bieten offene Gewichtungen immer noch nicht das vollständige Bild, das Open-Source-KI bietet. Ohne die Trainingsdaten oder den Trainingscode können andere den Trainingsprozess weder überprüfen noch nachbilden.

Vorteile von Open-Source-KI

Laut einer aktuellen IBM-Studie gaben mehr als 80 % der befragten IT-Entscheidungsträger an, dass mindestens ein Viertel der KI-Plattformen oder -Lösungen ihres Unternehmens auf Open Source basieren. Und Unternehmen, die Open-Source-Ökosysteme nutzen, werden mit größerer Wahrscheinlichkeit einen positiven ROI erzielen als diejenigen, die dies nicht tun.

Open-Source-KI steigert nicht nur den ROI, sondern bietet auch diese wichtigen Vorteile:

    ● Barrierefreiheit

    ● Kollaborative Innovation

    ● Kosteneffizienz

    ● Anpassung

    ● Transparenz

Zugriff

Open-Source-KI beseitigt Eintrittsbarrieren, insbesondere für Neueinsteiger auf diesem Gebiet. Es bietet auch Zugang zu Organisationen, die nicht in der Lage sind, erhebliche finanzielle Ressourcen in die KI-Entwicklung zu investieren, wie kleine Unternehmen oder Unternehmen ohne spezielle Fachkenntnisse.

Gemeinsame Innovation

Die Community ist das Herzstück von Open Source. KI-Entwickler, Forscher, Unternehmen und andere Stakeholder arbeiten zusammen, um KI-Technologien kontinuierlich zu verbessern. Diese gemeinsame Anstrengung führt zu Lernen und Teilen, eröffnet Möglichkeiten zur Weiterentwicklung der Arbeit anderer und fördert Innovationen.

Kosteneffizienz

Open-Source-KI-Modelle können in der Regel kostenlos verwendet werden. Auf diese Weise können Unternehmen die anfänglichen Kosten für die Entwicklung und das Training ihrer eigenen Modelle sparen oder sie von Closed-Source-Anbietern mit hoher Preisgestaltung oder Lizenzgebühren beziehen.

Anpassung

Unternehmen können Open-Source-KI-Systeme nach ihren Vorstellungen verändern und erhalten dadurch mehr Kontrolle. Sie können diese Systeme auf ihre speziellen Bedürfnisse und Anwendungsfälle zuschneiden, Open-Source-KI-Modelle anhand ihrer eigenen Geschäftsdaten fein abstimmen und diese Modelle für bestimmte Aufgaben optimieren.

Transparenz

Der offene Charakter der Open-Source-KI fördert die Transparenz der KI. Zu wissen, wie ein KI-System aufgebaut und trainiert wurde und wie es Entscheidungen trifft, trägt dazu bei, Vertrauen zu schaffen, insbesondere in Branchen, in denen KI-Ergebnisse Leben beeinflussen können, wie z. B. im Gesundheitswesen, im Personalwesen und im Justizsystem.

Diese Transparenz erleichtert es auch, Fehler zu lokalisieren, Verzerrungen zu identifizieren und Sicherheitslücken zu erkennen, sodass KI-Entwickler schnell Abhilfe an der Adresse schaffen können. Darüber hinaus ermöglicht der Einblick in das Innenleben von Open-Source-KI eine bessere Überprüfbarkeit durch politische Entscheidungsträger in Sektoren wie der Regierung und dem Finanzwesen, in denen die Einhaltung gesetzlicher Vorschriften von größter Bedeutung ist.

Herausforderungen der Open-Source-KI

Trotz ihrer vielen Vorteile hat Open Source KI auch ihre Grenzen. Hier sind einige Herausforderungen, die mit Open-Source-KI verbunden sind:

    ● Fehlender dedizierter oder zeitnaher Support

    ● Möglichkeit des Missbrauchs

    ● Sicherheitslücken

Fehlender dedizierter oder zeitnaher Support

Im Gegensatz zu proprietären Modellen gibt es bei Open-Source-KI-Modellen nicht oft festgelegte Reaktionszeiten für dringende Probleme, ein dediziertes Support-Team, das bei der Lösung von Problemen hilft, oder einheitliche Zeitpläne für die Veröffentlichung von Sicherheitspatches oder Updates. Unternehmen müssen ihre KI-Anwendungen selbst überwachen und ihre eigenen Unterstützungsverfahren einrichten.

Möglichkeit des Missbrauchs

Da jeder Open-Source-KI für beliebige Zwecke nutzen kann, besteht die Möglichkeit, dass sie auch für böswillige Zwecke eingesetzt wird. Bedrohungsakteure können Open-Source-KI einsetzen, um Cyberangriffe zu automatisieren, Deepfakes zu erstellen oder Fehlinformationen und Desinformation zu verbreiten.

Sicherheitslücken

Open-Source-KI ist zwar transparent, aber ihre Sichtbarkeit deckt Sicherheitslücken auf, die böswillige Akteure ausnutzen können. Auch hier liegt es in der Verantwortung der Unternehmen, Leitplanken für ihre Open-Source-KI-Lösungen zu setzen.

3D-Design aus Kugeln, die auf einer Schiene rollen

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think. 

Beispiele für Open-Source-KI-Modelle

Es existieren unzählige Open-Source-KI-Modelle , die meisten davon sind auf Hugging Face oder über deren GitHub-Repositories zugänglich. Hier sind einige beliebte:

    ● Amber

    ● Crystal

    ● DeepSeek-R1

    ● Falcon-7B und Falcon-40B

    ● Granite

    ● Olmo

    ● Pythia

    ● Qwen

    ● T5

Amber

Amber ist ein englisches Sprachmodell mit 7 Milliarden Parametern, das von LLM360 entwickelt wurde, einer Initiative für KI in Gemeinschaftsbesitz durch Open-Source-Forschung und Entwicklung großer Modelle. Amber basiert auf der Llama-Architektur von Meta und ist unter der Apache 2.0 Lizenz verfügbar. Nach Angaben der OSI entspricht Amber der OSI-Definition von Open-Source-KI.1

Crystal

Crystal ist ein weiteres großes Sprachmodell von LLM360 mit einer Parameteranzahl von 7 Milliarden. Es wird unter der Apache 2.0-Lizenz veröffentlicht und ist hervorragend darin, Codierung und Aufgaben der natürlichen Sprachverarbeitung (NLP) auszubalancieren. Nach Angaben der OSI entspricht Crystal der Open-Source-KI-Definition der OSI. 1

DeepSeek-R1

DeepSeek-R1 ist ein Logikmodell des chinesischen KI-Startups DeepSeek. Es verwendet eine Mixture of Experts (MoE) -Architektur für maschinelles Lernen und wurde mithilfe von umfangreichem Reinforcement Learning trainiert, um seine Denkfähigkeiten zu verfeinern. Es ist unter der MIT-Lizenz verfügbar.

Falcon-7B und Falcon-40B

Falcon-7B und Falcon-40B sind kausale Decoder-Modelle mit jeweils 7 bzw. 40 Milliarden Parametern. Beide Modelle wurden von Forschern des Technology Innovation Institute (TII) der VAE entwickelt und auf TIIs eigenem RefinedWeb trainiert, einem riesigen Datensatz mit gefilterten englischen Webdaten. Falcon-7B und Falcon-40B sind unter der Apache 2.0-Lizenz erhältlich.

Granite

IBM® Granite™ ist eine Reihe unternehmensfähiger multimodaler KI-Modelle. Sie basieren auf einer Grundlage aus Open-Source-Instruktionsdatensätzen mit erlaubenden Lizenzen sowie intern kuratierten synthetischen Datensätzen. Die Modelle sind unter der Apache 2.0-Lizenz erhältlich.

Die Granite Foundation Modelle bestehen aus kleinen Sprachmodellen mit Funktionen, die für agentische workflows entwickelt wurden, einem Visionsmodell, das auf Visionaufgaben für Dokumenten- und Bildverständnis spezialisiert ist, Sprachmodellen für automatische Spracherkennung und Übersetzung sowie Codemodellen für codegenerative Aufgaben.

OLMo

OLMo ist eine Familie von Sprachmodellen von Ai2, einem gemeinnützigen KI-Forschungsinstitut. Die Modelle sind in Parametergrößen von 1, 7, 13 und 32 Milliarden erhältlich. Die Modelle, der Trainingscode, die Evaluierungssuite zur Reproduktion der OLMo-Ergebnisse und die Trainingsdaten, die in jeder Phase verwendet werden – einschließlich Vortraining, Mitte und Nachtraining – sind alle unter der Apache 2.0-Lizenz frei verfügbar. Laut OSI entspricht OLMo der Open-Source-KI-Definition des OSI.1

Pythia

Entwickelt vom gemeinnützigen Forschungslabor EleutherAI, ist Pythia eine Suite von LLMs mit einer Größe von 14 Millionen bis 12 Milliarden Parametern und unter der Apache 2.0-Lizenz veröffentlicht. Sämtliche zugehörigen Daten, Codes, Modelle und Prüfpunkte sind öffentlich zugänglich, zusammen mit Anweisungen zur Reproduktion des Trainings, mit dem Ziel, die Interpretierbarkeit von KI, die Ethik von KI und die Transparenz zu verbessern. Laut dem OSI entspricht Pythia der Open-Source-KI-Definition des OSI.1

Qwen

Qwen ist eine Reihe von LLMs vom chinesischen Cloud-Computing-Unternehmen Alibaba Cloud. Qwen umfasst Sprachmodelle, ein Vision-Sprachmodell und Varianten, die für Audio, Codierung und Mathematik optimiert sind. Die meisten Qwen-Modelle stehen unter der Apache 2.0-Lizenz zur Verfügung, größere Modelle haben jedoch proprietäre Lizenzen.

T5

T5 ist ein von Forschern bei Google entwickeltes Text-zu-Text- Transfertransformatormodell . Es eignet sich hervorragend für eine breite Palette von NLP-Aufgaben und wird unter der Apache 2.0-Lizenz veröffentlicht. Nach Angaben der OSI entspricht T5 der Open-Source-KI-Definition der OSI.1

Das OSI hat außerdem Metas Llama 2, Microsofts Phi-2, Mistrals Mixtral und xAIs Grok analysiert und festgestellt, dass diese Modelle nicht mit der Open-Source-KI-Definition des OSI übereinstimmen, "weil ihnen die erforderlichen Komponenten fehlen und/oder ihre rechtlichen Vereinbarungen mit den Open-Source-Prinzipien unvereinbar sind."1

Open-Source-KI-Tools und -Frameworks

Die Arbeit an Open-Source-KI-Projekten kann schnell überfordernd werden. Hier sind einige bekannte Open-Source-KI-Tools , die helfen können:

    ● Keras

    ● OpenCV

    ● PyTorch

    ● Scikit-learn

    ● TensorFlow

Keras

Keras ist eine Anwendungsprogrammierschnittstelle (API), die in Python geschrieben wurde, um Deep-Learning-Modelle zu erstellen, zu trainieren und zu evaluieren. Es ist kompatibel mit und kann auf JAX-, PyTorch- oder TensorFlow-Frameworks ausgeführt werden.

OpenCV

OpenCV ist eine Open-Source-Bibliothek für Computer Vision, die von der Open Source Vision Foundation betrieben wird. Es beherbergt mehr als 2.500 optimierte Algorithmen für Echtzeit-Vision-Anwendungen, darunter Bilderkennung, Bildklassifikation, Objekterkennung und Objektverfolgung.

PyTorch

PyTorch ist ein Framework, das ursprünglich von Meta entwickelt wurde und heute Teil der Linux Foundation ist. Es unterstützt dynamische Neural Networks und GPU-Beschleunigung, integriert sich nahtlos mit Python-Bibliotheken und -Paketen, bietet eine intuitive Oberfläche und hat minimalen Framework-Overhead.

Scikit-learn

Scikit-learn ist ein Python-Modul für maschinelles Lernen. Es bietet Algorithmen für Klassifikation, Clustering und Regression unter anderem und bietet Werkzeuge zur Datenverarbeitung, Modellauswahl und -bewertung sowie zur Erstellung von Visualisierungen.

TensorFlow

TensorFlow ist eine Plattform zum Erstellen und Bereitstellen von Machine-Learning-Modellen. TensorFlow wurde von Google entwickelt und enthält eine Bibliothek mit Datensätzen und Modellen, APIs für verschiedene Programmiersprachen sowie Tools zur Optimierung von maschinelles Lernen-Workflows. Es verfügt außerdem über eine robuste Open Source-Community und hilft Menschen, ihre Expertise im maschinellen Lernen durch Bücher, kuratierte Lehrpläne und Online-Kurs auszubauen.

Mixture of Experts | 12. Dezember, Folge 85

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Weiterführende Lösungen
IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

watsonx.ai erkunden
Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein
– mit branchenführendem Fachwissen im Bereich KI und dem umfassenden Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen
Beratung und Services zu künstlicher Intelligenz (KI)

Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

KI-Services entdecken
Machen Sie den nächsten Schritt

Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.

watsonx.ai erkunden Buchen Sie eine Live-Demo
Fußnoten

1 The Open-Source AI Definition 1.0, Open Source Initiative, Abruf 12. Mai 2025

2 Open sourcing the AI revolution, Economist Impact, 2024

3 Answers to frequently asked questions, Open Source Initiative, 29. Oktober 2024

4 The Open Source AI Definition – 1.0, Open Source Initiative, Abruf 12. Mai 2025