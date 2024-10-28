IBM veröffentlicht seine Granite 3.0-Modelle als Open-Source-Software unter der Apache 2.0-Lizenz und verfolgt damit einen deutlich anderen Ansatz als Entwickler, die ihre KI-Systeme privat halten. Das Unternehmen baute seine Modelle unter Verwendung öffentlicher Datensätze wie GitHub Code Clean und StarCoder auf, wodurch es Urheberrechtsprobleme vermeiden konnte, die zu Klagen gegen KI-Unternehmen geführt haben, die ihre Modelle mit geschützten Inhalten trainieren, wie beispielsweise der aktuelle Fall von News Corp gegen Perplexity.

Die Version enthält 8B- und 2B-Sprachmodelle, die sich auf Unternehmensaufgaben wie Retrieval Augmented Generation und Klassifizierung konzentrieren, sowie spezielle Varianten für Unterricht und Sicherheitsüberwachung. Die Modelle unterstützen 116 Programmiersprachen und wurden mit 3-4 Terabytes an Token trainiert. Sie sind über verschiedene Plattformen verfügbar, darunter Hugging Face, GitHub und IBM watsonx.ai. Die Modelle reichen von 3 bis 34 Milliarden Parametern und können ohne Einschränkungen in nominell „Open Source“-Versionen für Forschung und kommerzielle Anwendungen verwendet werden.

„Diese Vielfalt an Denkweisen zu haben und als Teil dieses offenen Ökosystems mitzuwirken, ist einfach eine viel spannendere Vorstellung, als unsere Modelle in einer geschlossenen Box zu halten“, sagt Kate Soule, Programmdirektorin der Data and Model Factory bei IBM Research. „Wir wollen, dass die Community es nutzt.“

Die Open-Source-Bewegung hat auch in Europa an Dynamik gewonnen, wo sich Mistral AI zu einem Branchenführer entwickelt hat. Das in Paris ansässige Unternehmen hat immer leistungsfähigere Modelle herausgebracht, die Entwickler frei herunterladen und verändern können.

Die Open-Source-Strategie schafft einen wechselseitigen Austausch: Unternehmen teilen KI-Modelle, die nur große Unternehmen erstellen könnten, und gewinnen gleichzeitig Einblicke von Tausenden von Entwicklern, die neue Anwendungsmöglichkeiten für die Technologie finden. Den Zugriff zu beschränken, argumentieren jetzt viele, bedeutet, diese kollektive Innovation zu verpassen.

„Stellen Sie sich vor, es gäbe eine kleine, neuartige Optimierung Ihrer Modellarchitektur, die, selbst wenn alles andere unverändert bliebe, die Leistung deutlich verbessern würde“, sagt Dave Bergmann, Senior Writer bei IBM Think. „Wenn Sie Ihr Modell nur als offenes Gewicht veröffentlichen und sich weigern, Informationen und Code für seine Architektur preiszugeben, werden Sie die darin liegende Chance möglicherweise nie erkennen. Aber wenn 20.000 Leute an Ihrem Modellcode herumexperimentieren, wird es irgendwann jemand bemerken.“