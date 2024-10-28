Während Technologieunternehmen Milliarden in künstliche Intelligenz investieren, gewinnt eine kontraintuitive Strategie an Bedeutung: den Code zu verschenken. Der Wechsel zu Open-Source-KI-Modellen spiegelt den wachsenden Druck wider, die Entwicklungskosten einzudämmen und gleichzeitig die Durchbrüche in einem Bereich zu beschleunigen, in dem Talent und Rechenleistung einen hohen Preis haben.
Die KI-Landschaft verändert sich, da Unternehmen wie IBM, Meta und Mistral AI auf Open-Source-Entwicklung setzen und so hochentwickelte KI-Technologie Entwicklern und Forschern frei zur Verfügung stellen. Während dieser Ansatz den Zugriff demokratisieren und Durchbrüche durch Zusammenarbeit beschleunigen könnte, warnen Kritiker davor, dass er es schlechten Akteuren ermöglichen könnte, die Technologie für schädliche Zwecke zu missbrauchen oder zu modifizieren.
Befürworter sagen, dass die Open-Source-KI-Entwicklung es Forschern und Entwicklern auf der ganzen Welt ermöglicht, die Technologie zu prüfen, zu verändern und zu verbessern. Dieser kollaborative Ansatz hat bereits zu erheblichen Fortschritten in der Modelleffizienz geführt. So erreichendie neuen Granite 3.0 KI-Modelle von IBM beispielsweise eine Leistung, die mit größeren Systemen vergleichbar ist, und benötigen dabei nur einen Bruchteil der Rechenressourcen.
IBM veröffentlicht seine Granite 3.0-Modelle als Open-Source-Software unter der Apache 2.0-Lizenz und verfolgt damit einen deutlich anderen Ansatz als Entwickler, die ihre KI-Systeme privat halten. Das Unternehmen baute seine Modelle unter Verwendung öffentlicher Datensätze wie GitHub Code Clean und StarCoder auf, wodurch es Urheberrechtsprobleme vermeiden konnte, die zu Klagen gegen KI-Unternehmen geführt haben, die ihre Modelle mit geschützten Inhalten trainieren, wie beispielsweise der aktuelle Fall von News Corp gegen Perplexity.
Die Version enthält 8B- und 2B-Sprachmodelle, die sich auf Unternehmensaufgaben wie Retrieval Augmented Generation und Klassifizierung konzentrieren, sowie spezielle Varianten für Unterricht und Sicherheitsüberwachung. Die Modelle unterstützen 116 Programmiersprachen und wurden mit 3-4 Terabytes an Token trainiert. Sie sind über verschiedene Plattformen verfügbar, darunter Hugging Face, GitHub und IBM watsonx.ai. Die Modelle reichen von 3 bis 34 Milliarden Parametern und können ohne Einschränkungen in nominell „Open Source“-Versionen für Forschung und kommerzielle Anwendungen verwendet werden.
„Diese Vielfalt an Denkweisen zu haben und als Teil dieses offenen Ökosystems mitzuwirken, ist einfach eine viel spannendere Vorstellung, als unsere Modelle in einer geschlossenen Box zu halten“, sagt Kate Soule, Programmdirektorin der Data and Model Factory bei IBM Research. „Wir wollen, dass die Community es nutzt.“
Die Open-Source-Bewegung hat auch in Europa an Dynamik gewonnen, wo sich Mistral AI zu einem Branchenführer entwickelt hat. Das in Paris ansässige Unternehmen hat immer leistungsfähigere Modelle herausgebracht, die Entwickler frei herunterladen und verändern können.
Die Open-Source-Strategie schafft einen wechselseitigen Austausch: Unternehmen teilen KI-Modelle, die nur große Unternehmen erstellen könnten, und gewinnen gleichzeitig Einblicke von Tausenden von Entwicklern, die neue Anwendungsmöglichkeiten für die Technologie finden. Den Zugriff zu beschränken, argumentieren jetzt viele, bedeutet, diese kollektive Innovation zu verpassen.
„Stellen Sie sich vor, es gäbe eine kleine, neuartige Optimierung Ihrer Modellarchitektur, die, selbst wenn alles andere unverändert bliebe, die Leistung deutlich verbessern würde“, sagt Dave Bergmann, Senior Writer bei IBM Think. „Wenn Sie Ihr Modell nur als offenes Gewicht veröffentlichen und sich weigern, Informationen und Code für seine Architektur preiszugeben, werden Sie die darin liegende Chance möglicherweise nie erkennen. Aber wenn 20.000 Leute an Ihrem Modellcode herumexperimentieren, wird es irgendwann jemand bemerken.“
Metas Veröffentlichung seiner Open-Source-Llama-Modelle war ein bedeutender Wendepunkt. Das bedeutete, dass eines der größten Technologieunternehmen Forschern und kleineren Organisationen Zugang zu fortschrittlicher KI-Technologie verschaffte, die sie sich unabhängig niemals hätten leisten können zu entwickeln.
„Wir sind grundsätzlich davon überzeugt, dass Open Source KI für alle gut ist, angefangen bei den Entwicklern, die diese Modelle nehmen und sie einer Feinabstimmung unterziehen, trainieren, verfeinern und überall dort einsetzen können, wo sie wollen“, sagte Amit Sangani, Senior Director of AI Partner Engineering bei Meta, während eines kürzlich stattgefundenen Treffens der AI Alliance. „Je mehr Open-Source-KI ist, desto transparenter und sicherer wird sie. Es wird eingehend geprüft, und das ist gut so – denn wenn Probleme gefunden werden, werden sie von den Leuten, einschließlich Meta, behoben.
Trotz der Vorteile könnte das Open Source von KI-Technologie auch Risiken mit sich bringen. Einige Beobachter sagen, dass Open-Source-KI-Modelle für schädliche Zwecke, wie das Generieren von Desinformation oder das Erstellen von Malware, leichter modifiziert werden können. Die fehlende zentralisierte Kontrolle bedeutet, dass modifizierte Versionen ihrer Modelle dies möglicherweise nicht tun, selbst wenn die ursprünglichen Entwickler hohe ethische Standards einhalten.
Die von Modellen wie Granite 3.0 aufgezeigten Effizienzgewinne deuten jedoch auf eine mögliche Zukunft hin, in der KI-Fähigkeiten auch für Organisationen mit begrenzten Ressourcen zugänglicher werden. Kleinere Unternehmen, die es sich nicht leisten können, massive Sprachmodelle zu betreiben, könnten kleinere, effizientere Open-Source-Alternativen bereitstellen, die auf ihre spezifischen Bedürfnisse zugeschnitten sind.
„Open Source wird mehr Innovation an mehr Orten ermöglichen“, sagt Dave Nielsen, Community Director bei AI Alliance. „Und das wird einfach mehr Unternehmer und mehr Kunden begeistern, und es wird mehr Umsatz bringen.“
Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.