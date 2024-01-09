Das Aufkommen der generativen KI veranlasste mehrere namhafte Unternehmen, deren Nutzung aufgrund des falschen Umgangs mit sensiblen internen Daten einzuschränken. Nach Angaben von CNN haben einige Unternehmen interne Verbote für generative KI-Tools verhängt, um die Technologie besser zu verstehen, und viele haben auch die Verwendung von internem ChatGPT blockiert.

Unternehmen nehmen bei der Erforschung großer Sprachmodelle (LLMs) häufig noch immer das Risiko in Kauf, interne Daten zu verwenden, da diese kontextbezogenen Daten den Wandel von LLMs von allgemeinem zu domänenspezifischem Wissen erst ermöglichen. Im Entwicklungszyklus der generativen KI oder traditionellen KI dient die Datenaufnahme als Einstiegspunkt. Hier können Rohdaten, die auf die Anforderungen eines Unternehmens zugeschnitten sind, gesammelt, vorverarbeitet, maskiert und in ein für LLMs oder andere Modelle geeignetes Format umgewandelt werden. Derzeit gibt es kein standardisiertes Verfahren zur Bewältigung der Herausforderungen bei der Dateneingabe, aber die Genauigkeit des Modells hängt davon ab.