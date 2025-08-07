Künstliche Intelligenz

Sechs strategische Weichenstellungen für den Aufbau agentenbasierter KI mit kleinen, schnellen und offenen Modellen

Laura Langendorf

Rogerio Gonçalves

Die alten Regeln der Unternehmenssoftwareentwicklung – wie etwa Roadmaps von sechs bis zwölf Monaten, umfangreiche Vorab-Infrastruktur und monolithische Releases – können mit unserer KI-gestützten Welt der neuen Generation nicht mehr mithalten. Es ist an der Zeit, die alten Regeln über Bord zu werfen, Ihren Entwicklungsansatz neu zu erfinden und zu überdenken, wie Sie Ihre Anwendungen erstellen – und zwar anhand dieser sechs Mantras:

1. Erstellen Sie geschäftsfähige Modelle, die einen schnelleren ROI liefern

Beginnen wir mit dem Herzen jeder Anwendung: dem dahinterstehenden Modell. Aber nicht jedes KI-Problem benötigt ein Modell mit Hunderten von Milliarden von Parametern. Kleine, auf die Domäne abgestimmte Modelle können bei bestimmten Aufgaben oft mit großen Modellen mithalten oder diese sogar übertreffen. Sie bieten eine vergleichbare Genauigkeit zu einem Bruchteil der Kosten und eine schnellere Inferenz. Wenn Sie sich auf die Textzusammenfassung und -analyse, die Codegenerierung, die Dokumenten-QA oder andere klar umsetzbare Probleme konzentrieren, können Entwicklungsteams:

  • Niedrigere Inferenzkosten pro Anfrage, was es für große Agentenflotten wirtschaftlich rentabel macht
  • Reduzierung der Latenz auf Reaktionszeiten im Subsekundenbereich, was für interaktive Workflows und Prozesse mit menschlicher Interaktion entscheidend ist
  • Bereitstellen in Hybrid- oder Edge-Umgebungen, um Cloud-Ausgangsgebühren zu vermeiden, während Datensouveränität und Compliance gewährleistet werden

Bei der Auswahl des richtigen Modells geht es nicht darum, die höchste Parameteranzahl zu verfolgen, sondern vom ersten Tag an die Kosten pro Nutzung, die Latenz-to-Value und die Metriken für die Aufgabe zu bewerten.

2. Plattformen flexibel gestalten und das Ökosystem offen halten

Der Erfolg von generativer KI hängt von mehr als nur der Wahl eines Modells ab. Sie müssen das richtige Modell für die Aufgabe auswählen und es mit den Tools, Plattformen und Entwicklungspraktiken umgeben, die KI in echte Geschäftsergebnisse verwandeln. Entwickler und ihre Manager sollten sich für Investitionen in Folgendes einsetzen:

  • Open-Source-KI-Modelle, die Abhängigkeiten vermeiden und lebendige Entwicklergemeinschaften fördern
  • Microfactory-Architekturen, bei denen kleine Teams eigens erstellte Modellbündel, Vorlagen und Best Practices für jeden zentralen Anwendungsfall zusammenstellen und verwalten
  • Modulare Pipelines, die es Ihnen ermöglichen, einfache Modelle und Geschäftsregeln als Microservices zu verketten, was eine schnelle Iteration, kontinuierliche Integration und nahtlose Rollbacks ermöglicht.

Dieser modulare, offene Ansatz verkürzt die Dauer von Pilotprogrammen auf Wochen statt Monate und ermöglicht es Teams, innerhalb von Minuten neue Agenten zu erstellen und das transformative Potenzial der generativen KI im gesamten Unternehmen freizusetzen.

3. Verantwortungsvolle KI von Grund auf einbetten

Wahrhaft verantwortungsvolle KI ist kein nachträglicher Gedanke; sie ist in jede Entwicklungsphase eingebettet. Bei der Entwicklung dieser Anwendungen müssen sich die Entwickler konsequent auf Folgendes konzentrieren:

  1. Transparenz bei Modellauswahl und Training: Wählen Sie Modelle, die auf offenen, prüfbaren Datensätzen trainiert sind und mit Unternehmenswerten und regulatorischen Anforderungen übereinstimmen.
  2. Strenge Datenverarbeitung: Nachverfolgen, Transformationen dokumentieren und klare, nachvollziehbare Datenpipelines von den Rohdaten bis zum Modelloutput pflegen.
  3. Human-in-the-Loop-Governance: Einbettung von Prüfungs-Checkpoints und Leistungsschwellenwerten, die Warnungen oder Eskalationen auslösen und so Compliance und Qualität fördern.

Durch die Standardisierung der Governance an der Quelle können Entwicklungsteams dazu beitragen, Verzerrung zu reduzieren, die Privatsphäre zu schützen und Vertrauen zu fördern und so den Grundstein für nachhaltige, skalierbare Bereitstellungen generativer KI zu legen.

4. Agentische KI durch einen vollständigen Lebenszyklus operationalisieren

Sobald Ihre Grundlage mit schnellen, geschäftsfähigen Modellen, modularen Pipelines und verantwortungsvollen Entwicklungspraktiken geschaffen ist, besteht der nächste logische Schritt im neuen Playbook darin, KI durch Agenten zu operationalisieren. Diese Initiative dürfte in Ihrem Unternehmen Gegenstand intensiver Diskussionen sein und ist der Punkt, an dem Theorie messbare Auswirkungen hat.

Ein KI-Agent ist ein halbautonomer „Arbeiter“, der Eingaben, Gründe für Aufgaben und Handlungen überprüft – oft in Zusammenarbeit mit Menschen und anderen Akteuren. Die Integration dieser Agenten in die Workflows von Unternehmen führt zu messbaren Produktivitätssteigerungen.

Dies sind die Lebenszyklusphasen:

  1. Design: Definieren Sie klare Agentenrollen (z. B. „Code-Extraktor“, „Testgenerator“, „Compliance-Analysator“).
  2. Aufbau: Gestaltung von Pipelines aus spezialisierten, schlanken Modellen mit Business Rules in jeder Phase.
  3. Bereitstellen: Koordinieren von Agenten auf einer zentralen Plattform mit Überwachung, Rückverfolgbarkeit und Service-Level-Vereinbarungen.
  4. Betreiben und optimieren: Feedbackschleifen sammeln, Agenten nachschulen oder neu konfigurieren und kontinuierlich den Return on Investment (ROI) messen.

5. Kombinieren Sie Agenten mit den richtigen Modellen, um den Nutzen zu maximieren

Der Schlüssel zum erfolgreichen Einsatz von Agenten in großem Maßstab liegt darin, wie effektiv man sie mit schnellen, für Unternehmen entwickelten Modellen kombiniert, um den Agentenlebenszyklus nicht nur möglich, sondern auch produktiv zu gestalten. Dieser Ansatz erfordert sorgfältiges Design, Orchestrierung und Messpraktiken, die technische Komponenten mit Geschäftsergebnissen in Einklang bringen. So gelingt Ihnen diese Integration:

  • Wählen Sie das richtige Modell: Vergleichen Sie kleine Modelle für Schlüsselaufgaben (zum Beispiel Code-to-Text, SQL-Generierung, Entitätsextraktion) und vergleichen Sie Latenz und Kosten pro 1.000 Token.
  • Fabriken und Orchestrierung aufbauen: Zusammengehörige Agenten in dedizierten Fabriken für Kernanwendungsfälle gruppieren (z. B. Banken-Mainframe, Versicherungs-Engine).
  • Regieren und überwachen: Stellen Sie eine zentrale Benutzeroberfläche/API für den Zugriff bereit und verfolgen Sie Leistung, Metriken (Latenz, Fehler), Versionierung (Agenten-ID) und menschliche Prüfpunkte im Kreislauf.
  • Wert messen: Definieren Sie klare KPIs – wie eingesparte Entwicklungsstunden, Verbesserungen der Codequalität und Kostensenkungen – und nutzen Sie ein Dashboard, um die Zeit zum Modernisieren und zur technischen Schuldenabzahlung zu überwachen.

6. Schnelle Skalierung kleiner Modelle zur Erzielung von Unternehmenswirkung

Wenn ein einziges schnelles und kompaktes Modell nur einen kleinen Prozentsatz eines großen Sprachmodells kostet, wird das Hinzufügen zusätzlicher Agenten zu einer marginalen Ausgabe. Diese Ökonomie der Verbreitung bedeutet:

  • Schnelle Skalierung: Dutzende – oder sogar Hunderte – spezialisierter Agenten können gleichzeitig ausgeführt werden, ohne das Budget zu sprengen.
  • Kontrolle des Blast-Radius: Leichtgewichtige Container und fehlerisolierte Deployments gewährleisten, dass Ausfälle einzelner Agenten nicht zu systemweiten Ausfällen führen.
  • Kontinuierliche Optimierung: Kostenbewusste Monitoring Dashboards verfolgen die CPU-/GPU-Nutzung, die Nutzung der Inferenzen pro Agent und die Leistung-KPIs und ermöglichen so eine kontinuierliche Verbesserung.

Unternehmen, die diesen Skalenvorteil nutzen, können schneller vom PoC zur unternehmensweiten Produktion hochskalieren. Diese Initiative schaltet die vollen Produktivitätsvorteile der generativen KI frei – von der Reduzierung der Kosten und der Beschleunigung der Markteinführung bis hin zur Verbesserung der Qualität, der Entscheidungsfindung und der Teameffizienz.

Von strategischen Veränderungen hin zu nachhaltiger Transformation

Die Annahme dieser sechs Mantras bedeutet nicht nur, bessere KI zu entwickeln – es geht darum, die Art und Weise, wie Innovation entsteht, und den Sitz der Intelligenz innerhalb des Unternehmens neu zu gestalten.

Sie wechseln vom Experimentieren zur Transformation. Entwicklungszyklen verkürzen sich von Monaten auf Wochen. KI-Agenten entwickeln sich von vielversprechenden Prototypen zu kritischen Betreibern. Und die Innovation wird vorhersehbar – nicht zu einem glücklichen Sonderfall, sondern zu einem wiederholbaren Prozess, der in jeden Produkt-Sprint und jede Geschäftsentscheidung eingebettet ist.

Unternehmens-KI wird ihre nächste Grenze wie folgt gestalten:

  • Composable Architekturen: Agile, wiederverwendbare Komponenten, mit denen Teams schnell bereitstellen und iterieren können, ohne das Rad neu erfinden zu müssen.
  • Kostenbewusste Orchestrierung: KI-Systeme, die Effizienz selbst überwachen und dynamisch Leistung, Budget und Compliance optimieren.
  • Hybride Intelligenz: Nahtlose Zusammenarbeit zwischen Menschen und KI-Agenten – mit Governance, Transparenz und Vertrauen im Mittelpunkt.
  • Branchenoptimierte Modelle in großem Maßstab: Anstelle von Einheits-Modell-LLMs operieren Unternehmen Flotten von branchenspezifischen Modellen, die genau auf ihre Bedürfnisse abgestimmt sind.

Die Unternehmens-KI bewegt sich von zentralisierten Mondaufnahmen zu dezentralisierten Dienstprogrammen — von einem riesigen Modell zu vielen Modellen in der richtigen Größe, die funktionsübergreifend eingebettet sind. Die Unternehmen, die gewinnen, entwickeln nicht nur intelligentere Modelle, sondern auch intelligentere Systeme, Teams und Strategien.

Durch diese sechs strategischen Veränderungen modernisieren Sie nicht nur Ihren Stack – Sie machen Ihr Unternehmen zukunftssicher.

