Granite

Offen. Leistungsfähig. Vertrauenswürdig. Apache 2.0 lizenziert. Kryptografisch signiert1. ISO-zertifiziert2.

Illustration von übereinanderliegenden geometrischen Formen in einem Farbverlauf
IBM Granite 4.1 ermöglicht die sichere Bereitstellung von KI vor Ort
Leichte, leistungsstarke Modelle, die unter einer Apache-2.0-Lizenz veröffentlicht wurden und für skalierbare Workloads im Unternehmensumfeld konzipiert sind
Mehr über Granite 4.1 erfahren

Warum mit Granite erstellen?

Erstellen und skalieren Sie KI schneller mit anpassbaren Open-Source-Modellen, die für Unternehmensworkloads, Kosteneffizienz und flexible Bereitstellungen optimiert sind.

Open
Granite ist Open Source unter Apache 2.0 und sorgt für Transparenz, während es gleichzeitig volle Anpassbarkeit und Bereitstellungsflexibilität in jeder Infrastruktur ermöglicht.
Modelle herunterladen
Leistungsfähig
Die kleinen, leistungsstarken Modelle sind so konzipiert, dass sie die Effizienz und Skalierbarkeit für wesentliche Unternehmensaufgaben maximieren.
Benchmarks überprüfen
Trusted
Eliminieren Sie das Risiko einer „Blackbox“-KI mit Transparenz bei Trainingsdaten und -prozessen, Funktionen zur Schadenserkennung und integrierten Verhaltensregeln.
Mehr erfahren
Wir stellen vor: Granite 4.1
Granite 4.1 Sprachmodelle

Unsere bislang leistungsstärksten dichten, nicht denkenden Modelle. Bei einer Vielzahl von Unternehmensaufgaben sind sie mit größeren, denkenden Modellen konkurrenzfähig – und das zu einem Bruchteil der Kosten. 

Sprachmodelle herunterladen
Granite 4.1 Sprachmodelle

Klein und doch leistungsstark. Branchenführende Transkriptionsgenauigkeit bei verschiedenen Akzenten, Themenbereichen und in lauten Umgebungen. 

Sprachmodelle herunterladen
Granite 4.1 Vision-Modelle

Verstehen Sie Dokumente, Diagramme und Bilder mit der Präzision eines Unternehmens.

Vision-Modelle herunterladen
Granite 4.1 Guardian-Modelle

Schutzmaßnahmen zur Erkennung bösartiger Inhalte und schädlicher Ausgaben. Entwickelt für die Unternehmens-Compliance.

Guardian-Modelle herunterladen
Granite-Embedding-Modelle

Präzise semantische Darstellungen für Abruf, Suche und Klassifizierung.

Einbettungsmodelle herunterladen

Benchmarks erkunden

Diese Modelle wurden auf Grundlage einer großen Sammlung von Datensätzen und Metriken bewertet, um verschiedene Aspekte der Textgenerierung abzudecken. Weitere Benchmarks finden Sie im technischen Blog von Granite.​

 

Benchmark​MetrikGranite-4.1-3b​Granite-4.1-8b​granite-4.1-30b​
MMLU​5-shot​67,02​73,84​80,16​
IFEval Avg​ 82,3​87,06​8965​
ArenaHard​ 37,8​68,98​71,02​
GSM8K​8-shot​86,88​92.49​94,16​
HumanEval​pass@1​79,27​872​89,63​
BFCL v3​ 60,8​68,27​73,68​
MMMLU​5-shot​57,61​64,84​7371​
AttaQ​ 81,88​81,19​85,76​

Leistung und Effizienz

Granite 4.1 bietet eine wettbewerbsfähige Leistung bei der Ausführung von Befehlen und dem Tool-Aufruf, ohne auf lange Denkketten angewiesen zu sein, und zeichnet sich durch vorhersehbare Latenzzeiten, einen stabilen Token-Verbrauch sowie geringere Betriebskosten aus. Dies macht es zu einer leistungsstarken, produktionsreifen Wahl für Unternehmens-Workloads, bei denen Effizienz und Zuverlässigkeit oberste Priorität haben.

Die Sprachmodelle von Granite 4.1 verstehen und führen toolbasierte Anweisungen aus, was eine nahtlose Integration mit verschiedenen Tools und APIs ermöglicht. Mit dieser Funktion können Unternehmen leistungsstarke KI-gestützte Workflows erstellen und gleichzeitig komplexe Aufgaben automatisieren.

Horizontales Balkendiagramm mit dem Titel „Die Sprachmodelle von Granite 4.1 bieten überlegene Funktionen für den Tool-Aufruf“, basierend auf den BFCL-V3-Benchmark-Ergebnissen (je höher, desto besser). Granite-4.1-30B liegt mit 73,7 an der Spitze, gefolgt von Gemma-4-31B-it mit 72,7 und Granite-4.1-8B mit 68,3. Die übrigen Modelle erzielen Werte zwischen etwa 61,7 und 67,8, darunter Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1) Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64.2), Gemma-4-E4B-it (63.2), Qwen3-4B-Instruct-2507 (61.9) und Qwen3.5-9B (61,7). Die Granite-4.1-Modelle sind blau hervorgehoben und schneiden besser ab als die anderen.

Die Sprachmodelle von Granite 4.1 verstehen und befolgen Benutzeranweisungen und gewährleisten so eine zuverlässige und präzise Ausführung von Aufgaben. Diese Fähigkeit ist besonders wertvoll für Unternehmen, die Prozesse automatisieren und konsistente, qualitativ hochwertige Ergebnisse erzielen möchten.

Horizontales Balkendiagramm mit dem Titel „Granite 4.1-Sprachmodelle bieten wettbewerbsfähige Funktionen zur Instruktionsverfolgung“, basierend auf den Ergebnissen von IFEval. Gemma-4-31B-it belegt mit 94,1 den höchsten Rang, gefolgt von Gemma-4-26B-A4B-it mit 91,3. Granite-4.1-30B erreicht 89,7 Punkte und liegt damit leicht über dem Wert von Qwen3.5-35B-A3B bei 89,1 und vor mehreren Modellen zwischen etwa 85 und 88, darunter Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87.2) und Granite-4.1-8B (87.1). Niedrigere Punktzahlen umfassen Granite-4.1-3B bei 82,1 und Qwen3.5-2B bei 70,6. Granite 4.1-Modelle sind blau hervorgehoben und zeigen eine wettbewerbsfähige, aber nicht erstklassige Leistung im Vergleich zu Gemma-Modellen.

Granite Guardian 4.1 erkennt die im IBM AI Risk Atlas katalogisierten wesentlichen Risikodimensionen. Guardian wurde anhand einzigartiger Daten trainiert, die menschliche Anmerkungen und synthetische Daten aus internen Red-Team-Tests umfassen, und übertrifft ähnliche Modelle bei Standard-Benchmarks (unter anderem bei Jailbreak-Versuchen, Obszönitäten und Halluzinationen im Zusammenhang mit Tool-Aufrufen sowie bei der Retrieval-Augmented Generation in agentenbasierten Systemen).

Tabelle zum Vergleich der Modellleistung über verschiedene Bewertungsdatensätze hinweg, mit Spalten für Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B und einer Oracle-Baseline. Granite-Guardian-4.1-8B (hervorgehoben) erzielt bei allen Datensätzen hervorragende Ergebnisse: GSM8k (93,71) MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70) und IFEval (82,81), mit einer Gesamtpunktzahl von 70,29. Es übertrifft andere Modelle in den meisten Kategorien leicht, während die Oracle-Werte insgesamt weiterhin am höchsten liegen, darunter 97,46 bei GSM8k und 81,54 insgesamt.

Granite Speech 4.1 bietet eine hochpräzise, unternehmensgerechte Spracherkennung in vielfältigen realen Audio-Umgebungen und erzielt niedrige Wortfehlerraten in Benchmarks, die Gesprächssprache, Besprechungen, Präsentationen und Telefonkonferenzen zu Geschäftsergebnissen umfassen.

Gruppiertes Balkendiagramm mit dem Titel „Granite Speech 4.1 übertrifft die Konkurrenz bei der Transkriptionsgenauigkeit“, das die Wortfehlerraten der englischen Spracherkennung (ASR) für neun Datensätze zeigt (niedriger ist besser): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM und Earnings-22. Es werden mehrere Modelle verglichen, darunter Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary und Varianten von Granite Speech (hellblau). Granite-Speech-Modelle erzielen in den meisten Datensätzen durchweg die niedrigsten Fehlerraten. Die Fehlerquoten liegen bei etwa 1–2 bei LScln, 3–5 bei LSoth und SPGI, etwa 9–16 bei AMI_IHM und am höchsten bei AMI_SDM (etwa 22–41). Die Grafik zeigt, dass Granite Speech 4.1 im Vergleich zu den Konkurrenzmodellen die beste Gesamtgenauigkeit bei der Transkription liefert.

Granite Vision 4.1 bietet branchenführende Leistung bei der Extraktion strukturierter Informationen aus visuellen Inhalten und erzielt die höchste Durchschnittsbewertung in sieben Benchmarks, die die Extraktion von Diagrammen, Tabellen und Schlüssel-Wert-Paaren (KVP) umfassen.

Horizontales Balkendiagramm mit dem Titel „Granite Vision 4.1 übertrifft Claude Opus 4.6 bei der Tabellenextraktion“, das die Durchschnittswerte aus sieben Extraktions-Benchmarks zeigt (höher ist besser). Granite-Vision-4.1-4B liegt mit einer Punktzahl von 86,5 an der Spitze, gefolgt von Claude-Opus-4.6 mit 83,8. Andere Modelle erzielen niedrigere Werte: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68,2) und InternVL3.5-4B (66,4). Granite Vision ist blau hervorgehoben, Claude violett und die übrigen Modelle grau, wodurch „Granite Vision“ als Spitzenmodell hervorgehoben wird.

Unternehmen aller Branchen vertrauen darauf

US Open

Die US Open wollten Fans weltweit mit sich ständig weiterentwickelnden digitalen Erlebnissen begeistern. IBM half dabei, riesige Mengen an Spieldaten in KI-gestützte Erkenntnisse und interaktive Funktionen umzuwandeln und so ein dynamisches App- und Website-Erlebnis zu schaffen, das die Fans auf dem Laufenden hält und sie in jeden Moment eintauchen lässt.

14 Mio.
Millionen Fans weltweit, die in digitale Erlebnisse von Weltklasse eintauchen
7 Mio.
Datenpunkte wurden im Verlauf des Turniers erfasst und analyisiert
Weitwinkelaufnahme des US-Open-Stadions mit Zuschauern, die ein Spiel verfolgen

Granite für Entwickler

Rezept: Zusammenfassung von Dokumenten

Erstellen Sie mit IBM Granite einen Generator für Dokumentenzusammenfassungen, um Dokumente auch außerhalb der Grenzen des Kontextfensters zu verarbeiten.

RAG mit Langchain

Erstellen Sie eine RAG-Pipeline mit Granite, um Anfragen mithilfe einer externen Wissensdatenbank zu beantworten.

Rezept: Multimodale RAG

Erstellen Sie mit Granite und Docling eine multimodale RAG-Pipeline, um Text, Tabellen und Bilder abzufragen.

Leitfaden: Open-Source-Modelle

Erfahren Sie, wie Open-Source-LLMs Autonomie ermöglichen, Kosten senken und Entwickler bei Evaluierung, Optimierung und Bereitstellung unterstützen.

Tutorial: Zeitreihen-Forecasts

Verwenden Sie Granite-Zeitreihenmodelle, um Zero-Shot- und fein abgestimmte Zeitreihen-Forecasts durchzuführen.

Granite Agent Cookbook

Granite-Rezepte für agentische Aufgaben.

Tutorial: Lokaler KI-Copilot

Erstellen Sie einen lokalen KI-Copiloten mit IBM Granite Code, Ollama und Continue.

Granite Cookbook

Das vollständige Granite Cookbook ansehen

Erstellung auf Granite

Granite-Modelle treiben die KI hinter vielen Produkten und Dienstleistungen von IBM an. Entdecken Sie einsatzbereite Lösungen für Codegenerierung, Anwendungsentwicklung und Modelltests. Alles basiert auf IBM Granite.

KI-Codierungsagent

Beschleunigen Sie die Codierung und optimieren Sie die Entwicklung mit KI und Automatisierung unter Verwendung von Granite-Modellen.

AI Coding Agent erkunden
watsonx.ai

Erstellen und stellen Sie KI-Anwendungen mit Granite-Modellen bereit oder wählen Sie aus einer Vielzahl von Drittanbietermodellen.

watsonx.ai erkunden
watsonx Orchestrate

Entwickeln und verwalten Sie KI-Agenten mit Granite und erkunden Sie den Katalog der vorkonfigurierten Agenten.

watsonx Orchestrate
Red Hat Enterprise Linux KI

Entwickeln, testen und Large Language Models ausführen, darunter Granite.

Red Hat Enterprise Linux AI erkunden

IBM engagiert sich für die Erstellung, den Einsatz und die Nutzung von KI-Modellen, die Innovationen unternehmensweit auf verantwortungsvolle Weise vorantreiben. Die KI- und Datenplattform watsonx von IBM umfasst einen durchgängigen Prozess zum Erstellen und Testen von Foundation Models und generativer KI. Bei den von IBM entwickelten Modellen suchen wir nach Duplikaten und entfernen diese. Außerdem setzen wir URL-Blocklisten, Filter für anstößige Inhalte und Dokumentenqualität, Satzsplitting und Tokenisierungstechniken ein – und das alles vor dem Training der Modelle.

Während des Datentrainings versuchen wir, Abweichungen in den Modellergebnissen zu vermeiden und verwenden eine überwachte Feinabstimmung, damit die Anweisungen besser befolgt werden können. Auf diese Weise kann das Modell zur Erledigung von Unternehmensaufgaben mittels Prompt Engineering eingesetzt werden. Wir entwickeln die Granite-Modelle in mehrere Richtungen weiter und arbeiten an weiteren Modalitäten, branchenspezifischen Inhalten und weiteren Datenkommentaren für das Training. Gleichzeitig stellen wir regelmäßige, fortlaufende Datenschutzmaßnahmen für die von IBM entwickelten Modelle bereit. 

Angesichts der sich schnell weiterentwickelnden Landschaft der generativen KI-Technologie müssen wir unsere Prozesse durchweg kontinuierlich anpassen und verbessern. IBM legt großen Wert auf eine sorgfältige Entwicklung und Tests seiner Foundation Models. Deshalb bietet das Unternehmen für alle von IBM entwickelten Modelle eine standardmäßige vertragliche Haftungsfreistellung für geistiges Eigentum, wie sie auch für IBM Hardware- und Softwareprodukte gilt.

Im Gegensatz zu einigen anderen Anbietern von Large Language Models und gemäß dem Standardkonzept von IBM für Haftungsfreistellungen fordert IBM von seinen Kunden keine Entschädigung für die Nutzung der von IBM entwickelten Modelle durch den Kunden. Darüber hinaus legt IBM keine Obergrenze für seine Haftungsverpflichtung für die von IBM entwickelten Modelle fest und bleibt damit seinem Ansatz in Bezug auf die Haftungspflicht treu.

Folgende aktuelle watsonx Modelle unterliegen diesem Schutz:

(1) Slate-Familie mit reinen Encoder-Modellen.

(2) Granite-Familie mit reinen Decoder-Modellen.

Mehr zur Lizenzierung für Granite-Modelle

1Seit dem 29. April 2026 werden veröffentlichte Granite-Modelle für Sprache, Bildverarbeitung, Sprachverarbeitung, Einbettung und Schutz kryptografisch signiert.

2Die ISO-Zertifizierung gilt für das Granite AI Management System (AIMS) der Granite-Vision Language Models. Das Zertifikat finden Sie hier: https://www.schellman.com/certificate-directory unter Zertifikats-Nr. 1102257-1.