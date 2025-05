Enquanto as gerações anteriores de LLMs Granite utilizavam uma arquitetura de transformação convencional, todos os modelos da família Granite 4.0 utilizam uma nova arquitetura híbrida Mamba-2/Transformer, combinando a velocidade e a eficiência do Mamba com a precisão da autoatenção baseada em transformador. Especificamente, o Granite 4.0 Tiny-Preview é um modelo híbrido de combinação de especialistas (MoE), com 7 B de parâmetros no total e apenas 1 B de parâmetros ativos no momento da inferência.

Muitas das inovações que informam a arquitetura do Granite 4 surgiram da colaboração da IBM Research com os criadores originais do Mamba no Bamba, um modelo híbrido de código aberto experimental cujo sucessor (Bam v2) foi lançado no início desta semana.