Rectángulos tridimensionales abstractos

Lista de modelos de lenguaje de gran tamaño (LLM)

Una lista de LLM

Los modelos de lenguaje de gran tamaño (LLM) se han convertido en la base del desarrollo de la inteligencia artificial moderna. Iniciaron y ahora definen la era de la IA generativa, desde las sencillas aplicaciones de chatbot hasta la ingeniería agéntica y otros complejos flujos de trabajo automatizados impulsados por agentes de IA. Su llegada ha marcado un punto de inflexión fundamental en la historia del machine learning.

A medida que la tecnología madura, siguen apareciendo nuevos LLM. Los principales desarrolladores de IA, las nuevas empresas emergentes y las potencias empresariales consolidadas lanzan y perfeccionan constantemente nuevos modelos. Mientras tanto, la comunidad de código abierto afina constantemente los LLM de código abierto, fusionando y modificando los modelos existentes en conjuntos de datos personalizados para crear un sinfín de variantes. Por lo tanto, ninguna lista de LLM puede pretender ser exhaustiva, y ni siquiera la lista más “exhaustiva” lo seguiría siendo durante mucho tiempo.

A continuación, se presenta una lista de algunos de los LLM más destacados y eficientes disponibles hoy en día. Estas son algunas cosas a tener en cuenta:

  • La lista da prioridad a los modelos que reciben soporte y actualizaciones constantes por parte de sus desarrolladores, y que mantienen un rendimiento al menos mínimamente competitivo. Esto excluye una serie de modelos fundacionales históricamente influyentes, como T5 de Google, GPT-3 de OpenAI o Llama 2 de Meta, algunos de los cuales siguen utilizándose con fines de investigación.

A efectos prácticos, los LLM pueden dividirse generalmente en dos categorías: los LLM de código cerrado, disponibles únicamente como oferta comercial a través del desarrollador del modelo, y los modelos abiertos, que se ponen a disposición del público de forma gratuita.

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think. 

LLM de código cerrado

A un modelo de código cerrado, o modelo propietario, solo se puede acceder directamente en la plataforma del desarrollador del modelo, en otras plataformas a las que haya concedido la licencia de su modelo o a través de la API propietaria del proveedor del modelo.

Dado que los desarrolladores de modelos cerrados suelen considerar sus detalles técnicos como secretos comerciales celosamente guardados, por lo general es imposible conocer con certeza los detalles concretos del tamaño de un modelo cerrado, la arquitectura de la red neuronal o el proceso de entrenamiento. Se pueden inferir algunos detalles, por ejemplo, comparando la velocidad de inferencia, el uso de memoria de la GPU y el rendimiento en pruebas comparativas de un modelo cerrado con los de modelos abiertos cuyos detalles se han hecho públicos, aunque rara vez, por no decir nunca, se confirman.

Al menos desde aproximadamente 2022, la mayoría de los modelos de vanguardia en cada momento han sido modelos cerrados, pero eso se debe en gran medida a las circunstancias históricas reales del sector, más que a una superioridad inherente de los modelos cerrados frente a los abiertos. A continuación se presentan algunas de las series de modelos cerrados más conocidos, ordenadas alfabéticamente.

Claude (Anthropic)

Los modelos de lenguaje Claude de Anthropic se encuentran entre los más eficaces del mundo. Fundado originalmente como un laboratorio de investigación sobre la seguridad de la IA en 2021 por antiguos empleados de OpenAI, el enfoque de Anthropic para el desarrollo de modelos se basa en el concepto único de la IA constitucional. La “Constitución” de Claude es un documento que sirve no solo para orientar la conducta de los empleados de Anthropic, sino también la conducta (y la creación de datos de entrenamiento sintéticos) de los propios modelos de Claude.

Desde Claude 3, las sucesivas generaciones de Claude han presentado modelos multimodales en tres tamaños diferentes:

  • Claude Haiku son los modelos más pequeños de Anthropic, optimizados para la velocidad y la rentabilidad. A diferencia de Sonnet y Opus, los modelos Haiku no son modelos de razonamiento: a menos que se les indique expresamente, los modelos de Haiku no generan trazas de razonamiento de la cadena de pensamiento (CoT).
  • Claude Sonnet son los modelos de tamaño medio de Anthropic, dirigidos a lo que Anthropic considera el equilibrio óptimo entre rendimiento y eficiencia para la mayoría de los casos de uso. Tanto Sonnet como Opus son modelos de razonamiento híbridos, lo que significa que pueden configurarse para realizar tanto inferencias estándar como razonamiento CoT adaptativo para la resolución de problemas complejos de varios pasos.
  • Claude Opus son los modelos más grandes y potentes de Anthropic, dirigidos a un rendimiento de vanguardia en tareas desafiantes.

Claude, Haiku, Sonnet y Opus pueden procesar entradas de texto, audio e imágenes, y generar texto o audio (mediante la conversión de texto a voz). Históricamente, a diferencia de la mayoría de sus competidores que utilizan modelos cerrados, ellos (y la plataforma Claude que utilizan) no eran capaces de generar imágenes; sin embargo, desde el 12 de marzo de 2026, Claude ya puede generar imágenes. Al acceder a los modelos a través de la API de Claude, los usuarios pueden establecer el “nivel de esfuerzo” del proceso de razonamiento de Sonnet u Opus en “máximo”, “alto”, “medio”, “bajo” o “adaptativo”.

Géminis (Google)

Gemini es la serie de modelos de lenguaje cerrados de Google, desarrollada por su filial Google DeepMind y lanzada por primera vez en diciembre de 2023. Cabe señalar que Google Brain (que se fusionó con DeepMind para formar Google DeepMind en 2023) es responsable de la creación de la arquitectura del modelo transformador que hizo posible los primeros LLM, tras haber publicado el histórico artículo de investigación “Attention is All You Need” en 2017.

Desde principios de 2025, Google ha lanzado cada generación de modelos Gemini con tres tamaños diferentes, todos ellos modelos de razonamiento. Cuando se accede a través de la API Gemini, los usuarios pueden seleccionar uno de varios “niveles de pensamiento” para personalizar la cantidad de tokens y el tiempo que el modelo dedicará antes de generar un salida.

  • Los modelos Gemini Pro son los LLM más grandes y de última generación de Google.

  • Los modelos Gemini Flash, en comparación con Gemini Pro, están optimizados para la velocidad.

  • Los modelos Gemini Flash-Lite son modelos rápidos y rentables optimizados para tareas de gran volumen, como la traducción y el uso de herramientas agénticas.

Los modelos Gemini Pro, Flash y Flash-Lite son multimodales de forma nativa: pueden procesar entradas de texto, audio, imagen o vídeo y generar salidas de texto. Cuando se accede a través de la plataforma Gemini, los resultados multimodales se pueden generar a través de modelos separados y especializados de Gemini para la generación de imágenes, la generación de vídeo o la generación de música.

Desde el lanzamiento de Gemini 2.5 Pro en marzo de 2025, que logró el mejor rendimiento del sector en la mayoría de los puntos de referencia académicos, los modelos Gemini han competido con la serie GPT de Claude y OpenAI como los LLM de mayor rendimiento del mundo. En términos generales, el título de “modelo estrella” cambia de manos cada vez que se lanza un nuevo modelo de vanguardia de alguna de esas tres series.

Grok (xAI)

Grok es una familia de LLM propietarios producidos por xAI, lanzados por primera vez en versión beta previa como chatbot en X (antes Twitter) en noviembre de 2023. En abril de 2025, xAI lanzó el acceso a la API para Grok 3, que era entonces su modelo más reciente y emblemático.

La gama de modelos de Grok ha ido evolucionando con cada nueva generación de modelos lanzados al mercado.

  • Grok 2 vino acompañado de Grok 2 Mini, la primera variante de la gama basada en el tamaño. Esta misma convención se repitió para Grok 3 en febrero de 2025.

  • La cuarta generación de modelos Grok se lanzó con Grok 4 y Grok 4 Heavy en julio de 2025. En otoño de 2025, les siguieron Grok 4 Fast y, posteriormente, Grok 4.1 (disponible en configuraciones con y sin función de pensamiento).

  • En agosto de 2025, xAI lanzó Grok Code Fast 1, un modelo centrado en la eficiencia y optimizado para la codificación agéntica.

A partir de Grok 4, los modelos Grok pueden procesar entradas de texto, imágenes y voz. Aunque los LLM de Grok no pueden proporcionar salidas multimodales, el modelo Aurora de xAI puede generar resultados de imagen y vídeo a través de su plataforma Grok Imagine.

Aparte de su rendimiento, gran parte de la historia de Grok (y en particular la del chatbot Grok) ha estado marcada por la controversia, como las acusaciones de difundir desinformación electoral, insertar puntos de vista polarizadores en conversaciones no relacionadas y perpetuar estereotipos dañinos.

Versiones de código abierto

En declaraciones públicas, el CEO de xAI, Elon Musk, ha dicho que “nuestro enfoque general consiste en publicar la última versión como código abierto cuando la siguiente versión esté completamente disponible”1.

xAI lanzó Grok 1 de código abierto bajo licencia Apache 2.0 en marzo de 2024. Aunque Grok 3 se lanzó en febrero de 2025, la próxima versión de código abierto de un modelo Grok no fue hasta agosto de 2025. Curiosamente, xAI (y Musk) anunciaron que habían publicado “Grok 2.5” 2 de código abierto, aunque antes de ese comunicado no se había mencionado ni anunciado ningún modelo con ese nombre. La ficha del modelo Hugging Face del propio modelo incluso se refiere al modelo como “Grok-2”.

En ese anuncio de agosto de 2025, Musk indicó que Grok 3 también sería de código abierto en “unos seis meses”. Ocho meses después, dicha fecha de lanzamiento de código abierto aún no se ha anunciado.

GPT (OpenAI)

A la serie GPT de OpenAI, abreviatura de Generative Pretrained Transformer, se le atribuye en gran medida el inicio de la era actual de la IA generativa, sobre todo tras el lanzamiento en 2022 de ChatGPT con su modelo GPT-3.5.

Las convenciones de OpenAI para la nomenclatura de modelos y las variantes han cambiado significativamente desde 2022, a menudo de forma confusa. Por ejemplo, GPT-4.1 se lanzó después de GPT-4.5, y el modelo de razonamiento o4 estaba disponible al mismo tiempo que el modelo de razonamiento multimodal GPT-4o, que era completamente distinto de su modelo de razonamiento “o4”, cuyo rendimiento era inferior al de “o3”. A principios de 2025, el CEO de OpenAI, Sam Altman, reconoció que “nos hemos dado cuenta de lo complicadas que se han vuelto nuestras ofertas de modelos y productos”.

Desde el lanzamiento de GPT-5 en agosto de 2025, las ofertas consolidadas de LLM de la empresa ahora comprenden:

  • GPT-5.x es la oferta insignia de uso general de OpenAI. A partir de marzo de 2026, la última versión del modelo es GPT-5.4. Aunque todos los modelos GPT-5 son modelos de razonamiento, GPT-5.4 también está disponible en una variante GPT-5.4 Pro, que “utiliza más recursos informáticos para realizar cálculos más complejos y ofrecer respuestas cada vez mejores”3 .OpenAI también ofrece GPT-5 Codex, una versión de GPT-5 afinada para la generación óptima de código agéntico (que se actualiza periódicamente siguiendo las versiones actualizadas del modelo central).
  • GPT-5 mini ofrece “inteligencia casi fronteriza para cargas de trabajo sensibles a los costes, de baja latencia y de gran volumen”, según las descripciones generales del modelo de OpenAI.
  • GPT-5 nano es la “versión más rápida y rentable de GPT-5”.

OpenAI también ha publicado dos modelos GPT de pesos abiertos, que se describen en detalle en la sección “Modelos abiertos” de este artículo.

Mistral AI

Mistral AI, una empresa con sede en Francia fundada por antiguos empleados de Meta AI y Google DeepMind, se dedicó originalmente por completo a los modelos de código abierto tras el lanzamiento de su primer modelo (Mistral 7B) en septiembre de 2023. Desde entonces, Mistral ha pasado a un modelo mixto en el que muchas de sus ofertas tienen versiones abiertas, pero algunos modelos de frontera siguen siendo de código cerrado.

A partir de marzo de 2026, los principales LLM patentados de Mistral IA incluyen:

  • Mistral Medium 3.1, un modelo multimodal de propósito general lanzado en agosto de 2025.

  • Codestral, un modelo centrado en la codificación “creado específicamente para la finalización de textos con relleno intermedio (FIM) de alta precisión”4.

  • Magistral Medium 1.2, un modelo de razonamiento complementario a Mistral Medium.

Las ofertas de modelos de pesos abiertos de Mistral se detallan más adelante en este artículo.

AI Academy

Por qué los modelos fundacionales son un cambio de paradigma para la IA

Conozca una nueva clase de modelos de IA flexibles y reutilizables capaces de desbloquear nuevos ingresos, reducir costes y aumentar la productividad, y utilice nuestra guía para profundizar más en el tema.

LLM de código abierto

En el ámbito del machine learning, código abierto se utiliza a menudo de manera coloquial para referirse a herramientas de IA cuyo código fuente está disponible de forma gratuita, pero el término es, en realidad, una denominación formal regulada por la Open Source Initiative (OSI). La OSI solo certifica una licencia de software determinada como “aprobada por la Open Source Initiative” si considera que dicha licencia cumple los diez requisitos enumerados en la Open Source Definition (OSD) oficial.

La mayoría de los modelos de “código abierto” no cumplen todos esos requisitos. Siendo así, el término modelo abierto (o modelo de pesos abiertos) se refiere con mayor precisión a cualquier LLM de libre distribución. Dentro del espectro de modelos abiertos hay una gran variabilidad. Un modelo de pesos abiertos (pero no de código abierto) se puede utilizar para ejecutar inferencias e incluso se puede afinar, pero si no se proporciona su código fuente completo, no se puede modificar más allá de los cambios en los valores de sus pesos mediante el fine-tuning. Su licencia puede prohibir el uso del modelo en algunos escenarios (como entornos comerciales) o establecer otras estipulaciones específicas en su aplicación.

Por el contrario, un verdadero modelo de código abierto publicado con el código de entrenamiento y una descripción de sus procedimientos de entrenamiento puede modificarse completamente de cualquier forma y utilizarse sin restricciones. Las licencias de código abierto más comunes y estandarizadas son la licencia Apache 2.0 y la licencia MIT. No obstante, cabe señalar que, a menos que el desarrollador de un modelo de código abierto facilite los detalles de sus datos de entrenamiento, el modelo en sí no es totalmente reproducible.

Las versiones de código abierto son parte integral del desarrollo y la mejora continuos de los LLM y son en gran medida responsables de permitir su invención en primer lugar. Normalmente se puede acceder a los modelos abiertos a través de su desarrollador de modelos o de plataformas populares de código abierto como GitHub o Hugging Face. A continuación se presenta una lista de series de modelos abiertos destacados, ordenados alfabéticamente.

Cohere

Cohere, una empresa con sede en Canadá entre cuyos fundadores se encuentra uno de los autores de “Attention is All You Need”, se lanzó en 2019. Aunque la empresa publica informes técnicos detallados para cada LLM y aparentemente los publica como modelos de pesos abiertos, Cohere licencia sus versiones abiertas bajo una versión modificada de la licencia Creative Commons 4.0 que prohíbe el uso comercial.

Command

 Command es la serie de modelos fundacionales insignia de Cohere, diseñada para casos de uso empresarial.

  • Command R fue la primera generación de modelos empresariales de Cohere, lanzada en marzo de 2024 con un modelo de 35 000 millones de parámetros con énfasis en RAG y uso de herramientas. Su lanzamiento fue seguido pronto por Command R+, una variante 104 000 millones, al mes siguiente. A ellos se unió el Command R7B más pequeño en diciembre.

  • Command A, la segunda generación de modelos empresariales de Cohere, se lanzó en marzo de 2025 con un enfoque en tareas empresariales, STEM y de codificación. El modelo de 111 000 millones de parámetro original finalmente se lanzó en variantes que incluyen Command A Reasoning, Command A Translate (afinado para optimizar el rendimiento de la traducción en 23 idiomas) y Command A Vision, un modelo de lenguaje de visión (VLM) que emparejaba el LLM con un codificador de visión.

En un comentario publicado en Reddit en marzo de 2026, el CEO de Cohere, Aidan Gomez, indicó que la empresa estaba desarrollando activamente la próxima generación de Command, y que estos serían los primeros modelos de la organización basados en una combinación de expertos (MoE).

Aya

Aya es la serie de modelos de Cohere centrada en el multilingüismo, lanzada por primera vez en febrero de 2024 con el modelo Aya 101, que, como su nombre indica, era “capaz de seguir instrucciones en 101 idiomas”.

  • Aya Vision es un VLM multimodal y multilingüe, que se ofrece en las variantes de 8000 millones y 32 000 millones de parámetros, con capacidades en 23 idiomas diferentes.

  • Tiny Aya, lanzada en febrero de 2026 es una serie de modelos multilingües ligeros con 3350 millones de parámetros. Tiny Aya-Base es un modelo preentrenado que admite más de 70 idiomas. TinyAya-Global es su versión optimizada para instrucciones, compatible con 67 idiomas.

  • La versión de Tiny Aya también contenía variantes regionales especializadas. TinyAya-Earth está optimizado para lenguas africanas y de Asia Occidental; TinyAya-Fire está optimizado para lenguas del sur de Asia; TinyAya-Water está optimizado para idiomas Asia-Pacífico y Europa.

DeepSeek

DeepSeek es un actor integral en el ecosistema de código abierto, que aporta una serie de innovaciones a las arquitecturas LLM y los procesos de formación. En ocasiones, el rendimiento de sus modelos ha rivalizado con el de los modelos cerrados de primer nivel. Sus LLM, tanto los pesos como el código, son de código abierto bajo una licencia estándar del MIT. DeepSeek también publica con frecuencia documentos técnicos que detallan sus hallazgos y técnicas.

  • DeepSeek-V3 es un modelo MoE de gran tamaño, con un total de 671 000 millones de parámetros (y 37 000 millones de parámetros activos durante la inferencia), que se lanzó por primera vez a finales de 2024. A menudo se atribuye a este modelo el mérito de haber devuelto la prominencia a la mezcla de arquitectura de expertos.

  • DeepSeek-R1 es un modelo de razonamiento creado al afinar DeepSeek-V3 utilizando técnicas de aprendizaje por refuerzo que por entonces eran novedosas. DeepSeek-R1 marcó un hito en la historia de los LLM de código abierto. No solo rivalizó con el rendimiento del modelo o1 de OpenAI, inigualable hasta ahora, sino que proporcionó un documento técnico con todos los detalles de la metodología de entrenamiento de DeepSeek. Su lanzamiento inspiró directamente la primera generación de modelos de razonamiento abierto.

  • DeepSeek-V3.1, lanzado en agosto de 2025, es un modelo de razonamiento híbrido, configurado para ejecutar tanto la inferencia estándar como el razonamiento CoT. En esencia, combinó DeepSeek-V3 y DeepSeek-R1 en un solo modelo. Se actualizó por última vez como DeepSeek-V3.2 en octubre de 2025. Tanto DeepSeek-V3.1 como DeepSeek-V3.2 convervan la arquitectura MoE del modelo original, con 671 000 millones y 37 000 millones de parámetros.
  • DeepSeek también lanzó varios modelos “DeepSeek-R1-Distill”, creados afinando modelos más pequeños de Qwen y Llama para emular DeepSeek-R1 mediante destilación de conocimiento.

A pesar de los rumores periódicos de un inminente DeepSeek-V4 (o “DeepSeek-R2”), sus lanzamientos aún no se han materializado.

Halcón (TII)

La serie Falcon de LLM ha sido desarrollada por el Instituto de Innovación Tecnológica (TTI) de los Emiratos Árabes Unidos. Aunque la primera generación de modelos de TII, lanzada en 2023, destacó sobre todo por el Falcon-180B, que en aquel momento era uno de los modelos de código abierto más grandes disponibles, desde entonces TII se ha centrado en modelos más pequeños. Falcon2 contaba con 11 000 millones de parámetros, mientras que Falcon3, los primeros modelos multimodales de TII (lanzados en diciembre de 2024), oscilaban entre 1000 y 10 000 millones de parámetros.

Las generaciones más recientes de modelos Falcon se han centrado en modelos híbridos Mamba-Transformer.

  • Falcon-H1, lanzado en mayo de 2025, incluye modelos híbridos preentrenados y ajustados mediante instrucciones en variantes de 500 millones, 1,5 mil millones, 3000 millones, 7000 millones y 34 000 millones de parámetros. Falcon-H1R, lanzado en enero de 2026, es una variante de razonamiento del Falcon-H1-7B.

  • Falcon-H1-Tiny son, como su nombre indica, variantes extremadamente pequeñas de Falcon-H1, en tamaños de 90 millones, 100 millones y 600 millones de parámetros. Cada tamaño está disponible tanto en modelos básicos como en variantes especializadas, diseñadas específicamente para casos de uso concretos.

  • Los modelos Falcon-Edge son una familia de LLM experimentales de 1 bit (“BitNet”) en tamaños de 1000 millones y 3000 millones de parámetros.

Los modelos Falcon se publican bajo una licencia patentada de Falcon que se inspira en el marco Apache 2.0, pero añade estipulaciones y restricciones notables.

Gemma (Google)

Gemma es la familia de modelos abiertos de Google. Según Google, los modelos Gemma están “construidos con la misma tecnología que impulsa [sus] modelos Gemini”7.

  • Gemma 3, lanzado en marzo de 2025, es la última generación del principal LLM de Gemma. La versión inicial de Gemma incluía variantes tanto preentrenadas como ajustadas para tareas específicas, con tamaños de 1000 millones, 4000 millones, 12 000 millones y 27 000 millones de parámetros. En agosto de 2025, Google añadió una variante más pequeña con 270  millones de parámetros. Los modelos Gemma 3 pueden procesar entradas de texto o imágenes y ofrecen soporte multilingüe para más de 140 idiomas.
  • Gemma 3n, lanzado en julio de 2025, cuenta con una arquitectura MatFormer experimental que permite, esencialmente, “anidar” cualquier número de modelos más pequeños y de tamaño personalizado dentro de un único modelo más grande. La arquitectura toma su nombre de las muñecas rusas, también conocidas como “matrioskas”; de ahí MatFormer. Gemma 3n está disponible en tamaños nominales de 2000 millones y 4000 millones de parámetros y admite entradas de texto, imagen, vídeo o audio (aunque las salidas son solo de texto).

  • FunctionGemma es una variante de 270 millones de Gemma 3 afinada para el uso de herramientas (o “llamada a funciones”, de ahí el nombre).

Los modelos Gemma se publican bajo la licencia Gemma, cuyos términos de uso son similares a los de la licencia Apache 2.0, pero se rigen por la Política de uso prohibido de Gemma.

GLM (Z.ai)

GLM es una familia de LLM desarrollados por la empresa Z.ai (también conocida como Zhipu AI), con sede en Pekín, cuyo objetivo es alcanzar un rendimiento de vanguardia. La empresa logró un gran avance con GLM-4.5, que, tras su lanzamiento inicial a finales de julio de 2025, compitió abiertamente con los mejores modelos abiertos del mundo, incluidos los modelos insignia de DeepSeek y Qwen, en las pruebas de rendimiento académicas.

  • GLM-4.5 estaba disponible en dos tamaños de modelo: el LLM insignia, un modelo MoE a gran escala con 355 000 millones de parámetros en total (32 000 millones activos) y el GLM-4.5-Air más pequeño (con 106 000 millones de parámetros totales, 12 000 millones activos). GLM-4.5V es un VLM, basado en el modelo fundacional GLM-4.5-Air, que añade capacidades de visión artificial y comprensión de vídeo.

  • GLM-4.6, una versión actualizada de GLM-4.5 lanzada el 30 de septiembre de 2025, no incluía una variante más pequeña de solo texto. Sin embargo, a principios de diciembre la empresa lanzó GLM-4.6V (una actualización de GLM-4.5V) y GLM-4.6V-Flash, un modelo de 9000 millones de parámetros de densidad.

  • GLM-4.7, una actualización del modelo insignia solo texto lanzada a finales de diciembre de 2025, añadió GLM-4.7-Flash, un LLM significativamente más pequeño con solo 30 000 millones de parámetros totales (y 3000 millones de parámetros activos).

  • GLM-5, lanzado en febrero de 2026, es significativamente más grande que sus predecesores, con 744 000 millones de parámetros totales (40 000 millones) activos.

Granite (IBM)

IBM® Granite es una serie de LLM de código abierto optimizados para casos de uso empresariales, centrados principalmente en modelos pequeños, prácticos y eficientes. Lanzado por primera vez en septiembre de 2023, Granite saltó a la fama con el lanzamiento de Granite 3.0 en octubre de 2024, con el que la serie Granite alcanzó un rendimiento que rivalizaba con el de los principales modelos abiertos de tamaño comparable.

Granite 4, lanzado en octubre de 2025, introdujo una nueva arquitectura híbrida Mamba2-Transformer para una velocidad y eficiencia de memoria superiores, especialmente bajo cargas de trabajo elevadas, en comparación con los modelos convencionales de transformadores.

  • Granite 4-H Small es un modelo MoE híbrido con 32 000 millones de parámetros totales (9000 millones activos). Granite 4 también incluye otro MoE híbrido, Granite 4-H Tiny, con 7000 millones de parámetros totales (1000 millones activos), y un modelo híbrido denso, Granite 4-H Micro, con 3000 millones de parámetros activos.

  • Granite 4 Micro es un modelo denso de 3000 millones de parámetros basado en una arquitectura convencional de modelo de transformador, a diferencia de los modelos 4-H.

  • Granite 4 Nano es una serie de modelos híbridos Mamba-Transformer y transformadores convencionales con tamaños que van desde los 350 millones de parámetros hasta los 1000 millones de parámetros.

  • Granite 4 1B-Speech es un modelo de conversión de voz a texto diseñado para el reconocimiento automático de voz (ASR) y la traducción automática bidireccional de voz (AST).

Todos los modelos Granite son de código abierto bajo una licencia Apache 2.0 estándar y están entrenados con datos seguros para la empresa. En octubre de 2025, la serie Granite se convirtió en la primera gran familia de modelos abiertos en recibir la certificación ISO-42001.

GPT-OSS (OpenAI)

GPT-OSS son los modelos de lenguaje de pesos abiertos de OpenAI, lanzados en agosto de 2025 bajo una licencia estándar de Apache 2.0. Son los primeros LLM abiertos de la empresa desde el lanzamiento de GPT-2 en 2019.

  • GPT-OSS-120B es un modelo MoE de 117 000 millones de parámetros totales (5100 millones activos), diseñado para uso general y tareas que se beneficio de un razonamiento de alto nivel.

  • GPT-OSS-20B es un modelo MoE con 21 000 millones de parámetros (3600 millones activos) pensado para un uso de baja latencia y una implementación local.

Ambos modelos GPT-OSS se entrenaron con una cuantificación de 4 bits de sus pesos, lo que aumentó considerablemente su velocidad y redujo sus requisitos de memoria en comparación con los de los modelos convencionales de tamaño similar.

Kimi (IA de Moonshot)

Kimi es una serie de modelos abiertos desarrollados por Moonshot AI, con sede en Pekín.

  • Kimi-K2 es un modelo MoE masivo de solo texto con 1 billón de parámetros totales (32 000 millones activos). Alcanzó una notoriedad significativa tras su lanzamiento en julio de 2025 por rivalizar y (a veces superar) a los modelos GPT-4.1 y Claude Opus 4 en puntos de referencia de codificación clave.

  • Kimi-K2 Thinking, la variante de modelo de razonamiento de Kimi-K2, también causó revuelo por rivalizar una vez más con los mejores modelos cerrados en desafiantes pruebas de referencia de IA agéntica9 .

  • Kimi-K2.5 es una actualización de Kimi-K2 que añade capacidades de visión multimodal. Puede funcionar en varios “modos”, cada uno optimizado para casos de uso específicos.

Los modelos Kimi se lanzan bajo una licencia MIT modificada, que requiere que los usuarios “muestren de forma destacada 'Kimi K2' en la interfaz de usuario” de cualquier producto con más de 100 millones de usuarios activos mensuales o más de 20 millones de dólares en ingresos mensuales.

Llama (Meta)

Los modelos Llama de Meta (originalmente estilizado como LLaMA, abreviatura de “Large Language model Meta AI”), han sido una parte integral de la historia de los LLM abiertos. Las primeras versiones de Llama contribuyen a democratizar las metodologías de los LLM, ya que sirven de referencia e influyen considerablemente en muchas convenciones estándar del desarrollo de estos modelos, desde el entrenamiento hasta la arquitectura y las variaciones en el tamaño.

  • Llama 2, lanzada en julio de 2023, se lanzó en tamaños de 7000 millones, 13 000 millones y 70 000 millones de parámetros.

  • Llama 3, lanzado en abril de 2024 en tamaños de 8000 millones de parámetros y 70 000 millones de parámetros, compitió con muchos modelos cerrados líderes en los puntos de referencia académicos. Llama 3.1 amplió considerablemente la longitud del contexto de los modelos y, en julio, añadió una variante de 405 000 millones de parámetros sin precedentes. Llama 3.2 añadió tanto variantes más pequeñas como capacidades de visión, mientras que Llama 3.3 contaba con un único modelo de 70 000 millones cuyo rendimiento rivalizaba con el del 405 000 millones de Llama 3.1.

  • Llama 4 ha presentado dos grandes modelos multimodales de MoE: Llama 4 Maverick, con un total de 400 000 millones de parámetros (17 000 millones activos), y Llama 4 Scout, con un total de 109 000 millones de parámetros (19 000 millones activos). Aunque su rendimiento superó significativamente al de las generaciones anteriores de Llama en la mayoría de los puntos de referencia, los modelos Llama 3 siguen siendo los LLM más populares de Meta (como reflejan las descargas en Hugging Face)10.

Aunque Meta suele utilizar el término “código abierto”, los modelos Llama se publican bajo una licencia Llama personalizada que impone restricciones de uso, atribución y acceso. Por ello, la Open Source Initiative ha criticado el uso del término por parte de Meta.

Minimax

MiniMax Group, con sede en Shanghái, lanzó su primer LLM homónimo, MiniMax-Text-01, y un VLM complementario, MiniMax-VL-01, en enero de 2025. Desde entonces, se han consolidado como uno de los principales desarrolladores de modelos LLM en China, dando prioridad a los modelos a gran escala y a las ventanas de contexto largas.

  • MiniMax-M1, lanzado en junio de 2025, es un modelo de razonamiento de solo texto creado a partir del fine-tuning de MiniMax-Text-01. Al igual que su predecesor, se trata de un modelo MoE de gran tamaño con un total de 456 000 millones de parámetros y 45 900 millones de parámetros activados por token.
  • MiniMax-M2 ofrece un rendimiento y eficiencia superiores en comparación con el M1. Tiene un total de 230 000 millones de parámetros y una arquitectura MoE más detallada que activa solo 10 000 millones de parámetros por token. Lanzado en octubre de 2025, se actualizó como MiniMax-M2.1 dos meses después. MiniMax también ofrece MiniMax-M2-her, una versión afinada para el rol basado en personajes.

  • MiniMax-M2.5 y MiniMax-M2.5-Lightning, lanzados en febrero de 2026, logran una mayor optimización del rendimiento, rivalizando con Claude Opus 4.5 en determinados puntos de referencia de codificación. Son idénticos en todos los aspectos excepto en la velocidad y el rendimiento: la variante “Lightning” genera resultados el doble de rápido.

  • MiniMax-M2.7, lanzado en marzo de 2026, es una actualización de MiniMax-M2.5 que, según la empresa, contribuyó a su propio entrenamiento11.

Los modelos MiniMax se ofrecen bajo una licencia modificada del MIT.

Mistral AI

Además de su oferta de código cerrado, Mistral AI ofrece una variedad de modelos abiertos muy apreciados. La mayoría (pero no todos) de los modelos abiertos de Mistral se publican bajo la licencia estándar Apache 2.0.

  • Mistral Large 3 utiliza una arquitectura MoE inspirada en DeepSeek-V3, con 675 000 millones de parámetros totales (41 000 millones activos). Su rendimiento de referencia es aproximadamente equivalente al de DeepSeek-V3.1 y Kimi-K2.112. Lanzado en diciembre de 2025, es multilingüe y multimodal, capaz de procesar entradas de texto e imágenes.

  • Ministral 3 es la serie de modelos pequeños de Mistral, que se ofrece en los tamaños de 3000 millones, 8000 millones y 14 000 millones de parámetros y en las variantes base, afinada por instrucciones y de razonamiento.

  • Mistral Small 3.2 es un LLM de 24 000 millones de parámetros lanzado en junio de 2025. Su rendimiento es comparable al del más reciente Ministral 3 de 14 000 millones de parámetros.

  • Devstral es la serie de modelos centrada en la ingeniería agéntica de Mistral. Devstral 2, lanzada en diciembre de 2025, consta de dos modelos. Devstral 2 de 123 000 millones de parámetros se publica bajo una licencia modificada del MIT, que exige a las organizaciones con ingresos mensuales superiores a 20 millones de dólares estadounidenses que soliciten una licencia comercial a Mistral. Devstral Small 2 de 24 000 millones de parámetros se publica bajo licencia estándar Apache 2.0.

  • Mixtral, lanzado en diciembre de 2023, es un LLM que originalmente popularizó la arquitectura de mezcla de expertos para modelos de lenguaje. A principios de 2026, su variante 8x7B sigue siendo extremadamente popular en Hugging Face, con más de 700 000 descargas mensuales13.

Nemotron (NVIDIA)

La serie de LLM de código abierto de NVIDIA, el destacado fabricante de hardware, goza de gran prestigio por su rendimiento, su contribución a la literatura científica y sus innovaciones arquitectónicas.

  • NVIDIA-Nemotron-Nano v2 es una familia de modelos híbridos Mamba-2-LLM con tamaños de 9000 millones y 12 000 millones de parámetros, capaces tanto de razonamiento como de inferencia estándar. Se publicaron en agosto de 2025 bajo un Acuerdo de licencia de modelos abiertos de NVIDIA con condiciones destacadas relativas a la responsabilidad legal, el uso y el derecho de NVIDIA a realizar modificaciones futuras en el acuerdo.

  • Nemotron 3 Nano, lanzado en diciembre de 2025, incluye dos modelos: Nemotron-3-Nano-4B y Nemotron-3-Nano-30B-A3B, un MoE con 30  000 millones de parámetros totales (3000 millones activos). Se publicaron bajo la Licencia de modelo abierto NVIDIA Nemotron, que excluye el derecho de NVIDIA a realizar actualizaciones unilaterales de los términos en el futuro.

  • Nemotron 3 Super es un MoE más grande con 120 000 millones de parámetros totales (12 000 millones activos), lanzado en marzo de 2026.

Olmo (AllenAI)

Olmo, desarrollados por el Allen Institute for AI (“Ai2”), se encuentran entre los modelos de código abierto más “abiertos” que existen: Ai2 suele publicar todo el código, los pesos, los puntos de control del entrenamiento y los conjuntos de datos asociados, junto con una licencia estándar Apache 2.0.

  • Olmo 3, lanzado en noviembre de 2025, comprende modelos de transformadores densos en tamaños de 7000 millones y 32 000 millones de parámetros. Los modelos se comercializan en las versiones básica, instructiva y de “pensamiento”. En diciembre de 2025, la versión 32 000 millones se actualizó a Olmo 3.1.
  • Olmo Hybrid, lanzado en marzo de 2026, es un modelo 7000 millones con una arquitectura híbrida experimental que combina redes neuronales transformadoras y lineales (basadas en la arquitectura Gated DeltaNet popularizada por Qwen).

Phi (Microsoft)

Phi es la línea de modelos abiertos de Microsoft, que históricamente se ha centrado en los modelos pequeños. Se publican bajo la licencia estándar del MIT.

  • Phi 4 es un LLM de 14 000 millones de parámetros dedicado exclusivamente al texto, lanzado originalmente en diciembre de 2024.

  • Phi 4-mini, lanzado en febrero de 2025, es un modelo más pequeño, de 3800 millones de parámetros.

  • Phi 4-multimodal, lanzado junto con el Phi 4-mini, admite entradas de texto, imágenes y voz.

  • Phi 4-Reasoning-Vision, lanzado en marzo de 2026 es un modelo de 15 000 millones de parámetros que incorpora un razonamiento holístico y multimodal a través de imágenes, texto y documentos.

Qwen (Alibaba)

La serie Qwen de LLM, desarrollada por Alibaba, se ha convertido en uno de los modelos abiertos más populares del sector. La familia de modelos ofrece una amplia variedad de tamaños, arquitectura y capacidades destinadas a adaptarse a una variedad de necesidades de los desarrolladores.

  • Qwen3 incluye modelos de transformadores densos solo de texto con tamaños de 600 millones, 1700 millones, 4000 millones, 8000 millones, 14 000 millones y 32 000 millones, así como MoE con tamaños de 30 000 millones a 32 000 millones y el modelo insignia Qwen3-235B-A22B. Todos los modelos Qwen3 están disponibles en las variantes básica, de pensamiento e instrucción.

  • Qwen3-Next es un modelo de atención (MoE) experimental solo de texto con 80 000 millones de parámetros (3000 millones activos) que sustituye la atención estándar por Gated Delta Networks (inspiradas en Mamba-2) y Gated Attention.

  • Qwen3-Omni es un modelo multimodal nativo construido sobre Qwen3-30B-A3B, que admite entradas de texto, imagen, audio o vídeo y salidas de texto o voz.

  • Qwen3-Coder-Next es una versión de Qwen3-Next afinada para la generación de código.

  • Qwen3.5, lanzado en febrero de 2026, es una familia de modelos multimodales que utilizan la arquitectura introducida por primera vez en Qwen3-Next. Incluye modelos de razonamiento básicos e híbridos con tamaños de 800 millones, 2000 millones, 4000 millones, 9000 millones y 27 000 millones, así como modelos MoE en tamaños de 35B-A3B, 122B-A10B y el modelo insignia 397B-A17B. Qwen3.5-397B-A17B pretende competir con los modelos líderes Gemini, GPT y Claude en rendimiento fronterizo.

Autor

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

Soluciones relacionadas
IBM Bob

Acelere la entrega de software con Bob, su socio de IA para un desarrollo seguro y consciente de la intención.

Explore IBM® Bob
IBM® watsonx Orchestrate

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Explore watsonx Orchestrate
Soluciones de inteligencia artificial

Ponga la IA al servicio de su negocio con la experiencia líder del sector y el portfolio de soluciones de IA de IBM.

Explore las soluciones de IA
Dé el siguiente paso

Independientemente de en qué fase del ciclo de desarrollo se encuentre, Bob le ofrece lo que necesita: revisiones basadas en la intención, alineadas con la seguridad y con capacidad agéntica que aceleran la entrega de software de alta calidad.

  1. Descubra IBM® Bob
  2. Explore watsonx Orchestrate
Notas a pie de página

1. “Elon Musk reins in Grok AI bot to stop election misinformation”. The Register. 28 de agosto de 2024.
2. “Musk’s xAI chatbot Grok keeps randomly responding about ‘white genocide’ in South Africa”. CNBC. 14 de mayo de 2025.
3. “Elon Musk’s AI chatbot, Grok, started calling itself ‘MechaHitler’”. NPR. 9 de julio de 2025.
4. @MarioNawfal tweet. X (anteriormente Twitter). 18 de febrero de 2025.
5. “GPT-5.4 pro”. OpenAI. Documentos API consultados el 12 de marzo de 2026.
6. “Announcing Codestral 25.08 and the Complete Mistral Coding Stack for Enterprise”. Mistral AI. 30 de julio de 2025.
7. Gemma. Google DeepMind. Consultado el 12 de marzo de 2026.
8. “Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less”. CNBC. 14 de julio de 2025.
9. “5 Thoughts on Kimi K2 Thinking”. Interconnects. 6 de noviembre de 2025.
10. Meta Llama: models page (sorted by “Most Downloads”). Hugging Face. Consultado el 11 de marzo de 2026.
11. “MiniMax M2.7: Early Echoes of Self-Evolution”. MiniMax. 18 de marzo de 2026.
12. “Introducing Mistral 3,” Mistral AI, 2 December 2025
13. Mistral AI: models page (sorted by “Most Downloads”). Hugging Face. Consultado el 11 de marzo de 2026.