Rectángulos tridimensionales abstractos

Una lista de modelos de lenguaje grandes (LLM)

Una lista de LLM

Los modelos de lenguaje grandes (LLM) se han convertido en la base del desarrollo actual de la inteligencia artificial. Fueron los pioneros y ahora marcan la era de la IA generativa, desde sencillas aplicaciones de chatbots hasta la ingeniería agéntica y otros flujos de trabajo automatizados complejos impulsados por agentes de IA. Su advenimiento ha marcado un punto de inflexión fundamental en la historia del machine learning.

A medida que la tecnología madura, los nuevos LLM continúan proliferando. Los principales desarrolladores de IA, las nuevas empresas emergentes y las potencias empresariales establecidas están lanzando y perfeccionando continuamente nuevos modelos. Mientras tanto, la comunidad de código abierto se dedica constantemente a perfeccionar los LLM de código abierto, fusionando y modificando los modelos existentes con conjuntos de datos personalizados para crear infinitas variantes. Como tal, ninguna lista de LLM podría esperar razonablemente ser exhaustiva, e incluso la lista más “exhaustiva” no permanecería así por mucho tiempo.

Lo que sigue es una lista de algunos de los LLM más destacados y de mayor rendimiento disponibles en la actualidad. Estos son aspectos para tener en cuenta:

  • La lista da prioridad a los modelos que reciben soporte y actualizaciones constantes por parte de sus desarrolladores, y que mantienen un rendimiento al menos mínimamente competitivo. Esto excluye una serie de modelos fundacionales históricamente influyentes, como T5 de Google, GPT-3 de OpenAI o Llama 2 de Meta, algunos de los cuales continúan utilizándose con fines de investigación.

A efectos prácticos, los LLM pueden dividirse, en general, en dos categorías: los LLM de código cerrado , disponibles únicamente como productos comerciales a través del desarrollador del modelo, y los modelos abiertos, que se ofrecen de forma gratuita.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

LLM de código cerrado

Solo se puede acceder a un modelo de código cerrado , o modelo propietario, directamente en la plataforma del desarrollador del modelo, en otras plataformas a las que haya licenciado su modelo o a través de la API patentada del proveedor del modelo.

Debido a que los desarrolladores de modelos cerrados generalmente tratan sus detalles técnicos como secretos comerciales muy bien guardados, por lo general, es imposible saber con certeza los detalles del tamaño, la arquitectura de la red neuronal o el proceso de entrenamiento de un modelo cerrado. Algunos detalles pueden inferirse, por ejemplo, comparando la velocidad de inferencia de un modelo cerrado, el uso de memoria de GPU y el rendimiento del punto de referencia con el de los modelos abiertos cuyos detalles se divulgan públicamente, pero rara vez, si es que sucede, se confirman.

Desde al menos 2022, la mayoría de los modelos fronterizos de última generación en cualquier momento fueron modelos cerrados, pero eso refleja en gran medida las circunstancias históricas reales de la industria, más que una superioridad inherente de los modelos cerrados frente a los modelos abiertos. A continuación, se presentan algunas de las series de modelos cerrados más notables, ordenadas alfabéticamente.

Claude (Anthropic)

Los modelos de lenguaje Claude de Anthropic se encuentran entre los más eficaces del mundo. Fundada originalmente en 2021 como un laboratorio de investigación sobre seguridad de la IA por antiguos empleados de OpenAI, el enfoque de Anthropic para el desarrollo de modelos se basa en el concepto único de IA constitucional. La “Constitución” de Claude es un documento que sirve no solo para guiar la conducta de los empleados de Anthropic, sino también la conducta (y la creación de datos de entrenamiento sintéticos) de los propios modelos de Claude.

Desde Claude 3, las sucesivas generaciones de Claude han presentado modelos multimodales en 3 tamaños diferentes:

  • Claude Haiku son los modelos más pequeños de Anthropic, optimizados para la velocidad y la rentabilidad. A diferencia de Sonnet y Opus, los modelos Haiku no son modelos de razonamiento: a menos que se proporcione una instrucción explícita para que lo hagan, los modelos Haiku no producen resultados de razonamiento de cadena de pensamiento (CoT).
  • Claude Sonnet son los modelos medianos de Anthropic, dirigidos a lo que Anthropic considera el equilibrio óptimo entre rendimiento y eficiencia para la mayoría de los casos de uso. Tanto Sonnet como Opus son modelos de razonamiento híbrido, lo que significa que se pueden configurar para realizar una inferencia estándar o razonamiento CoT adaptativo para la resolución de problemas complejos de varios pasos.
  • Claude Opus son los modelos más grandes y potentes de Anthropic, dirigidos al rendimiento de vanguardia en tareas desafiantes.

Claude Haiku, Sonnet y Opus pueden procesar entradas de texto, audio e imágenes, y generar texto o audio (como texto a voz). Históricamente, a diferencia de la mayoría de sus competidores en modelo cerrado, ellos (y la plataforma Claude que alimentan) no eran capaces de generar imágenes, pero a partir del 12 de marzo de 2026, Claude ya puede generar imágenes. Al acceder a los modelos a través de la API Claude, los usuarios pueden establecer el “nivel de esfuerzo” del proceso de razonamiento de Sonnet u Opus en “máximo”, “alto”, “medio”, “bajo” o “adaptativo”.

Gemini (Google)

Gemini es la serie de modelos de lenguaje cerrado de Google, desarrollada por su subsidiaria Google DeepMind y lanzada por primera vez en diciembre de 2023. Vale la pena señalar que Google Brain (que se fusionó con DeepMind para formar Google DeepMind en 2023) es responsable de la creación de la arquitectura del modelo transformador que permitió los primeros LLM, después de haber publicado el histórico documento de investigación “Attention is All You Need” en 2017.

Desde principios de 2025, Google ha lanzado cada generación de modelos Gemini con 3 tamaños diferentes, todos los cuales son modelos de razonamiento. Cuando se accede a través de la API Gemini, los usuarios pueden seleccionar uno de varios “niveles de pensamiento” para personalizar la cantidad de tokens y el tiempo que el modelo dedicará antes de generar un resultado final.

  • Los modelos Gemini Pro son los LLM más grandes y avanzados de Google.

  • Los modelos Gemini Flash, en comparación con los Gemini Pro, están optimizados para la velocidad.

  • Los modelos Gemini Flash-Lite son modelos rápidos y rentables optimizados para tareas de gran volumen como traducción y uso de herramientas agénticas.

Los modelos Gemini Pro, Flash y Flash-Lite son multimodales de forma nativa: pueden procesar entradas de texto, audio, imagen o video y generar resultados de texto. Cuando se accede a través de la plataforma Gemini, los resultados multimodales se pueden generar a través de los modelos separados y especializados de Gemini para la generación de imágenes, video o música.

Desde el lanzamiento de Gemini 2.5 Pro en marzo de 2025, que logró el mejor rendimiento de la industria en ese momento en la mayoría de los puntos de referencia académicos, los modelos Gemini han competido con la serie GPT de Claude y OpenAI como los LLM de mayor rendimiento del mundo. En términos generales, el estatus de modelo “superior” cambia de manos cada vez que se lanza un nuevo modelo fronterizo en una de esas tres series.

Grok (xAI)

Grok es una familia de LLM patentados producidos por xAI, lanzados por primera vez en versión beta como chatbot en X (anteriormente Twitter) en noviembre de 2023. En abril de 2025, xAI lanzó el acceso a la API de Grok 3, que en ese momento era su modelo más nuevo y emblemático.

La línea de modelos de Grok ha continuado cambiando a lo largo de sucesivas generaciones de lanzamientos de modelos.

  • Grok 2 estuvo acompañado por Grok 2 Mini, la primera variante basada en el tamaño de la familia de modelos. Esta misma convención se repitió para Grok 3 en febrero de 2025.

  • La cuarta generación de modelos Grok se lanzó con Grok 4 y Grok 4 Heavy en julio de 2025. En el otoño de 2025, les siguieron Grok 4 Fast y, posteriormente, Grok 4.1 (disponible en configuraciones tanto pensantes como no pensantes).

  • En agosto de 2025, xAI lanzó Grok Code Fast 1, un modelo centrado en la eficiencia optimizado para la programación agéntica.

A partir de Grok 4, los modelos Grok pueden procesar entradas de texto, imágenes y voz. Aunque los LLM de Grok no pueden proporcionar resultados multimodales, el modelo Aurora de xAI puede generar resultados de imagen y video a través de su plataforma Grok Imagine.

Al margen de su rendimiento técnico, gran parte de la trayectoria de Grok (y, en particular, la del chatbot de Grok) ha estado marcada por la controversia, como las acusaciones de difundir desinformación electoral, introducir puntos de vista polarizantes en conversaciones ajenas al tema y perpetuar estereotipos dañinos.

Versiones de código abierto

En declaraciones públicas, el CEO de xAI, Elon Musk, ha dicho que “nuestro enfoque general es que vamos a abrir el código abierto de la última versión cuando la próxima versión esté completamente disponible”.1

xAI publicó Grok 1 como código abierto bajo la licencia Apache 2.0 en marzo de 2024. Aunque Grok 3 se lanzó en febrero de 2025, la próxima versión de código abierto de un modelo Grok fue hasta agosto de 2025. De manera confusa, xAI y Musk anunciaron que tenían “Grok 2.5” de código abierto, 2 aunque ningún modelo se había nombrado ni anunciado como tal antes de esa declaración. La propia tarjeta de modelo Hugging Face del modelo incluso se refiere al modelo como “Grok-2”.

En ese anuncio de agosto de 2025, Musk indicó que Grok 3 sería igualmente de código abierto en “unos 6 meses”. Ocho meses después, aún no se ha anunciado dicha fecha de lanzamiento del código abierto.

GPT (OpenAI)

A la serie GPT de OpenAI, abreviatura de Generative Pretrained Transformer, se le atribuye en gran medida el inicio de la era actual de la IA generativa, especialmente tras el lanzamiento en 2022 de ChatGPT con su modelo GPT-3.5.

Las convenciones de OpenAI para la nomenclatura de modelos y variantes han cambiado significativamente desde 2022, a menudo de manera confusa. Por ejemplo, GPT-4.1 se lanzó después de GPT-4.5, y el modelo de razonamiento o4 estaba disponible al mismo tiempo que el modelo multimodal sin razonamiento GPT-4o, que era completamente distinto de su modelo de razonamiento “o4”, cuyo rendimiento fue inferior al de “o3”. A principios de 2025, el CEO de OpenAI, Sam Altman, reconoció que “nos damos cuenta de lo complicadas que se han vuelto nuestras ofertas de modelos y productos”.

Desde el lanzamiento de GPT-5 en agosto de 2025, las ofertas consolidadas de LLM de la empresa ahora comprenden:

  • GPT-5.x es la oferta insignia de uso general de OpenAI. A partir de marzo de 2026, la última versión del modelo es GPT-5.4. Aunque todos los modelos GPT-5 son modelos de razonamiento, GPT-5.4 también está disponible en una variante GPT-5.4 Pro , que “usa más cálculo para pensar más y proporcionar respuestas constantemente mejores”.3 OpenAI también ofrece GPT-5 Codex, una versión de GPT-5 ajustada para una generación óptima de código agéntico (que se actualiza periódicamente siguiendo las versiones actualizadas del modelo central).
  • GPT-5 mini ofrece “inteligencia cercana a la frontera para cargas de trabajo sensibles al costo, baja latencia y alto volumen”, según las vistas generales del modelo de OpenAI.
  • GPT-5 nano es la “versión más rápida y rentable de GPT-5”.

OpenAI también ha liberado 2 modelos GPT de peso abierto, que se detallan en la sección “Modelos abiertos” de este artículo.

Mistral AI

Mistral IA, una empresa con sede en Francia fundada por exempleados de Meta IA y Google DeepMind, se dedicó originalmente por completo a los modelos de código abierto tras el lanzamiento de su primer modelo (Mistral 7B) en septiembre de 2023. Desde entonces, Mistral ha pasado a un modelo mixto en el que muchas de sus ofertas tienen código abierto, pero algunos modelos de vanguardia siguen siendo de código cerrado.

A partir de marzo de 2026, los LLM patentados insignia de Mistral IA incluyen:

  • Mistral Medium 3.1, un modelo multimodal de propósito general lanzado en agosto de 2025.

  • Codestral, un modelo centrado en la programación “creado específicamente para la finalización de textos con relleno intermedio (FIM) de alta precisión”.4

  • Magistral Medium 1.2, un modelo de razonamiento complementario de Mistral Medium.

Las ofertas de modelos de peso abierto de Mistral se detallan más adelante en este artículo.

AI Academy

Por qué los modelos fundacionales son un cambio de paradigma para la IA

Conozca una nueva clase de modelos de IA flexibles y reutilizables que pueden desbloquear nuevos ingresos, reducir costos y aumentar la productividad, luego use nuestra guía para investigar a profundidad.

LLM de código abierto

En machine learning, el código abierto a menudo se usa coloquialmente para referirse a herramientas de IA cuyo código fuente está disponible de forma gratuita, pero el término es en realidad una designación formal administrada por la Open Source Initiative (OSI). La OSI solo certifica una licencia de software determinada como “aprobada por Open Source Initiative” si considera que la licencia cumple con los diez requisitos enumerados en la definición oficial de código abierto (OSD).

La mayoría de los modelos de código abierto no cumplen con todos esos requisitos. Siendo así, el término modelo abierto (o modelo de peso abierto) se refiere con mayor precisión a cualquier LLM distribuido libremente. Dentro del espectro de modelos abiertos hay una gran variabilidad. Un modelo de peso abierto (pero no de código abierto) se puede utilizar para ejecutar inferencias e incluso se puede ajustar, pero si no se proporciona su código fuente completo, no se puede modificar más allá de los cambios en los valores de sus pesos a través del ajuste. Su licencia puede prohibir el uso del modelo en algunos escenarios (como entornos comerciales) o establecer otras estipulaciones específicas en su aplicación.

Por el contrario, un verdadero modelo de código abierto lanzado con código de entrenamiento y una descripción de sus procedimientos de entrenamiento puede modificarse completamente de cualquier manera y usarse sin restricciones. Las licencias de código abierto más comunes y estandarizadas son la licencia Apache 2.0 y la licencia MIT. Sin embargo, cabe señalar que, a menos que el desarrollador de un modelo de código abierto facilite los detalles de sus datos de entrenamiento, el modelo en sí mismo no es totalmente reproducible.

Las versiones de código abierto son esenciales para el desarrollo y la mejora continuos de los LLM, y son en gran medida responsables de permitir su invención en primer lugar. Normalmente, se puede acceder a los modelos abiertos a través de su desarrollador de modelos o de plataformas populares de código abierto, como GitHub o Hugging Face. A continuación, se presenta una lista de series de modelos abiertos destacados, ordenadas alfabéticamente.

Cohere

Cohere, una empresa con sede en Canadá cuyos fundadores incluyen a uno de los autores de “Attention is All You Need”, se lanzó en 2019. Aunque la empresa publica informes técnicos detallados para cada LLM y aparentemente los lanza como modelos de peso abierto, Cohere licencia sus lanzamientos abiertos bajo una versión modificada de la licencia Creative Commons 4.0 que prohíbe el uso comercial.

Command

 Command es la serie de modelos fundacionales insignia de Cohere, diseñada para casos de uso empresariales.

  • Command R fue la primera generación de modelos empresariales de Cohere, lanzada en marzo de 2024 con un modelo de 35 mil millones de parámetros con énfasis en RAG y uso de herramientas. Poco después de su lanzamiento, al mes siguiente, salió al mercado Command R+, una variante de 104B. A ellos se unió el Command R7B más pequeño en diciembre.

  • Command A, la segunda generación de modelos empresariales de Cohere, se lanzó en marzo de 2025 con un enfoque en tareas comerciales, STEM y de programación. El modelo 111B original finalmente se lanzó en variantes que incluyen Command A Reasoning, Command A Translate (ajustado para optimizar el rendimiento de la traducción en 23 idiomas) y Command A Vision, un modelo de lenguaje de visión (VLM) que combinó el LLM con un codificador de visión.

En un comentario publicado en Reddit en marzo de 2026, el CEO de Cohere, Aidan Gomez, indicó que la empresa estaba desarrollando activamente la próxima generación de Command, y que estos serían los primeros modelos de la organización basados en una combinación de expertos (MoE).

Aya

Aya es la serie de modelos multilingües de Cohere, lanzada por primera vez en febrero de 2024 con Aya 101,que, como su nombre indica, era “capaz de seguir instrucciones en 101 idiomas”.

  • Aya Visiones un VLM multimodal y multilingüe, disponible en variantes de 8 y 32 bits, con capacidad para 23 idiomas diferentes.

  • Tiny Aya, lanzado en febrero de 2026 , es una serie de modelos ligeros y multilingües con 3.35 mil millones de parámetros. Tiny Aya-Base es un modelo previamente entrenado que admite más de 70 idiomas. TinyAya-Global es su contraparte ajustada a las instrucciones y admite 67 idiomas.

  • El lanzamiento de Tiny Aya también contenía variantes regionales especializadas. TinyAya-Earth está optimizado para idiomas de África y Asia Occidental; TinyAya-Fire está optimizado para idiomas del sur de Asia; TinyAya-Water está optimizado para idiomas de Asia-Pacífico y Europa.

DeepSeek

DeepSeek es un actor integral en el ecosistema de código abierto, que aporta una serie de innovaciones a las arquitecturas y procesos de entrenamiento de LLM. En ocasiones, el rendimiento de sus modelos ha rivalizado con el de los modelos cerrados de primer nivel. Sus LLM, tanto los pesos como el código, son de código abierto bajo una licencia estándar del MIT. DeepSeek también publica con frecuencia documentos técnicos que detallan sus hallazgos y técnicas.

  • DeepSeek-V3 es un modelo MoE grande, con 671 000 millones de parámetros totales (y 37 000 millones de parámetros activos durante la inferencia), lanzado por primera vez a finales de 2024. A menudo se le atribuye al modelo la recuperación de la prominencia generalizada de la arquitectura de mezcla de expertos.

  • DeepSeek-R1 es un modelo de razonamiento, creado mediante el ajuste de DeepSeek-V3 utilizando técnicas de aprendizaje por refuerzo novedosas en ese momento. DeepSeek-R1 fue un hito en la historia de los LLM de código abierto. No solo rivalizó con el rendimiento del modelo o1 de OpenAI, inigualable anteriormente, sino que proporcionó un documento técnico con detalles completos de la metodología de entrenamiento de DeepSeek. Su lanzamiento inspiró directamente la primera generación de modelos de razonamiento abierto.

  • DeepSeek-V3.1, lanzado en agosto de 2025, es un modelo de razonamiento híbrido, que se configura para ejecutar tanto la inferencia estándar como el razonamiento CoT. En esencia, combinó DeepSeek-V3 y DeepSeek-R1 en un solo modelo. Se actualizó por última vez como DeepSeek-V3.2 en octubre de 2025. Tanto DeepSeek-V3.1 como DeepSeek-V3.2 conservan la arquitectura MoE 671B-37B del modelo original.

  • DeepSeek también lanzó varios modelos “DeepSeek-R1-Distill”, creados mediante el ajuste de modelos Qwen y Llama más pequeños para emular DeepSeek-R1 a través de la destilación del conocimiento.

A pesar de los rumores periódicos de un inminente DeepSeek-v4 (o “DeepSeek-R2”), sus lanzamientos aún no se han materializado.

Falcon (TII)

La serie Falcon de LLM es desarrollada por el Technology Innovation Institute(TTI) de los EAU. Aunque la primera generación de modelos de TII en 2023 fue quizás más notable para Falcon-180B, que en ese momento era uno de los modelos de código abierto más grandes disponibles, desde entonces TII se ha centrado en modelos más pequeños. Falcon2 tenía 11 000 millones de parámetros y Falcon3, los primeros modelos multimodales de TII (lanzados en diciembre de 2024), oscilaban entre 1000 10 000 mil millones.

Las generaciones más recientes de modelos Falcon se han centrado en modelos híbridos Mamba-Transformer.

  • Falcon-H1, lanzado en mayo de 2025, comprende modelos híbridos preentrenados y ajustados por instrucciones en variantes de 0.5, 1.5, 3, 7 y 34 mil millones. Falcon-H1R, lanzado en enero de 2026, es una variante de razonamiento de Falcon-H1-7B.

  • Falcon-H1-Tiny son, como su nombre indica, variantes extremadamente pequeñas de Falcon-H1, en tamaños de 90 millones, 100 millones y 0.6 mil millones de parámetros. Cada tamaño se ofrece tanto como modelos base como variantes especializadas ajustadas para casos de uso específicos.

  • Los modelos Falcon-Edge son una familia de LLM experimentales de 1 bit (“BitNet”) en tamaños de 1000 y 3000 mil millones.

Los modelos Falcon se lanzan bajo una licencia patentada de Falcon que está inspirada en la infraestructura Apache 2.0, pero agrega estipulaciones y restricciones notables.

Gemma (Google)

Gemma es la familia de modelos abiertos de Google. Según Google, los modelos de Gemma están “construidos a partir de la misma tecnología que impulsa [sus] modelos Gemini”.7

  • Gemma 3, lanzado en marzo de 2025, es la última generación del LLM central de Gemma. La versión inicial de Gemma contenía variantes preentrenadas y ajustadas por instrucciones en tamaños de 1000, 4000, 12 000 y 27 000 millones. En agosto de 2025, Google agregó una variante más pequeña con 270 millones de parámetros. Los modelos Gemma 3 pueden procesar entradas de texto o imágenes y ofrecer soporte multilingüe para más de 140 idiomas.
  • Gemma 3n, lanzado en julio de 2025, cuenta con una arquitectura experimental MatFormer que esencialmente permite que cualquier número de modelos más pequeños y de tamaño personalizado estén “anidados” dentro de un solo modelo más grande. La arquitectura lleva el nombre de las muñecas rusas de anidación, también llamadas “Matryoshka”, de ahí MatFormer. Gemma 3n está disponible en tamaños nominales de 2000 y 4000 millones de parámetros y admite entradas de texto, imagen, video o audio (pero solo genera resultados de texto).

  • FunctionGemma es una variante de Gemma 3 de 270 millones ajustada para el uso de herramientas (o “llamada a funciones”, de ahí el nombre).

Los modelos Gemma se publican bajo la licencia Gemma, cuyos términos de uso son similares a los de la licencia Apache 2.0, pero se rigen por la Política de uso prohibido de Gemma.

GLM (Z.ai)

GLM es una familia de LLM de Z.ai (también llamada Zhipu AI) con sede en Beijing que tiene como objetivo un rendimiento de vanguardia. La empresa logró un gran avance con GLM-4.5, que, tras su lanzamiento inicial a finales de julio de 2025, rivalizó ostensiblemente con los principales modelos abiertos del mundo, incluidos los modelos insignia de DeepSeek y Qwen, en todos los puntos de referencia académicos.

  • GLM-4.5 se ofreció en dos tamaños de modelo: el modelo insignia LLM, un modelo MoE a gran escala con un total de 355 000 millones de parámetros (32 000 millones activos), y el GLM-4.5-Air, de menor tamaño (con 106 000 millones de parámetros totales, 12 000 millones activos). GLM-4.5V es un VLM, basado en el modelo fundacional GLM-4.5-Air, que agrega capacidades de visión artificial y comprensión de video.

  • GLM-4.6, una versión actualizada de GLM-4.5 lanzada el 30 de septiembre de 2025, no incluía una variante más pequeña de solo texto. Sin embargo, a principios de diciembre la empresa lanzó GLM-4.6V (una actualización de GLM-4.5V) y GLM-4.6V-Flash, un modelo de densidad de 9000 millones.

  • GLM-4.7, una actualización del modelo insignia de solo texto lanzada a finales de diciembre de 2025, agregó GLM-4.7-Flash, un LLM significativamente más pequeño con solo 30 000 millones de parámetros totales (y 3000 millones de parámetros activos).

  • GLM-5, lanzado en febrero de 2026, es significativamente más grande que sus predecesores, con 744 000 millones de parámetros totales (40 000 millones) activos.

Granite (IBM)

IBM Granite es una serie de LLM de código abierto optimizados para casos de uso empresariales, centrados principalmente en modelos pequeños, prácticos y eficientes. Lanzado por primera vez en septiembre de 2023, Granite saltó a la fama con el lanzamiento de Granite 3.0 en octubre de 2024, que vio a la serie Granite alcanzar un rendimiento que compite con el de los principales modelos abiertos de tamaño comparable.

Granite 4, lanzado en octubre de 2025, introdujo una nueva arquitectura transformadora híbrida Mamba2-Transformer para una velocidad y una eficiencia de memoria superiores, especialmente con cargas de trabajo pesadas, en comparación con los modelos transformadores convencionales.

  • Granite 4-H Small es un modelo MoE híbrido con 32 000 millones de parámetros totales (9000 millones activos). Granite 4 también incluye otro modelo híbrido MoE, Granite 4-H Tiny, con un total de 7000 millones de parámetros (1000 millones activos), y un modelo híbrido denso, Granite 4-H Micro, con 3000 millones de parámetros activos.

  • Granite 4 Micro es un modelo denso de 3000 millones basado en una arquitectura de modelo de transformador convencional, a diferencia de los modelos 4-H.

  • Granite 4 Nano es una serie de modelos híbridos de transformadores Mamba y transformadores convencionales, con tamaños que van desde los 350 millones de parámetros hasta los 1000 millones de parámetros.

  • Granite 4 1B-Speech es un modelo de voz a texto diseñado para el reconocimiento automático de voz (ASR) y la traducción automática de voz bidireccional (AST).

Todos los modelos Granite son de código abierto bajo una licencia Apache 2.0 estándar y están entrenados con datos seguros para la empresa. En octubre de 2025, la serie Granite se convirtió en la primera familia importante de modelos abiertos en recibir la certificación ISO-42001.

GPT-OSS (OpenAI)

GPT-OSS son los modelos de lenguaje de peso abierto de OpenAI, lanzados en agosto de 2025 bajo una licencia Apache 2.0 estándar. Son los primeros LLM abiertos de la empresa desde el lanzamiento de GPT-2 en 2019.

  • GPT-OSS-120B es un modelo MoE de 117 000 millones de parámetros totales (5100 millones activos), diseñado para uso general y tareas que se benefician del razonamiento de alto nivel.

  • GPT-OSS-20B es un modelo MoE con 21 000 millones de parámetros (3600 millones activos) destinado a un uso de menor latencia y despliegue local.

Ambos modelos GPT-OSS se entrenaron con cuantificación de 4 bits de los pesos de sus modelos, lo que aumentó significativamente su velocidad y redujo sus requisitos de memoria en relación con los de los modelos convencionales de tamaño similar.

Kimi (Moonshot AI)

Kimi es una serie de modelos abiertos desarrollados por Moonshot AI, con sede en Beijing.

  • Kimi-K2 es un modelo MoE masivo de solo texto con 1 billón de parámetros totales (32 000 millones activos). Alcanzó una notoriedad significativa tras su lanzamiento en julio de 2025 por competir con y (a veces superar) los modelos GPT-4.1 y Claude Opus 4 en puntos de referencia de programación clave.

  • Kimi-K2 Thinking, la variante del modelo de razonamiento de Kimi-K2, también causó revuelo al volver a competir con los mejores modelos cerrados en exigentes puntos de referencia de IA agéntica.9

  • Kimi-K2.5 es una actualización de Kimi-K2 que agrega capacidades de visión multimodal. Se puede operar en múltiples “modos”, cada uno optimizado para casos de uso específicos.

Los modelos Kimi se lanzan bajo una Licencia MIT modificada, que requiere que los usuarios “muestren prominentemente 'Kimi K2' en la interfaz de usuario” de cualquier producto con más de 100 millones de usuarios activos mensuales o más de 20 millones de dólares en ingresos mensuales.

Llama (Meta)

Los modelos Llama de Meta (originales estilizados como Llama, abreviatura de “Large Language model Meta AI), han sido una parte integral de la historia de los LLM abiertos. Los primeros lanzamientos de Llama ayudan a democratizar las metodologías de LLM, informando e influyendo fuertemente en muchas convenciones estándar del desarrollo de LLM, desde el entrenamiento hasta la arquitectura y las variaciones de tamaño.

  • Llama 2, lanzado en julio de 2023, salió al mercado en los tamaños de 7000, 13 000 y 70 000 millones.

  • Llama 3, lanzado en abril de 2024 en tamaños de 8000 y 70 000 millones, compitió con muchos modelos cerrados líderes en los puntos de referencia académicos. Llama 3.1 amplió significativamente la longitud del contexto de los modelos y agregó una variante de 405 000 millones entonces sin precedentes en julio. Llama 3.2 agregó tanto variantes más pequeñas como capacidades de visión, mientras que Llama 3.3 contaba con un único modelo de 70 000 millones cuyo rendimiento competía con el de 405 000 millones de Llama 3.1.

  • Llama 4, lanzado en 2 grandes modelos multimodales MoE: Llama 4 Maverick, con 400 000 millones de parámetros totales (17 000 millones activos) y Llama 4 Scout, con 109 000 millones de parámetros totales (19 000 millones activos). Aunque su rendimiento superó significativamente al de las generaciones anteriores de Llama en la mayoría de los puntos de referencia, los modelos Llama 3 siguen siendo los LLM más populares de Meta (como lo reflejan las descargas en Hugging Face).10

Aunque Meta a menudo utiliza el término “código abierto”, los modelos Llama se lanzan bajo una licencia Llama personalizada que impone restricciones de uso, atribución y acceso. Por lo tanto, la Open Source Initiative ha criticado el uso que hace Meta del término.

Minimax

MiniMax Group, con sede en Shanghái, lanzó su primer LLM homónimo, MiniMax-Text-01, y un VLM complementario, MiniMax-VL-01, en enero de 2025. Desde entonces, han cobrado protagonismo como uno de los principales desarrolladores de LLM en China, priorizando modelos a gran escala y ventanas de contexto largas.

  • MiniMax-M1, lanzado en junio de 2025, es un modelo de razonamiento de solo texto creado a partir del ajuste de MiniMax-Text-01. Al igual que su predecesor, es un modelo MoE grande con 456 000 millones de parámetros totales y 45 900 millones de parámetros activados por token.
  • MiniMax-M2 ofrece un rendimiento y una eficiencia superiores en comparación con M1. Tiene un total de 230 000 millones de parámetros y una arquitectura MoE más detallada que activa solo 10 000 millones de parámetros por token. Lanzado en octubre de 2025, se actualizó como MiniMax-M2.1 dos meses después. MiniMax también ofrece MiniMax-M2-her, una versión optimizada para los juegos de rol basados en personajes.

  • MiniMax-M2.5 y MiniMax-M2.5-Lightning, lanzados en febrero de 2026, logran una mayor optimización del rendimiento, compitiendo con Claude Opus 4.5 en puntos de referencia de programación seleccionados. Son idénticos en todos los puntos excepto en velocidad y rendimiento: la variante “Lightning” genera un resultado dos veces más rápido.

  • MiniMax-M2.7, lanzado en marzo de 2026, es una actualización de MiniMax-M2.5 que, según la empresa, contribuyó a su propio entrenamiento.11

Los modelos MiniMax se ofrecen bajo una licencia modificada del MIT.

Mistral AI

Junto con sus ofertas de código cerrado, Mistral IA ofrece una variedad de modelos abiertos bien considerados. La mayoría de los modelos abiertos de Mistral se publican bajo la licencia estándar Apache 2.0.

  • Mistral Large 3 utiliza una arquitectura MoE inspirada en DeepSeek-V3, con 675 000 millones de parámetros totales (41 000 millones activos). Su rendimiento de referencia es aproximadamente equivalente al de DeepSeek-V3.1 y Kimi-K2.1.12 Lanzado en diciembre de 2025, es multilingüe y multimodal, capaz de procesar entradas de texto e imágenes.

  • Ministral 3 es la serie de modelos pequeños de Mistral, que se ofrece en tamaños 3000, 8000 y 14 000 millones y variantes básicas, ajustadas a las instrucciones y de razonamiento.

  • Mistral Small 3.2 es un LLM 24B lanzado en junio de 2025. Su rendimiento es comparable al de Ministral 3 14B más reciente.

  • Devstral es la serie de modelos centrada en la ingeniería agéntica de Mistral. Devstral 2, lanzado en diciembre de 2025, consta de dos modelos. Devstral 2 123B se publica bajo una licencia modificada del MIT, que exige a las organizaciones con ingresos mensuales superiores a 20 millones de dólares solicitar una licencia comercial a Mistral. Devstral Small 2 24B se distribuye bajo la licencia estándar Apache 2.0.

  • Mixtral, lanzado en diciembre de 2023, es un LLM que originalmente popularizó la arquitectura de mezcla de expertos para modelos de lenguaje. A principios de 2026, su variante 8x7B sigue siendo extremadamente popular en Hugging Face, con más de 700 000 descargas mensuales.13

Nemotron (NVIDIA)

La serie LLM abierta del destacado fabricante de hardware NVIDIA es bien considerada por su rendimiento, literatura de investigación e innovaciones arquitectónicas.

  • NVIDIA-Nemotron-Nano v2 es una familia de modelos híbridos Mamba-2-LLM en tamaños de 9000 y 12 000 millones, con capacidades tanto de razonamiento como de inferencia estándar. Se lanzaron en agosto de 2025 bajo un acuerdo de licencia de modelo abierto de NVIDIA personalizado con condiciones importantes en cuanto a responsabilidades legales, uso y el derecho de NVIDIA a realizar modificaciones futuras al acuerdo.

  • Nemotron 3 Nano, lanzado en diciembre de 2025, consta de dos modelos: Nemotron-3-Nano-4B y Nemotron-3-Nano-30B-A3B, un modelo de estimulación (MoE) con un total de 30 000 parámetros (3000 activos). Se publicaron bajo la licencia NVIDIA Nemotron Open Model, que excluye el derecho de NVIDIA a realizar actualizaciones unilaterales de los términos en el futuro.

  • Nemotron 3 Super es un MoE más grande con 120 000 millones de parámetros totales (12 000 millones activos), lanzado en marzo de 2026.

Olmo (AllenAI)

Olmo, desarrollado por el Allen Institute for IA (“Ai2”), se encuentra entre los modelos de código abierto más verdaderamente “abiertos” de todos los modelos de su tipo: Ai2 suele publicar todo el código, pesos, puntos de control de entrenamiento y conjuntos de datos asociados junto con una versión estándar de Apache 2.0.

  • Olmo 3, lanzado en noviembre de 2025, comprende modelos de transformadores densos en tamaños de 7000 y 32 000 millones. Los modelos se lanzan en variantes base, instrucciones y “pensantes”. En diciembre de 2025, el modelo de 32 000 millones recibió una actualización y pasó a llamarse Olmo 3.1.
  • Olmo Hybrid, lanzado en marzo de 2026, es un modelo de 7000 millones con una arquitectura híbrida experimental que combina RNN transformadores y lineales (basado en la arquitectura Gated DeltaNet popularizada por Qwen).

Phi (Microsoft)

Phi es la línea de modelos abiertos de Microsoft, históricamente centrada en modelos pequeños. Se publican bajo la licencia estándar del MIT.

  • Phi 4 es un LLM de solo texto de 14 000 millones, lanzado originalmente en diciembre de 2024.

  • Phi 4-mini, lanzado en febrero de 2025, es un modelo más pequeño de 3800 millones.

  • Phi 4-multimodal, lanzado junto con Phi 4-mini, admite entradas de texto, imágenes y voz.

  • Phi 4-Reasoning-Vision, lanzado en marzo de 2026 , es un modelo de 15 000 millones que incorpora un razonamiento holístico y multimodal sobre imágenes, texto y documentos.

Qwen (Alibaba)

La serie Qwen de LLM, desarrollada por Alibaba, se ha convertido en uno de los modelos abiertos más populares de la industria. La familia de modelos ofrece una amplia variedad de tamaños de modelos, arquitectura y capacidades destinadas a satisfacer una variedad de necesidades de los desarrolladores.

  • Qwen3 comprende modelos de transformadores densos de solo texto en tamaños de 0.6, 1.7, 4, 8, 14 y 32 mil millones, así como MoE en tamaños de 30B-A3B y el modelo insignia Qwen3-235B-A22B. Todos los modelos Qwen3 se ofrecen en variantes básicas, de pensamiento e instrucción.

  • Qwen3-Next es un MoE experimental de solo texto con parámetros 80 000 millones de parámetros (3000 activos) que reemplaza la atención estándar por Gated Delta Networks (inspiradas en Mamba-2) y Gated Attention.

  • Qwen3-Omni es un modelo multimodal nativo basado en Qwen3-30B-A3B, que admite entradas de texto, imágenes, audio o video, y resultados de texto o voz.

  • Qwen3-Coder-Next es una versión de Qwen3-Next ajustada para la generación de código.

  • Qwen3.5, lanzado en febrero de 2026, es una familia de modelos multimodales que utiliza la arquitectura introducida por primera vez en Qwen3-Next. Comprende modelos de razonamiento base e híbridos en tamaños de 0.8, 2, 4, 9 y 27 mil millones, así como modelos MoE en tamaños de 35B-A3B, 122B-A10B y el modelo insignia 397B-A17B. Qwen3.5-397B-A17B tiene como objetivo competir con los principales modelos Gemini, GPT y Claude para obtener un rendimiento de vanguardia.

Autor

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

Soluciones relacionadas
IBM Bob

Acelere la entrega de software con Bob, su socio de IA para un desarrollo seguro y consciente de la intención.

Explore IBM Bob
IBM watsonx Orchestrate

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Explore watsonx Orchestrate
Soluciones de inteligencia artificial

Ponga a trabajar la IA en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Dé el siguiente paso

Independientemente de en qué fase del ciclo de desarrollo se encuentre, Bob lo respalda con revisiones agénticas basadas en la intención y alineadas con la seguridad, que aceleran la entrega de software de alta calidad.

  1. Descubra IBM Bob
  2. Explore watsonx Orchestrate
Notas de pie de página

1. “Elon Musk reins in Grok AI bot to stop election misinformation,” The Register 28 de agosto de 2024
2. “Musk’s xAI chatbot Grok keeps randomly responding about ‘white genocide’ in South Africa,” CNBC. 14 de mayo de 2025
3. “Elon Musk’s AI chatbot, Grok, started calling itself ‘MechaHitler’,” NPR. 9 de julio de 2025
4. @MarioNawfal tweet, X (antes Twitter). 18 de febrero de 2025
5. “GPT-5.4 pro”, OpenAI, documentos de API consultados el 12 de marzo de 2026
6. “Announcing Codestral 25.08 and the Complete Mistral Coding Stack for Enterprise,” Mistral AI. 30 de julio de 2025
7. Gemma, Google DeepMind, consultado el 12 de marzo de 2026
8. “Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less,” CNBC. 14 de julio de 2025
9. “5 Thoughts on Kimi K2 Thinking,” Interconnects. 6 de noviembre de 2025
10. Meta Llama: página de modelos (ordenada por “Most Downloads”), Hugging Face. Consultado el 11 de marzo de 2026
11. “MiniMax M2.7: Early Echoes of Self-Evolution,” MiniMax. 18 de marzo de 2026
12. “Introducing Mistral 3,” Mistral AI. 2 de diciembre de 2025
13. Mistral AI: página de modelos (ordenada “Most Downloads”), Hugging Face. Consultado el 11 de marzo de 2026