Los modelos de lenguaje de gran tamaño (LLM) se han convertido en la base del desarrollo de la inteligencia artificial moderna. Iniciaron y ahora definen la era de la IA generativa, desde las sencillas aplicaciones de chatbot hasta la ingeniería agéntica y otros complejos flujos de trabajo automatizados impulsados por agentes de IA. Su llegada ha marcado un punto de inflexión fundamental en la historia del machine learning.
A medida que la tecnología madura, siguen apareciendo nuevos LLM. Los principales desarrolladores de IA, las nuevas empresas emergentes y las potencias empresariales consolidadas lanzan y perfeccionan constantemente nuevos modelos. Mientras tanto, la comunidad de código abierto afina constantemente los LLM de código abierto, fusionando y modificando los modelos existentes en conjuntos de datos personalizados para crear un sinfín de variantes. Por lo tanto, ninguna lista de LLM puede pretender ser exhaustiva, y ni siquiera la lista más “exhaustiva” lo seguiría siendo durante mucho tiempo.
A continuación, se presenta una lista de algunos de los LLM más destacados y eficientes disponibles hoy en día. Estas son algunas cosas a tener en cuenta:
A efectos prácticos, los LLM pueden dividirse generalmente en dos categorías: los LLM de código cerrado, disponibles únicamente como oferta comercial a través del desarrollador del modelo, y los modelos abiertos, que se ponen a disposición del público de forma gratuita.
A un modelo de código cerrado, o modelo propietario, solo se puede acceder directamente en la plataforma del desarrollador del modelo, en otras plataformas a las que haya concedido la licencia de su modelo o a través de la API propietaria del proveedor del modelo.
Dado que los desarrolladores de modelos cerrados suelen considerar sus detalles técnicos como secretos comerciales celosamente guardados, por lo general es imposible conocer con certeza los detalles concretos del tamaño de un modelo cerrado, la arquitectura de la red neuronal o el proceso de entrenamiento. Se pueden inferir algunos detalles, por ejemplo, comparando la velocidad de inferencia, el uso de memoria de la GPU y el rendimiento en pruebas comparativas de un modelo cerrado con los de modelos abiertos cuyos detalles se han hecho públicos, aunque rara vez, por no decir nunca, se confirman.
Al menos desde aproximadamente 2022, la mayoría de los modelos de vanguardia en cada momento han sido modelos cerrados, pero eso se debe en gran medida a las circunstancias históricas reales del sector, más que a una superioridad inherente de los modelos cerrados frente a los abiertos. A continuación se presentan algunas de las series de modelos cerrados más conocidos, ordenadas alfabéticamente.
Los modelos de lenguaje Claude de Anthropic se encuentran entre los más eficaces del mundo. Fundado originalmente como un laboratorio de investigación sobre la seguridad de la IA en 2021 por antiguos empleados de OpenAI, el enfoque de Anthropic para el desarrollo de modelos se basa en el concepto único de la IA constitucional. La “Constitución” de Claude es un documento que sirve no solo para orientar la conducta de los empleados de Anthropic, sino también la conducta (y la creación de datos de entrenamiento sintéticos) de los propios modelos de Claude.
Desde Claude 3, las sucesivas generaciones de Claude han presentado modelos multimodales en tres tamaños diferentes:
Claude, Haiku, Sonnet y Opus pueden procesar entradas de texto, audio e imágenes, y generar texto o audio (mediante la conversión de texto a voz). Históricamente, a diferencia de la mayoría de sus competidores que utilizan modelos cerrados, ellos (y la plataforma Claude que utilizan) no eran capaces de generar imágenes; sin embargo, desde el 12 de marzo de 2026, Claude ya puede generar imágenes. Al acceder a los modelos a través de la API de Claude, los usuarios pueden establecer el “nivel de esfuerzo” del proceso de razonamiento de Sonnet u Opus en “máximo”, “alto”, “medio”, “bajo” o “adaptativo”.
Gemini es la serie de modelos de lenguaje cerrados de Google, desarrollada por su filial Google DeepMind y lanzada por primera vez en diciembre de 2023. Cabe señalar que Google Brain (que se fusionó con DeepMind para formar Google DeepMind en 2023) es responsable de la creación de la arquitectura del modelo transformador que hizo posible los primeros LLM, tras haber publicado el histórico artículo de investigación “Attention is All You Need” en 2017.
Desde principios de 2025, Google ha lanzado cada generación de modelos Gemini con tres tamaños diferentes, todos ellos modelos de razonamiento. Cuando se accede a través de la API Gemini, los usuarios pueden seleccionar uno de varios “niveles de pensamiento” para personalizar la cantidad de tokens y el tiempo que el modelo dedicará antes de generar un salida.
Los modelos Gemini Pro, Flash y Flash-Lite son multimodales de forma nativa: pueden procesar entradas de texto, audio, imagen o vídeo y generar salidas de texto. Cuando se accede a través de la plataforma Gemini, los resultados multimodales se pueden generar a través de modelos separados y especializados de Gemini para la generación de imágenes, la generación de vídeo o la generación de música.
Desde el lanzamiento de Gemini 2.5 Pro en marzo de 2025, que logró el mejor rendimiento del sector en la mayoría de los puntos de referencia académicos, los modelos Gemini han competido con la serie GPT de Claude y OpenAI como los LLM de mayor rendimiento del mundo. En términos generales, el título de “modelo estrella” cambia de manos cada vez que se lanza un nuevo modelo de vanguardia de alguna de esas tres series.
Grok es una familia de LLM propietarios producidos por xAI, lanzados por primera vez en versión beta previa como chatbot en X (antes Twitter) en noviembre de 2023. En abril de 2025, xAI lanzó el acceso a la API para Grok 3, que era entonces su modelo más reciente y emblemático.
La gama de modelos de Grok ha ido evolucionando con cada nueva generación de modelos lanzados al mercado.
A partir de Grok 4, los modelos Grok pueden procesar entradas de texto, imágenes y voz. Aunque los LLM de Grok no pueden proporcionar salidas multimodales, el modelo Aurora de xAI puede generar resultados de imagen y vídeo a través de su plataforma Grok Imagine.
Aparte de su rendimiento, gran parte de la historia de Grok (y en particular la del chatbot Grok) ha estado marcada por la controversia, como las acusaciones de difundir desinformación electoral, insertar puntos de vista polarizadores en conversaciones no relacionadas y perpetuar estereotipos dañinos.
En declaraciones públicas, el CEO de xAI, Elon Musk, ha dicho que “nuestro enfoque general consiste en publicar la última versión como código abierto cuando la siguiente versión esté completamente disponible”1.
xAI lanzó Grok 1 de código abierto bajo licencia Apache 2.0 en marzo de 2024. Aunque Grok 3 se lanzó en febrero de 2025, la próxima versión de código abierto de un modelo Grok no fue hasta agosto de 2025. Curiosamente, xAI (y Musk) anunciaron que habían publicado “Grok 2.5” 2 de código abierto, aunque antes de ese comunicado no se había mencionado ni anunciado ningún modelo con ese nombre. La ficha del modelo Hugging Face del propio modelo incluso se refiere al modelo como “Grok-2”.
En ese anuncio de agosto de 2025, Musk indicó que Grok 3 también sería de código abierto en “unos seis meses”. Ocho meses después, dicha fecha de lanzamiento de código abierto aún no se ha anunciado.
A la serie GPT de OpenAI, abreviatura de Generative Pretrained Transformer, se le atribuye en gran medida el inicio de la era actual de la IA generativa, sobre todo tras el lanzamiento en 2022 de ChatGPT con su modelo GPT-3.5.
Las convenciones de OpenAI para la nomenclatura de modelos y las variantes han cambiado significativamente desde 2022, a menudo de forma confusa. Por ejemplo, GPT-4.1 se lanzó después de GPT-4.5, y el modelo de razonamiento o4 estaba disponible al mismo tiempo que el modelo de razonamiento multimodal GPT-4o, que era completamente distinto de su modelo de razonamiento “o4”, cuyo rendimiento era inferior al de “o3”. A principios de 2025, el CEO de OpenAI, Sam Altman, reconoció que “nos hemos dado cuenta de lo complicadas que se han vuelto nuestras ofertas de modelos y productos”.
Desde el lanzamiento de GPT-5 en agosto de 2025, las ofertas consolidadas de LLM de la empresa ahora comprenden:
OpenAI también ha publicado dos modelos GPT de pesos abiertos, que se describen en detalle en la sección “Modelos abiertos” de este artículo.
Mistral AI, una empresa con sede en Francia fundada por antiguos empleados de Meta AI y Google DeepMind, se dedicó originalmente por completo a los modelos de código abierto tras el lanzamiento de su primer modelo (Mistral 7B) en septiembre de 2023. Desde entonces, Mistral ha pasado a un modelo mixto en el que muchas de sus ofertas tienen versiones abiertas, pero algunos modelos de frontera siguen siendo de código cerrado.
A partir de marzo de 2026, los principales LLM patentados de Mistral IA incluyen:
Las ofertas de modelos de pesos abiertos de Mistral se detallan más adelante en este artículo.
En el ámbito del machine learning, código abierto se utiliza a menudo de manera coloquial para referirse a herramientas de IA cuyo código fuente está disponible de forma gratuita, pero el término es, en realidad, una denominación formal regulada por la Open Source Initiative (OSI). La OSI solo certifica una licencia de software determinada como “aprobada por la Open Source Initiative” si considera que dicha licencia cumple los diez requisitos enumerados en la Open Source Definition (OSD) oficial.
La mayoría de los modelos de “código abierto” no cumplen todos esos requisitos. Siendo así, el término modelo abierto (o modelo de pesos abiertos) se refiere con mayor precisión a cualquier LLM de libre distribución. Dentro del espectro de modelos abiertos hay una gran variabilidad. Un modelo de pesos abiertos (pero no de código abierto) se puede utilizar para ejecutar inferencias e incluso se puede afinar, pero si no se proporciona su código fuente completo, no se puede modificar más allá de los cambios en los valores de sus pesos mediante el fine-tuning. Su licencia puede prohibir el uso del modelo en algunos escenarios (como entornos comerciales) o establecer otras estipulaciones específicas en su aplicación.
Por el contrario, un verdadero modelo de código abierto publicado con el código de entrenamiento y una descripción de sus procedimientos de entrenamiento puede modificarse completamente de cualquier forma y utilizarse sin restricciones. Las licencias de código abierto más comunes y estandarizadas son la licencia Apache 2.0 y la licencia MIT. No obstante, cabe señalar que, a menos que el desarrollador de un modelo de código abierto facilite los detalles de sus datos de entrenamiento, el modelo en sí no es totalmente reproducible.
Las versiones de código abierto son parte integral del desarrollo y la mejora continuos de los LLM y son en gran medida responsables de permitir su invención en primer lugar. Normalmente se puede acceder a los modelos abiertos a través de su desarrollador de modelos o de plataformas populares de código abierto como GitHub o Hugging Face. A continuación se presenta una lista de series de modelos abiertos destacados, ordenados alfabéticamente.
Cohere, una empresa con sede en Canadá entre cuyos fundadores se encuentra uno de los autores de “Attention is All You Need”, se lanzó en 2019. Aunque la empresa publica informes técnicos detallados para cada LLM y aparentemente los publica como modelos de pesos abiertos, Cohere licencia sus versiones abiertas bajo una versión modificada de la licencia Creative Commons 4.0 que prohíbe el uso comercial.
Command es la serie de modelos fundacionales insignia de Cohere, diseñada para casos de uso empresarial.
En un comentario publicado en Reddit en marzo de 2026, el CEO de Cohere, Aidan Gomez, indicó que la empresa estaba desarrollando activamente la próxima generación de Command, y que estos serían los primeros modelos de la organización basados en una combinación de expertos (MoE).
Aya es la serie de modelos de Cohere centrada en el multilingüismo, lanzada por primera vez en febrero de 2024 con el modelo Aya 101, que, como su nombre indica, era “capaz de seguir instrucciones en 101 idiomas”.
DeepSeek es un actor integral en el ecosistema de código abierto, que aporta una serie de innovaciones a las arquitecturas LLM y los procesos de formación. En ocasiones, el rendimiento de sus modelos ha rivalizado con el de los modelos cerrados de primer nivel. Sus LLM, tanto los pesos como el código, son de código abierto bajo una licencia estándar del MIT. DeepSeek también publica con frecuencia documentos técnicos que detallan sus hallazgos y técnicas.
A pesar de los rumores periódicos de un inminente DeepSeek-V4 (o “DeepSeek-R2”), sus lanzamientos aún no se han materializado.
La serie Falcon de LLM ha sido desarrollada por el Instituto de Innovación Tecnológica (TTI) de los Emiratos Árabes Unidos. Aunque la primera generación de modelos de TII, lanzada en 2023, destacó sobre todo por el Falcon-180B, que en aquel momento era uno de los modelos de código abierto más grandes disponibles, desde entonces TII se ha centrado en modelos más pequeños. Falcon2 contaba con 11 000 millones de parámetros, mientras que Falcon3, los primeros modelos multimodales de TII (lanzados en diciembre de 2024), oscilaban entre 1000 y 10 000 millones de parámetros.
Las generaciones más recientes de modelos Falcon se han centrado en modelos híbridos Mamba-Transformer.
Los modelos Falcon se publican bajo una licencia patentada de Falcon que se inspira en el marco Apache 2.0, pero añade estipulaciones y restricciones notables.
Gemma es la familia de modelos abiertos de Google. Según Google, los modelos Gemma están “construidos con la misma tecnología que impulsa [sus] modelos Gemini”7.
Los modelos Gemma se publican bajo la licencia Gemma, cuyos términos de uso son similares a los de la licencia Apache 2.0, pero se rigen por la Política de uso prohibido de Gemma.
GLM es una familia de LLM desarrollados por la empresa Z.ai (también conocida como Zhipu AI), con sede en Pekín, cuyo objetivo es alcanzar un rendimiento de vanguardia. La empresa logró un gran avance con GLM-4.5, que, tras su lanzamiento inicial a finales de julio de 2025, compitió abiertamente con los mejores modelos abiertos del mundo, incluidos los modelos insignia de DeepSeek y Qwen, en las pruebas de rendimiento académicas.
IBM® Granite es una serie de LLM de código abierto optimizados para casos de uso empresariales, centrados principalmente en modelos pequeños, prácticos y eficientes. Lanzado por primera vez en septiembre de 2023, Granite saltó a la fama con el lanzamiento de Granite 3.0 en octubre de 2024, con el que la serie Granite alcanzó un rendimiento que rivalizaba con el de los principales modelos abiertos de tamaño comparable.
Granite 4, lanzado en octubre de 2025, introdujo una nueva arquitectura híbrida Mamba2-Transformer para una velocidad y eficiencia de memoria superiores, especialmente bajo cargas de trabajo elevadas, en comparación con los modelos convencionales de transformadores.
Todos los modelos Granite son de código abierto bajo una licencia Apache 2.0 estándar y están entrenados con datos seguros para la empresa. En octubre de 2025, la serie Granite se convirtió en la primera gran familia de modelos abiertos en recibir la certificación ISO-42001.
GPT-OSS son los modelos de lenguaje de pesos abiertos de OpenAI, lanzados en agosto de 2025 bajo una licencia estándar de Apache 2.0. Son los primeros LLM abiertos de la empresa desde el lanzamiento de GPT-2 en 2019.
Ambos modelos GPT-OSS se entrenaron con una cuantificación de 4 bits de sus pesos, lo que aumentó considerablemente su velocidad y redujo sus requisitos de memoria en comparación con los de los modelos convencionales de tamaño similar.
Kimi es una serie de modelos abiertos desarrollados por Moonshot AI, con sede en Pekín.
Los modelos Kimi se lanzan bajo una licencia MIT modificada, que requiere que los usuarios “muestren de forma destacada 'Kimi K2' en la interfaz de usuario” de cualquier producto con más de 100 millones de usuarios activos mensuales o más de 20 millones de dólares en ingresos mensuales.
Los modelos Llama de Meta (originalmente estilizado como LLaMA, abreviatura de “Large Language model Meta AI”), han sido una parte integral de la historia de los LLM abiertos. Las primeras versiones de Llama contribuyen a democratizar las metodologías de los LLM, ya que sirven de referencia e influyen considerablemente en muchas convenciones estándar del desarrollo de estos modelos, desde el entrenamiento hasta la arquitectura y las variaciones en el tamaño.
Aunque Meta suele utilizar el término “código abierto”, los modelos Llama se publican bajo una licencia Llama personalizada que impone restricciones de uso, atribución y acceso. Por ello, la Open Source Initiative ha criticado el uso del término por parte de Meta.
MiniMax Group, con sede en Shanghái, lanzó su primer LLM homónimo, MiniMax-Text-01, y un VLM complementario, MiniMax-VL-01, en enero de 2025. Desde entonces, se han consolidado como uno de los principales desarrolladores de modelos LLM en China, dando prioridad a los modelos a gran escala y a las ventanas de contexto largas.
Los modelos MiniMax se ofrecen bajo una licencia modificada del MIT.
Además de su oferta de código cerrado, Mistral AI ofrece una variedad de modelos abiertos muy apreciados. La mayoría (pero no todos) de los modelos abiertos de Mistral se publican bajo la licencia estándar Apache 2.0.
La serie de LLM de código abierto de NVIDIA, el destacado fabricante de hardware, goza de gran prestigio por su rendimiento, su contribución a la literatura científica y sus innovaciones arquitectónicas.
Olmo, desarrollados por el Allen Institute for AI (“Ai2”), se encuentran entre los modelos de código abierto más “abiertos” que existen: Ai2 suele publicar todo el código, los pesos, los puntos de control del entrenamiento y los conjuntos de datos asociados, junto con una licencia estándar Apache 2.0.
Phi es la línea de modelos abiertos de Microsoft, que históricamente se ha centrado en los modelos pequeños. Se publican bajo la licencia estándar del MIT.
La serie Qwen de LLM, desarrollada por Alibaba, se ha convertido en uno de los modelos abiertos más populares del sector. La familia de modelos ofrece una amplia variedad de tamaños, arquitectura y capacidades destinadas a adaptarse a una variedad de necesidades de los desarrolladores.
Acelere la entrega de software con Bob, su socio de IA para un desarrollo seguro y consciente de la intención.
Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.
Ponga la IA al servicio de su negocio con la experiencia líder del sector y el portfolio de soluciones de IA de IBM.
1. “Elon Musk reins in Grok AI bot to stop election misinformation”. The Register. 28 de agosto de 2024.
2. “Musk’s xAI chatbot Grok keeps randomly responding about ‘white genocide’ in South Africa”. CNBC. 14 de mayo de 2025.
3. “Elon Musk’s AI chatbot, Grok, started calling itself ‘MechaHitler’”. NPR. 9 de julio de 2025.
4. @MarioNawfal tweet. X (anteriormente Twitter). 18 de febrero de 2025.
5. “GPT-5.4 pro”. OpenAI. Documentos API consultados el 12 de marzo de 2026.
6. “Announcing Codestral 25.08 and the Complete Mistral Coding Stack for Enterprise”. Mistral AI. 30 de julio de 2025.
7. Gemma. Google DeepMind. Consultado el 12 de marzo de 2026.
8. “Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less”. CNBC. 14 de julio de 2025.
9. “5 Thoughts on Kimi K2 Thinking”. Interconnects. 6 de noviembre de 2025.
10. Meta Llama: models page (sorted by “Most Downloads”). Hugging Face. Consultado el 11 de marzo de 2026.
11. “MiniMax M2.7: Early Echoes of Self-Evolution”. MiniMax. 18 de marzo de 2026.
12. “Introducing Mistral 3,” Mistral AI, 2 December 2025
13. Mistral AI: models page (sorted by “Most Downloads”). Hugging Face. Consultado el 11 de marzo de 2026.