Os grandes modelos de linguagem (LLMs) se tornaram a base do desenvolvimento da inteligência artificial moderna. Eles começaram e agora definem a era da IA generativa, desde aplicações simples de chatbot até engenharia agêntica e outros fluxos de trabalho automatizados complexos impulsionados por agentes de IA. Seu advento marcou um ponto de inflexão fundamental na história do aprendizado de máquina.
À medida que a tecnologia amadurece, novos LLMs continuam surgindo. Os principais desenvolvedores de IA, novas startups e grandes empresas consolidadas estão constantemente lançando e aprimorando novos modelos. Enquanto isso, a comunidade de código aberto está constantemente ajustando os LLMs de código aberto, mesclando e modificando modelos existentes em conjuntos de dados personalizados para criar infinitas variantes. Dessa forma, nenhuma lista de LLMs poderia razoavelmente ser exaustiva e mesmo a lista mais "exaustiva" não permaneceria assim por muito tempo.
A seguir, apresentamos uma lista de alguns dos LLMs mais importantes e de melhor desempenho disponíveis atualmente. Veja a seguir alguns pontos a serem observados:
Para fins práticos, os LLMs geralmente podem ser divididos em duas categories: LLMs de código fechado , disponíveis exclusivamente como ofertas comerciais pelo desenvolvedor do modelo, e modelos abertos, que são disponibilizados sem custo.
Um modelo de código fechado, ou proprietário, só pode ser acessado diretamente na plataforma do desenvolvedor do modelo, em outras plataformas para as quais ele tenha licença ou por meio da API proprietária do provedor do modelo.
Como os desenvolvedores de modelos fechados geralmente tratam seus detalhes técnicos como segredos comerciais bem guardados, normalmente é impossível saber com certeza as especificidades do tamanho, da arquitetura das redes neurais ou do processo de treinamento de um modelo fechado. Alguns detalhes podem ser inferidos, por exemplo, comparando a velocidade de inferência, o uso de memória da GPU e o desempenho em benchmark de um modelo fechado com os modelos abertos cujos detalhes são divulgados publicamente, mas raramente, ou nunca, são confirmados.
Aproximadamente desde 2022, a maioria dos modelos de ponta em um dado momento tem sido de código fechado, mas isso reflete, em grande parte, circunstâncias históricas reais do setor, e não alguma superioridade inerente dos modelos fechados em relação aos modelos abertos. A seguir, apresentamos algumas das séries de modelos fechados mais notáveis, em ordem alfabética.
Os modelos de linguagem Claude da Anthropic estão entre os de melhor desempenho do mundo. Originalmente fundada como um laboratório de pesquisa de segurança de IA em 2021 por ex-funcionários da OpenAI, a abordagem da Anthropic para o desenvolvimento de modelos é construída em torno do conceito único de IA constitucional. A “Constituição” do Claude é um documento que serve não apenas para orientar a conduta dos funcionários da Anthropic, mas também a conduta (e a criação de dados de treinamento sintéticos) dos próprios modelos do Claude.
Desde o Claude 3, gerações sucessivas do Claude apresentam modelos multimodais em três tamanhos diferentes:
O Claude Haiku, o Sonnet e o Opus podem processar entradas de texto, áudio e imagem, além de produzir texto ou áudio (como conversão de texto em fala). Historicamente, ao contrário da maioria de seus concorrentes de modelo fechado, eles (e a plataforma Claude que eles impulsionam) não eram capazes de gerar imagens, mas a partir de 12 de março de 2026, o Claude agora pode gerar imagens. Ao acessar os modelos por meio da API do Claude, os usuários podem definir o “nível de esforço” do processo de raciocínio do Sonnet ou Opus para “máximo”, “alto”, “médio”, “baixo” ou “adaptativo”.
O Gemini é a série de modelo de linguagem fechado do Google, desenvolvida por sua subsidiária Google DeepMind e lançada pela primeira vez em dezembro de 2023. Vale a pena notar que o Google Brain (que se fundiu com o DeepMind para formar o Google DeepMind em 2023) é responsável pela criação da arquitetura do modelo transformer que permitiu os primeiros LLMs e publicou o artigo de pesquisa "Attention is All You Need" em 2017 .
Desde o início de 2025, o Google lançou toda a geração de modelos Gemini com três tamanhos diferentes, todos modelos de raciocínio. Quando acessados por meio da API do Gemini, os usuários podem selecionar um dos vários "níveis de pensamento" para personalizar a quantidade de tokens e o tempo que o modelo gastará antes de gerar uma saída final.
Os modelos Gemini Pro, Flash e Flash-Lite são multimodais por natureza: podem processar entradas de texto, áudio, imagem ou vídeo e gerar saídas de texto. Quando acessadas por meio da plataforma Gemini, as saídas multimodais podem ser geradas por meio dos modelos especializados e separados do Gemini para geração de imagens, geração de vídeo ou geração de música.
Desde o lançamento do Gemini 2.5 Pro em março de 2025, que alcançou o melhor desempenho do setor na maioria dos benchmarks acadêmicos, os modelos Gemini têm competido com Claude e a série GPT da OpenAI como os LLMs de melhor desempenho do mundo. De modo geral, o status de modelo "top" muda de mãos cada vez que um novo modelo de ponta em uma dessas três séries é lançado.
Grok é uma família de LLMs proprietários produzidos pela xAI, lançados inicialmente em versão beta como um chatbot no X (antigo Twitter) em novembro de 2023. Em abril de 2025, a xAI lançou o acesso à API para o Grok 3, que na época era seu modelo mais recente e principal.
A linha de modelos Grok continuou mudando ao longo de sucessivas gerações de lançamentos de modelos.
A partir do Grok 4, os modelos Grok podem processar inputs de texto, imagem e fala. Embora os LLMs Grok não possam fornecer saídas multimodais, as saídas de imagem e vídeo podem ser geradas pelo modelo Aurora da xAI por meio de sua plataforma Grok Imagine.
Independentemente do seu desempenho bruto, grande parte da história do Grok (e particularmente a do chatbot Grok) tem sido marcada por controvérsias, como acusações de disseminação de desinformação eleitoral, inserção de pontos de vista polarizados em conversas não relacionadas e perpetuação de estereótipos prejudiciais.
Em declarações públicas, o CEO da xAI, Elon Musk, afirmou: "nossa abordagem geral é disponibilizar em código aberto a versão anterior quando a próxima versão estiver totalmente lançada".1
A xAI disponibilizou o código aberto do Grok 1 sob licença Apache 2.0 em março de 2024. Embora o Grok 3 tenha sido lançado em fevereiro de 2025, o próximo lançamento de código aberto de um modelo Grok não ocorreu até agosto de 2025. De forma confusa, a xAI (e Musk) anunciou que tinham o "Grok 2.5" de código aberto, 2 embora nenhum modelo tivesse sido nomeado nem anunciado como tal antes dessa declaração. O próprio cartão do modelo Hugging Face se refere ao modelo como "Grok-2".
Naquele anúncio de agosto de 2025, Musk indicou que o Grok 3 também seria disponibilizado como código aberto em "cerca de 6 meses". 8 meses depois, a data de lançamento da versão de código aberto ainda não foi anunciada.
A série GPT da OpenAI – abreviação de Generative Pretrained Transformer – é amplamente reconhecida por dar início a era atual da IA generativa, particularmente após o lançamento do ChatGPT em 2022 com seu modelo GPT-3.5.
As convenções da OpenAI para nomenclatura de modelos e variantes mudaram significativamente desde 2022, muitas vezes de forma confusa. Por exemplo, o GPT-4.1 foi lançado após o GPT-4.5, e o modelo de raciocínio o4 estava disponível ao mesmo tempo que o modelo multimodal sem capacidade de raciocínio GPT-4o, que era totalmente distinto do modelo de raciocínio "o4", cujo desempenho era inferior ao do "o3". No início de 2025, o CEO da OpenAI, Sam Altman, reconheceu: “Percebemos o quão complicadas nossas ofertas de modelos e produtos se tornaram”.
Desde o lançamento do GPT-5 em agosto de 2025, as ofertas consolidadas de LLMs da empresa agora incluem:
A OpenAI também lançou dois modelos GPT de pesos abertos, que são detalhados na seção "Modelos abertos" deste artigo.
A Mistral AI, empresa sediada na França e fundada por ex-funcionários da Meta AI e do Google DeepMind, dedicou-se inicialmente apenas a modelos de código aberto após o lançamento de seu primeiro modelo (Mistral 7B) em setembro de 2023. Desde então, a Mistral fez a transição para um modelo misto, no qual muitas de suas ofertas têm lançamentos abertos, mas os modelos de ponta mais selecionados permanecem de código fechado.
Em março de 2026, os principais LLMs proprietários da Mistral IA incluem:
As ofertas de modelos de pesos abertos da Mistral são detalhadas posteriormente neste artigo.
No aprendizado de máquina, código aberto é usado coloquialmente para se referir a ferramentas de IA cujo código-fonte é disponibilizado gratuitamente, mas o termo é, na verdade, uma designação formal administrada pela Open Source Initiative (OSI). A OSI só certifica uma determinada licença de software como "aprovada pela Open Source Initiative" se considerar que essa licença atende aos dez requisitos listados na Open Source Definition (OSD).
A maioria dos modelos de "código aberto" não atende a todos esses requisitos. Sendo assim, o termo modelo aberto (ou modelo de peso aberto) refere-se mais precisamente a qualquer LLM distribuído livremente. Dentro do espectro dos modelos abertos, há uma grande variabilidade. Um modelo de peso aberto (mas não de código aberto) pode ser usado para executar inferência e pode até ser ajustado com precisão – porém, se o seu código-fonte completo não for fornecido, ele não poderá ser modificado além de alterações nos valores de seus pesos por meio de ajuste fino. A licença pode proibir o uso do modelo em alguns cenários (como em ambientes comerciais) ou impor outras estipulações específicas à sua aplicação.
Um modelo verdadeiro de código aberto lançado com código de treinamento e uma descrição de seus procedimentos de treinamento, por outro lado, pode ser totalmente modificado e usado sem restrições. As licenças de código aberto mais comuns e padronizadas são a licença Apache 2.0 e a licença MIT. No entanto, vale a pena observar que, a menos que o desenvolvedor de um modelo de código aberto forneça os detalhes de seus dados de treinamento, o modelo em si não é totalmente reproduzível.
As versões de código aberto são essenciais para o desenvolvimento e a melhoria contínuas dos LLMs e são em grande parte responsáveis por viabilizar sua invenção. Os modelos abertos normalmente podem ser acessados por meio de seu desenvolvedor de modelos ou por meio de plataformas de código aberto populares, como GitHub ou Hugging Face. Confira a seguir uma lista de séries relevantes de modelos abertos, organizadas em ordem alfabética.
A Cohere, uma empresa sediada no Canadá cujos fundadores incluem um dos autores de "Attention is All You Need", foi lançada em 2019. Embora a empresa divulgue relatórios técnicos detalhados para cada LLM e os libere ostensivamente como modelos de pesos abertos, a Cohere licencia seus lançamentos abertos sob uma versão modificada da licença Creative Commons 4.0 que proíbe o uso comercial.
O Command é a principal série de modelos de base da Cohere, projetado para casos de uso corporativo.
Em um comentário no Reddit em março de 2026, o CEO da Cohere, Aidan Gomez, indicou que a empresa estava desenvolvendo ativamente a última geração do Command e que esses seriam os primeiros modelos de mixture of experts (MoE) da organização.
O Aya é a série de modelos com foco multilíngue da Cohere, lançada pela primeira vez em fevereiro de 2024 com o Aya 101, que, como o próprio nome sugere, era "capaz de seguir instruções em 101 idiomas".
A DeepSeek é um player fundamental no ecossistema de código aberto, contribuindo com diversas inovações para arquiteturas de LLM e processos de treinamento. Em alguns momentos, o desempenho de seus modelos rivalizou com os melhores modelos fechados. Seus LLMs — tanto os pesos quanto o código — são de código aberto sob uma licença MIT padrão. A DeepSeek também publica frequentemente artigos técnicos detalhando suas descobertas e técnicas.
Apesar dos rumores periódicos de um DeepSeek-V4 (ou "DeepSeek-R2") iminente, seus lançamentos ainda não se concretizaram.
A série Falcon de LLMs é desenvolvida pelo Technology Innovation Institute (TII) dos Emirados Árabes Unidos. Embora a primeira geração de modelos do TII em 2023 tenha sido talvez mais notável para o Falcon-180B, que na época era um dos maiores modelos de código aberto disponíveis, o TII desde então se concentrou em modelos menores. O Falcon2 tinha 11B de parâmetros e o Falcon3, os primeiros modelos multimodais da TII (lançados em dezembro de 2024), variavam de 1B a 10B.
As gerações mais recentes de modelos Falcon têm se concentrado em modelos híbridos Mamba-Transformer.
Os modelos Falcon são lançados sob uma licença proprietária Falcon que se inspira no framework Apache 2.0, mas inclui outras estipulações e restrições.
O Gemma é a família de modelos abertos do Google. Segundo o Google, os modelos Gemma são “construídos com a mesma tecnologia que alimenta os modelos Gemini”.7
Os modelos Gemma são distribuídos sob a licença Gemma, cujos termos de uso são semelhantes aos da licença Apache 2.0, mas são regidos pelas Políticas de uso proibido do Gemma.
O GLM é uma família de LLMs da Z.ai (também chamada de Zhipu AI) sediada em Pequim, que busca um desempenho de última geração. A empresa obteve um avanço com o GLM-4.5, que, após seu lançamento inicial no final de julho de 2025, rivalizava ostensivamente com os principais modelos abertos do mundo, incluindo os principais modelos do DeepSeek e do Qwen, em benchmarks acadêmicos.
O IBM Granite é uma série de LLMs de código aberto otimizados para casos de uso corporativo, com foco principalmente em modelos pequenos, práticos e eficientes. Lançado pela primeira vez em setembro de 2023, o Granite ganhou destaque com o lançamento do Granite 3.0 em outubro de 2024, que fez com que a série Granite alcançasse um desempenho que rivalizava com os principais modelos abertos de tamanho comparável.
O Granite 4, lançado em outubro de 2025, introduziu uma nova arquitetura híbrida Mamba2-Transformer para velocidade e eficiência de memória superiores, especialmente sob grandes cargas de trabalho, em comparação com os modelos de transformação convencionais.
Todos os modelos Granite são de código aberto sob uma licença Apache 2.0 padrão e treinados com dados seguros para empresas. Em outubro de 2025, a série Granite se tornou a primeira grande família de modelos abertos a receber a certificação ISO-42001.
Os GPT-OSS são modelos de linguagem de pesos abertos da OpenAI, lançados em agosto de 2025 sob uma licença Apache 2.0 padrão. São os primeiros LLMs abertos da empresa desde o lançamento do GPT-2 em 2019.
Ambos os modelos GPT-OSS foram treinados com quantização de 4 bits de seus pesos, aumentando significativamente a velocidade e reduzindo os requisitos de memória em relação aos modelos convencionais de tamanho semelhante.
O Kimi é uma série de modelos abertos desenvolvidos pela Moonshot AI, sediada em Pequim.
Os modelos Kimi são lançados sob uma licença MIT modificada, que exige que os usuários "exibam em destaque 'Kimi K2' na interface do usuário" de qualquer produto com mais de 100 milhões de usuários ativos mensais ou mais de US$ 20 milhões em receita mensal.
Os modelos Llama da Meta (originalmente escritos como LLaMA, abreviação de “Large Language model Meta AI”) têm sido parte integrante da história dos LLMs abertos. Os primeiros lançamentos do Llama ajudaram a democratizar as metodologias do LLM, informando e influenciando fortemente muitas convenções padrão do desenvolvimento do LLM, desde o treinamento até as variações de arquitetura e dimensionamento.
Embora a Meta use frequentemente o termo "código aberto", os modelos Llama são lançados sob uma licença Llama personalizada que impõe restrições de uso, atribuição e acesso. A Open Source Initiative, portanto,criticou o uso dos termos pela Meta.
O MiniMax Group, sediado em Xangai, lançou seu primeiro LLM homônimo, o MiniMax-Text-01, e um VLM complementar, o MiniMax-VL-01, em janeiro de 2025. Desde então, a empresa ganhou destaque como uma das principais desenvolvedoras de LLM na China, priorizando modelos de grande escala e janelas de contexto longas.
Os modelos MiniMax são oferecidos sob uma licença modificada do MIT.
Além de suas ofertas de código fechado, a Mistral AI oferece uma variedade de modelos abertos bem conceituados. A maioria dos modelos abertos da Mistral (não todos) é lançada sob a licença Apache 2.0 padrão.
As séries de LLMs abertas da NVIDIA, um dos principais fabricantes de hardware, são bem vistas por seu desempenho, literatura de pesquisa e inovações arquitetônicas.
O Olmo, desenvolvido pelo Allen Institute for AI ("Ai2"), está entre os modelos de código aberto mais verdadeiramente "abertos": o Ai2 normalmente lança todo o código, pesos, pontos de verificação de treinamento e conjuntos de dados associados, juntamente com uma versão padrão do Apache 2.0.
Phi é a linha de modelo aberto da Microsoft, historicamente focada em modelos pequenos. Eles são lançados sob a licença MIT padrão.
A série Qwen de LLMs, desenvolvida pela Alibaba, tornou-se um dos modelos abertos mais populares do setor. A família de modelos oferece uma ampla variedade de tamanhos, arquitetura e recursos de modelos destinados a atender a uma variedade de necessidades dos desenvolvedores.
Acelere a entrega de software com o Bob, seu parceiro de IA para desenvolvimento seguro e com reconhecimento de intenção.
Projete assistentes e agentes de IA escaláveis com facilidade, automatize tarefas repetitivas e simplifique processos complexos com o IBM® watsonx Orchestrate.
Coloque a IA em ação na sua empresa com a experiência em IA líder do setor e com o portfólio de soluções da IBM.
1. “Elon Musk reins in Grok AI bot to stop election misinformation,” The Register, 28 de agosto de 2024
2. “Musk’s xAI chatbot Grok keeps randomly responding about ‘white genocide’ in South Africa,” CNBC, 14 de maio de 2025
3. “Elon Musk’s AI chatbot, Grok, started calling itself ‘MechaHitler’,” NPR, 9 de julho de 2025
4. @MarioNawfal tweet, X (antigo Twitter), 18 de fevereiro 2025
5. “GPT-5.4 pro”, OpenAI, API docs acessado em 12 de março de 2026
6. “Announcing Codestral 25.08 and the Complete Mistral Coding Stack for Enterprise,” Mistral AI, 30 de julho de 2025
7. Gemma, Google DeepMind, acessado em 12 de março 2026
8. “Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less,” CNBC, 14 de julho de 2025
9. “5 Thoughts on Kimi K2 Thinking,” Interconnects, 6 de novembro de 2025
10. Meta Llama: models page (sorted by “Most Downloads”), Hugging Face, acessado em 11 de março 2026
11. “MiniMax M2.7: Early Echoes of Self-Evolution,” MiniMax, 18 de março de 2026
12. “Introducing Mistral 3,” Mistral AI, 2 de dezembro de 2025
13. Mistral AI: models page (sorted by “Most Downloads”), Hugging Face, acessado em 11 de março de 2026