추상적인 3차원 직사각형

대규모 언어 모델(LLM) 목록

LLM 목록

대규모 언어 모델(LLM)은 현대 인공지능 개발의 핵심 기반이 되었습니다. 이들은 단순한 챗봇 애플리케이션부터 에이전틱 엔지니어링 및 AI 에이전트가 구동하는 복잡한 자동화 워크플로에 이르기까지 생성형 AI 시대를 열었으며 현재 이를 정의하고 있습니다. 이들의 등장은 머신러닝 역사에서 근본적인 전환점을 의미합니다.

기술이 성숙함에 따라 새로운 LLM은 계속해서 증가하고 있습니다. 선도적인 AI 개발자, 신생 스타트업, 그리고 기존의 대형 기업 모두가 새로운 모델을 지속적으로 출시하고 개선하고 있습니다. 한편 오픈 소스 커뮤니티는 지속적으로 오픈 소스 LLM을 파인튜닝하고, 사용자 정의 데이터 세트를 기반으로 기존 모델을 병합 및 수정하여 끝없이 다양한 변형을 만들어내고 있습니다. 따라서 어떤 LLM 목록도 완전한 목록이 되기는 현실적으로 어렵고, 가장 “포괄적인” 목록조차 오래 유지되지는 않습니다.

다음은 현재 이용 가능한 가장 주목받고 성능이 뛰어난 LLM 중 일부를 정리한 목록입니다. 다음은 참고할 사항입니다.

  • 이 목록은 개발자가 적극적으로 지원 및 업데이트하고 있으며 최소한 경쟁력을 유지하는 모델을 우선적으로 포함합니다. 이로 인해 Google의 T5, OpenAI의 GPT-3, Meta의 Llama 2와 같은 역사적으로 영향력이 큰 파운데이션 모델 중 일부는 제외되며, 이들 중 일부는 여전히 연구 목적으로 사용되고 있습니다.

실무적인 관점에서 LLM은 일반적으로 두 가지 범주로 나눌 수 있습니다. 하나는 모델 개발자를 통해서만 상업적으로 제공되는 클로즈드 소스 LLM이며, 다른 하나는 무료로 공개되는 오픈 모델입니다.

트랙에서 굴러가는 공의 3D 디자인

최신 AI 뉴스+인사이트


주간 Think 뉴스레터에서 전문가들이 선별한 AI, 클라우드 등에 관한 인사이트와 소식을 살펴보세요. 

폐쇄형 소스 LLM

클로즈드 소스 모델 또는 독점 모델은 모델 개발자의 플랫폼, 해당 모델이 라이선스된 다른 플랫폼 또는 모델 제공자의 독점 API를 통해서만 직접 액세스할 수 있습니다.

클로즈드 모델 개발자는 일반적으로 기술 세부 사항을 엄격히 보호되는 영업 비밀로 취급하기 때문에, 모델의 규모, 신경망 아키텍처 또는 학습 과정과 같은 구체적인 사항을 정확히 알기는 어렵습니다. 일부 세부 사항은 추론할 수 있습니다. 예를 들어 클로즈드 모델의 추론 속도, GPU 메모리 사용량, 벤치마크 성능을 공개된 정보를 가진 오픈 모델과 비교함으로써 유추할 수 있지만, 실제로 확인되는 경우는 거의 없습니다.

적어도 2022년경 이후로 특정 시점의 최첨단 프런티어 모델 대부분은 폐쇄형 모델이었지만, 이는 폐쇄형 모델이 오픈 모델보다 본질적으로 우수해서라기보다는 업계의 실제 역사적 상황을 반영한 결과입니다. 다음은 알파벳 순으로 정리한 대표적인 폐쇄형 모델 시리즈입니다.

Claude(Anthropic)

Anthropic의 Claude 언어 모델은 세계에서 가장 뛰어난 성능을 가진 모델 중 하나입니다. Anthropic은 2021년 전 OpenAI 직원들이 설립한 AI 안전성 연구소로 출발했으며, 모델 개발 접근 방식은 헌법 기반 AI라는 독특한 개념을 중심으로 구축되어 있습니다.Claude의 “헌법”은 Anthropic 직원의 행동을 안내할 뿐만 아니라, Claude 모델 자체의 행동(및 합성 학습 데이터 생성)까지 규정하는 문서입니다.

Claude 3 이후로 Claude의 각 세대는 세 가지 크기의 멀티모달 모델로 제공되고 있습니다.

  • Claude Haiku는 Anthropic의 가장 작은 모델로, 속도와 비용 효율성에 최적화되어 있습니다. Sonnet과 Opus와 달리 Haiku 모델은 추론 모델이 아니며, 명시적으로 요청하지 않는 한 사고의 사슬(CoT) 추론 과정을 출력하지 않습니다.
  • Claude Sonnet은 Anthropic의 중간 크기 모델로, 대부분의 사용 사례에서 성능과 효율성 간 최적의 균형을 목표로 합니다. Sonnet과 Opus는 모두 하이브리드 추론 모델로, 표준 추론 또는 복잡한 다단계 문제 해결을 위한 적응형 CoT 추론을 수행하도록 설정할 수 있습니다.
  • Claude Opus는 Anthropic의 가장 크고 강력한 모델로, 난이도가 높은 작업 전반에서 최첨단 성능을 목표로 합니다.

Claude Haiku, Sonnet, Opus는 모두 텍스트, 오디오, 이미지 입력을 처리할 수 있으며 텍스트 또는 오디오(텍스트 음성 변환 형태)로 출력할 수 있습니다. 과거에는 대부분의 클로즈드 모델 경쟁사와 달리 이들(및 이를 기반으로 하는 Claude 플랫폼)은 이미지 생성 기능을 제공하지 않았지만, 2026년 3월 12일 기준으로 Claude는 이제 이미지를 생성할 수 있습니다. Claude API를 통해 모델에 액세스할 경우, Sonnet 또는 Opus의 추론 과정에 대한 “노력 수준”을 “max”, “high”, “medium”, “low” 또는 “adaptive”로 설정할 수 있습니다.

Gemini(Google)

Gemini는 Google의 자회사인 Google DeepMind가 개발한 클로즈드 언어 모델 시리즈로, 2023년 12월에 처음 출시되었습니다. Google Brain(2023년에 DeepMind와 합병되어 Google DeepMind를 형성)은 최초의 LLM을 가능하게 한 트랜스포머 모델 아키텍처를 개발했으며, 2017년에 기념비적인 “Attention is All You Need” 논문을 발표했다는 점도 주목할 만합니다.

2025년 초 이후 Google은 각 Gemini 모델 세대를 세 가지 크기로 출시했으며, 모두 추론 모델입니다. Gemini API를 통해 접근할 경우 사용자는 여러 “사고 수준” 중 하나를 선택하여 최종 출력을 생성하기 전에 모델이 사용할 토큰 수와 시간을 조정할 수 있습니다.

  • Gemini Pro 모델은 Google의 가장 크고 최첨단 LLM입니다.
  • Gemini Flash 모델은 Gemini Pro와 비교했을 때 속도에 최적화되어 있습니다.

  • Gemini Flash-Lite 모델은 번역 및 에이전틱 툴 사용과 같은 대량 작업에 최적화된 빠르고 비용 효율적인 모델입니다.

Gemini Pro, Flash, Flash-Lite 모델은 기본적으로 멀티모달로, 텍스트, 오디오, 이미지 또는 비디오 입력을 처리하고 텍스트 출력을 생성할 수 있습니다. Gemini 플랫폼을 통해 접근할 경우 멀티모달 출력은 이미지 생성, 동영상 생성 또는 음악 생성을 위한 별도의 특화 모델을 통해 생성할 수 있습니다.

2025년 3월 Gemini 2.5 Pro가 대부분의 학술 벤치마크에서 당시 업계 최고 성능을 달성하며 출시된 이후, Gemini 모델은 Claude 및 OpenAI의 GPT 시리즈와 함께 세계에서 가장 높은 성능을 보이는 LLM으로 경쟁하고 있습니다. 일반적으로 세 가지 시리즈 중 하나에서 새로운 프런티어 모델이 출시될 때마다 “최고” 모델의 지위는 바뀝니다.

Grok(xAI)

Grok은 xAI가 개발한 독점 LLM 계열로, 2023년 11월 X(구 Twitter)에서 챗봇 형태의 베타 프리뷰로 처음 출시되었습니다. 2025년 4월 xAI는 당시 최신 플래그십 모델이었던 Grok 3에 대한 API 액세스를 출시했습니다.

Grok의 모델 라인업은 세대별 모델 출시를 거치며 지속적으로 변화해 왔습니다.

  • Grok 2에는 해당 모델 계열 최초의 크기 기반 변형인 Grok 2 Mini가 함께 출시되었습니다. 이와 같은 방식은 2025년 2월 Grok 3에서도 동일하게 적용되었습니다.

  • Grok 모델의 4세대는 2025년 7월 Grok 4Grok 4 Heavy로 출시되었습니다. 2025년 가을에는 Grok 4 Fast가 이어서 출시되었고, 이후 Grok 4.1(Thinking 및 Non-thinking 구성 모두 제공)이 출시되었습니다.

  • 2025년 8월 xAI는 에이전틱 코딩에 최적화된 효율 중심 모델인 Grok Code Fast 1을 출시했습니다.

Grok 4 기준으로 Grok 모델은 텍스트, 이미지 및 음성 입력을 처리할 수 있습니다. Grok LLM은 멀티모달 출력을 제공하지 않지만, 이미지 및 동영상 출력은 Grok Imagine 플랫폼을 통해 xAI의 Aurora 모델로 생성할 수 있습니다.

성능과는 별개로 Grok의 역사(특히 Grok 챗봇)는 선거 관련 허위 정보 확산, 관련 없는 대화에 분열을 조장하는 관점 삽입, 유해한 고정관념 강화와 같은 논란으로 점철되어 왔습니다.

오픈 소스 릴리스

공식 발언에서 xAI CEO Elon Musk는 “우리의 일반적인 접근 방식은 다음 버전이 완전히 출시되면 이전 버전을 오픈 소스로 공개하는 것”이라고 밝혔습니다.1

xAI는 2024년 3월 Apache 2.0 라이선스로 Grok 1을 오픈 소스로 공개했습니다. Grok 3는 2025년 2월에 출시되었지만, 다음 Grok 모델의 오픈 소스 공개는 2025년 8월까지 이루어지지 않았습니다. 혼란스럽게도 xAI(및 Musk)는 “Grok 2.5”를 오픈 소스로 공개했다고 발표했지만, 2  그 이전에는 해당 이름의 모델이 명명되거나 발표된 적이 없었습니다. 모델의 Hugging Face 모델 카드에서도 해당 모델을 “Grok-2”로 표기하고 있습니다.

2025년 8월 발표에서 Musk는 Grok 3 역시 “약 6개월 내” 오픈 소스로 공개될 것이라고 밝혔습니다. 그러나 8개월이 지난 시점에서도 해당 오픈 소스 공개 일정은 아직 발표되지 않았습니다.

GPT(OpenAI)

OpenAI의 GPT 시리즈(Generative Pretrained Transformer의 약어)는 특히 2022년 GPT-3.5 모델 기반 ChatGPT 출시 이후 현재의 생성형 AI 시대를 여는 데 크게 기여한 것으로 평가됩니다.

OpenAI의 모델 명명 및 변형 규칙은 2022년 이후 크게 변화했으며, 때로는 혼란스럽게 느껴질 수 있습니다. 예를 들어 GPT-4.1은 GPT-4.5 이후에 출시되었고, o4 추론 모델은 멀티모달 비추론 모델인 GPT-4o와 동시에 제공되었으며, 이는 “o4” 추론 모델과 완전히 별개의 모델로 성능 또한 “o3”보다 낮았습니다. 2025년 초 OpenAI CEO Sam Altman은 “우리의 모델 및 제품 구성이 얼마나 복잡해졌는지 인지하고 있습니다.”라고 인정했습니다.

2025년 8월 GPT-5 출시 이후, 회사의 통합 LLM 제품 구성은 다음과 같습니다.

  • GPT-5.x는 OpenAI의 대표 범용 모델입니다. 2026년 3월 기준 최신 모델 버전은 GPT-5.4입니다.모든 GPT-5 모델은 추론 모델이지만, GPT-5.4는 GPT-5.4 Pro 변형도 제공되며, 이는 “더 많은 연산을 사용해 더 깊이 사고하고 일관되게 더 나은 답변을 제공합니다.”3OpenAI는 또한 에이전틱 코드 생성을 최적화하도록 파인튜닝된 GPT-5 버전인 GPT-5 Codex도 제공하며, 이는 핵심 모델 업데이트에 맞춰 주기적으로 업데이트됩니다.
  • OpenAI의 모델 개요에 따르면 GPT-5 mini는 “비용에 민감하고 지연 시간이 짧으며 처리량이 높은 워크로드를 위한 프런티어급에 가까운 지능”을 제공합니다.
  • GPT-5 nano는 “가장 빠르고 비용 효율적인 GPT-5 버전”입니다.

OpenAI는 또한 2개의 오픈 웨이트 GPT 모델을 출시했으며, 이에 대한 자세한 내용은 이 글의 “오픈 모델” 섹션에서 확인할 수 있습니다.

Mistral AI

Mistral AI는 Meta AI와 Google DeepMind 출신 인력들이 설립한 프랑스 기반 기업으로, 2023년 9월 첫 모델(Mistral 7B) 출시 당시에는 전적으로 오픈 소스 모델에 집중했습니다. 이후 Mistral은 일부 프런티어 모델은 클로즈드 소스로 유지하면서, 많은 모델을 오픈 형태로 공개하는 혼합 전략으로 전환했습니다.

2026년 3월 기준 Mistral AI의 대표 독점 LLM은 다음과 같습니다.

  • Mistral Medium 3.1은 2025년 8월에 출시된 범용 멀티모달 모델입니다.

  • Codestral은 “고정밀 중간 채우기(FIM) 완성을 위해 특별히 설계된” 코딩 중심 모델입니다.4

  • Magistral Medium 1.2는 Mistral Medium을 보완하는 추론 모델입니다.

Mistral의 오픈 웨이트 모델에 대한 자세한 내용은 이 글의 후반부에서 다룹니다.

AI 아카데미

파운데이션 모델이 AI 패러다임의 전환을 가져오는 이유

새로운 수익을 창출하고 비용을 절감하며 생산성을 높일 수 있는, 유연하고 재사용 가능한 새로운 AI 모델을 살펴봅니다. 그다음, 가이드북을 통해 보다 심층적으로 알아봅니다.

오픈 소스 LLM

머신러닝에서 오픈 소스는 종종 소스 코드가 무료로 공개된 AI 툴을 지칭하는 용어로 사용되지만, 실제로는 Open Source Initiative(OSI)가 관리하는 공식적인 정의입니다. OSI는 특정 소프트웨어 라이선스가 공식 오픈 소스 정의(OSD)에 명시된 10가지 요건을 충족한다고 판단하는 경우에만 “Open Source Initiative 승인”으로 인증합니다.

대부분의 “오픈 소스” 모델은 이러한 모든 요건을 충족하지 않습니다. 이러한 이유로 오픈 모델(또는 오픈 웨이트 모델)이라는 용어가 자유롭게 배포되는 LLM을 보다 정확하게 지칭합니다. 오픈 모델의 범주 내에는 매우 다양한 형태가 존재합니다. 오픈 웨이트(그러나 오픈 소스는 아닌) 모델은 추론 실행 및 파인튜닝이 가능하지만, 전체 소스 코드가 제공되지 않는 경우 가중치 값 변경 이상의 수정은 불가능합니다. 해당 모델의 라이선스는 일부 사용 시나리오(예: 상업적 환경)에서의 사용을 제한하거나 특정 조건을 부과할 수 있습니다.

반대로 학습 코드와 학습 절차 설명이 함께 공개된 진정한 오픈 소스 모델은 어떠한 방식으로든 완전히 수정할 수 있으며 제한 없이 사용할 수 있습니다. 가장 널리 사용되고 표준화된 오픈 소스 라이선스는 Apache 2.0 라이선스와 MIT 라이선스입니다. 다만 오픈 소스 모델의 개발자가 학습 데이터의 세부 정보를 제공하지 않는 한, 해당 모델은 완전히 재현 가능하다고 볼 수는 없습니다.

오픈 소스 공개는 LLM의 지속적인 발전과 개선에 필수적이며, 이러한 모델이 처음 등장할 수 있게 한 주요 요인입니다. 오픈 모델은 일반적으로 모델 개발자 또는 GitHub나 Hugging Face와 같은 대표적인 오픈 소스 플랫폼을 통해 액세스할 수 있습니다. 다음은 주목할 만한 오픈 모델 시리즈를 알파벳 순으로 정리한 목록입니다.

Cohere

Cohere는 “Attention is All You Need” 논문의 공동 저자 중 한 명이 창립자로 참여한 캐나다 기반 기업으로, 2019년에 설립되었습니다. 이 회사는 각 LLM에 대해 상세한 기술 보고서를 공개하고 이를 오픈 웨이트 모델로 제공하고 있지만, 실제로는 상업적 사용을 금지하는 Creative Commons 4.0 라이선스의 수정 버전으로 라이선스를 부여하고 있습니다.

Command

Command는 기업용 사용 사례를 위해 설계된 Cohere의 대표 파운데이션 모델 시리즈입니다.

  • Command R은 Cohere의 1세대 기업용 모델로, 2024년 3월 RAG와 툴 사용에 중점을 둔 350억 파라미터 모델로 출시되었습니다. 이후 다음 달에 1,040억 파라미터 변형인 Command R+이 출시되었습니다. 같은 해 12월에는 더 작은 모델인 Command R7B가 추가되었습니다.

  • Command A는 Cohere의 2세대 기업용 모델로, 비즈니스, STEM 및 코딩 작업에 초점을 맞춰 2025년 3월 출시되었습니다. 기존 1,110억 파라미터 모델은 이후 Command A Reasoning, Command A Translate(23개 언어에서 번역 성능을 최적화하도록 파인튜닝됨), 그리고 비전 인코더를 결합한 비전 언어 모델(VLM)인 Command A Vision 등 다양한 변형으로 출시되었습니다.

2026년 3월 Reddit 댓글에서 Cohere CEO Aidan Gomez는 회사가 Command의 차세대 모델을 적극적으로 개발 중이며, 이는 조직 최초의 전문가 혼합(MoE) 모델이 될 것이라고 밝혔습니다.

Aya

Aya는 다국어에 특화된 Cohere의 모델 시리즈로, 2024년 2월 Aya 101과 함께 처음 출시되었으며 이름 그대로 “101개 언어에서 지시를 따를 수 있는” 모델입니다.

  • Aya Vision은 멀티모달 다국어 VLM으로, 8B 및 32B 변형으로 제공되며 23개 언어를 지원합니다.
  • Tiny Aya, 2026년 2월에 출시된 33.5억 파라미터 규모의 경량 다국어 모델 시리즈입니다. Tiny Aya-Base는 70개 이상의 언어를 지원하는 사전 학습 모델입니다. TinyAya-Global지시 기반 파인튜닝이 적용된 모델로, 67개 언어를 지원합니다.

  • Tiny Aya 출시에는 지역별 특화 모델도 포함되었습니다. TinyAya-Earth는 아프리카 및 서아시아 언어에 최적화되어 있으며; TinyAya-Fire는 남아시아 언어에 최적화되어 있으며; TinyAya-Water는 아시아 태평양 및 유럽 언어에 최적화되어 있습니다.

DeepSeek

DeepSeek는 오픈 소스 에코시스템에서 핵심적인 역할을 하는 기업으로, LLM 아키텍처와 학습 과정에 다양한 혁신을 기여하고 있습니다. 때로는 이들의 모델 성능이 최상위 클로즈드 모델과 경쟁할 수준에 이르기도 했습니다. 이들의 LLM은 가중치와 코드 모두 표준 MIT 라이선스 하에 오픈 소스로 공개되어 있습니다. DeepSeek는 또한 연구 결과와 기술을 상세히 설명하는 기술 논문을 자주 공개합니다.

  • DeepSeek-V3는 총 6,710억 파라미터(추론 시 활성 파라미터 370억)를 가진 대형 MoE 모델로, 2024년 말 처음 출시되었습니다. 이 모델은 전문가 혼합 아키텍처를 다시 주류로 부상시키는 데 기여한 것으로 평가됩니다.

  • DeepSeek-R1은 당시 새로운 강화학습 기법을 사용해 DeepSeek-V3를 파인튜닝하여 구축된 추론 모델입니다. DeepSeek-R1은 오픈 소스 LLM 역사에서 중요한 이정표가 된 모델입니다. 이 모델은 OpenAI의 당시 독보적이었던 o1 모델과 경쟁할 만큼의 성능을 보였을 뿐만 아니라, DeepSeek의 학습 방법론을 상세히 설명한 기술 논문도 함께 제공했습니다. 이 모델의 출시는 1세대 오픈 추론 모델 개발에 직접적인 영향을 미쳤습니다.

  • 2025년 8월 출시된 DeepSeek-V3.1은 표준 추론과 CoT 추론을 모두 수행하도록 설정할 수 있는 하이브리드 추론 모델입니다. 본질적으로 DeepSeek-V3와 DeepSeek-R1을 하나의 모델로 통합한 형태입니다. 이 모델은 2025년 10월 DeepSeek-V3.2로 최신 업데이트되었습니다. DeepSeek-V3.1과 DeepSeek-V3.2 모두 원래 모델의 671B-37B MoE 아키텍처를 유지합니다.

  • DeepSeek는 또한 지식 증류를 통해 더 작은 Qwen 및 Llama 모델을 파인튜닝하여 DeepSeek-R1을 모방한 여러 “DeepSeek-R1-Distill” 모델을 출시했습니다.

DeepSeek-V4(또는 “DeepSeek-R2”) 출시가 임박했다는 소문이 있었지만, 아직 실제로 공개되지는 않았습니다.

Falcon(TII)

Falcon LLM 시리즈는 UAE의 Technology Innovation Institute(TTI)에서 개발되었습니다. TII의 2023년 1세대 모델은 당시 가장 큰 오픈 소스 모델 중 하나였던 Falcon-180B로 주목받았지만, 이후에는 더 작은 모델에 집중하고 있습니다. Falcon2는 110억 파라미터를 가졌으며, TII의 첫 멀티모달 모델인 Falcon3(2024년 12월 출시)은 10억에서 100억 파라미터 범위로 제공되었습니다.

최근 Falcon 모델 세대는 하이브리드 Mamba-트랜스포머 모델에 집중하고 있습니다.

  • 2025년 5월 출시된 Falcon-H1은 0.5B, 1.5B, 3B, 7B, 34B 변형으로 제공되는 사전 학습 및 지시 기반 파인튜닝 하이브리드 모델로 구성됩니다. 2026년 1월 출시된 Falcon-H1R은 Falcon-H1-7B의 추론 특화 변형입니다.

  • Falcon-H1-Tiny는 이름 그대로 Falcon-H1의 초소형 변형으로, 9천만, 1억, 6억 파라미터 규모로 제공됩니다. 각 크기는 기본 모델과 특정 사용 사례에 맞게 파인튜닝된 특화 모델로 모두 제공됩니다.

  • Falcon-Edge 모델은 10억 및 30억 파라미터 규모로 제공되는 실험적 1비트(“BitNet”) LLM 계열입니다.

Falcon 모델은 Apache 2.0 프레임워크에서 영감을 받았지만 중요한 조건과 제약을 추가한 독점 Falcon 라이선스 하에 공개됩니다.

Gemma(Google)

Gemma는 Google의 오픈 모델 계열입니다. Google에 따르면 Gemma 모델은 “자사의 Gemini 모델을 구동하는 동일한 기술을 기반으로 구축되었습니다.”7

  • 2025년 3월 출시된 Gemma 3는 Gemma 핵심 LLM의 최신 세대입니다. 초기 Gemma 출시에는 10억, 40억, 120억, 270억 파라미터 규모의 사전 학습 모델과 지시 기반 파인튜닝 모델이 모두 포함되었습니다. 2025년 8월 Google은 2억 7천만 파라미터 규모의 더 작은 변형을 추가했습니다. Gemma 3 모델은 텍스트 또는 이미지 입력을 처리할 수 있으며, 140개 이상의 언어를 지원하는 다국어 기능을 제공합니다.
  • 2025년 7월 출시된 Gemma 3n은 하나의 대형 모델 내에 다양한 크기의 소형 맞춤 모델을 “중첩”할 수 있도록 하는 실험적 MatFormer 아키텍처를 특징으로 합니다. 이 아키텍처 이름은 “마트료시카”라고도 불리는 러시아 전통 중첩 인형에서 유래했으며, 그래서 MatFormer라는 이름이 붙었습니다. Gemma 3n은 명목상 20억 및 40억 파라미터 규모로 제공되며 텍스트, 이미지, 비디오 또는 오디오 입력을 지원하지만 출력은 텍스트만 가능합니다.

  • FunctionGemma는 툴 사용(또는 “함수 호출”)에 최적화되도록 파인튜닝된 Gemma 3 2억 7천만 모델의 변형입니다.

Gemma 모델은 Gemma 라이선스 하에 공개되며, 사용 조건은 Apache 2.0 라이선스와 유사하지만 Gemma 금지 사용 정책의 적용을 받습니다.

GLM(Z.ai)

GLM은 베이징 기반 Z.ai(Zhipu AI라고도 함)가 개발한 LLM 계열로, 최첨단 성능을 목표로 합니다. 이 회사는 2025년 7월 말 출시된 GLM-4.5로 돌파구를 마련했으며, 초기 출시 당시 학술 벤치마크 전반에서 DeepSeek 및 Qwen의 대표 모델을 포함한 세계 최고 수준의 오픈 모델과 경쟁하는 성능을 보였습니다.

  • GLM-4.5는 두 가지 모델 크기로 제공되었습니다. 하나는 총 3550억 개의 파라미터(활성 320억)를 가진 대규모 MoE 기반 플래그십 LLM이며, 다른 하나는 더 작은 GLM-4.5-Air (총 1060억 개의 파라미터, 활성 120억)입니다. GLM-4.5V 는 GLM-4.5-Air 파운데이션 모델을 기반으로 구축된 VLM으로, 컴퓨터 비전과 동영상 이해 기능을 추가로 제공합니다.

  • GLM-4.6, 2025년 9월 30일에 출시된 GLM-4.5의 업데이트 버전으로, 더 작은 텍스트 전용 변형은 포함하지 않았습니다. 그러나 12월 초, 해당 회사는 GLM-4.6V(GLM-4.5V의 업데이트 버전)와 9B 밀집형 모델인 GLM-4.6V-Flash를 출시했습니다.

  • GLM-4.7, 2025년 12월 말에 출시된 플래그십 텍스트 전용 모델의 업데이트로, 총 30B 파라미터(활성 3B)만을 가진 훨씬 작은 LLM인 GLM-4.7-Flash가 추가되었습니다.

  • GLM-5, 2026년 2월에 출시된 모델로, 이전 모델보다 훨씬 큰 규모를 갖추고 있으며, 총 744B 파라미터(활성 40B)를 보유하고 있습니다.

Granite(IBM)

IBM® Granite는 기업용 사용 사례에 최적화된 오픈 소스 LLM 시리즈로, 주로 소형이면서 실용적이고 효율적인 모델에 중점을 둡니다. Granite는 2023년 9월 처음 출시되었으며, 2024년 10월 Granite 3.0 출시를 계기로 동일한 크기의 주요 오픈 모델과 경쟁할 수준의 성능을 달성하며 주목받게 되었습니다.

2025년 10월 출시된 Granite 4는 기존 트랜스포머 모델 대비 특히 대규모 워크로드에서 뛰어난 속도와 메모리 효율성을 제공하는 새로운 하이브리드 Mamba2-Transformer 아키텍처를 도입했습니다.

  • Granite 4-H Small은 총 32B 파라미터(활성 9B)를 가진 하이브리드 MoE 모델입니다. Granite 4에는 총 7B 파라미터(활성 1B)를 가진 또 다른 하이브리드 MoE 모델인 Granite 4-H Tiny와, 활성 3B 파라미터를 가진 밀집형 하이브리드 모델 Granite 4-H Micro도 포함됩니다.

  • Granite 4 Micro는 4-H 모델과 달리 기존 트랜스포머 아키텍처를 기반으로 구축된 3B 밀집형 모델입니다.

  • Granite 4 Nano는 3억 5천만부터 10억 파라미터까지 다양한 크기로 제공되는 하이브리드 Mamba-트랜스포머 및 기존 트랜스포머 모델 시리즈입니다.

  • Granite 4 1B-Speech는 자동 음성 인식(ASR) 및 양방향 자동 음성 번역(AST)을 위해 설계된 음성-텍스트 변환 모델입니다.

모든 Granite 모델은 표준 Apache 2.0 라이선스 하에 오픈 소스로 공개되며, 기업 환경에 안전한 데이터로 학습되었습니다. 2025년 10월 Granite 시리즈는 ISO-42001 인증을 획득한 최초의 주요 오픈 모델 계열이 되었습니다.

GPT-OSS(OpenAI)

GPT-OSS는 OpenAI의 오픈 웨이트 언어 모델로, 2025년 8월 표준 Apache 2.0 라이선스 하에 출시되었습니다. 이는 2019년 GPT-2 출시 이후 OpenAI가 처음으로 공개한 오픈 LLM입니다.

  • GPT-OSS-120B는 총 117B 파라미터(활성 5.1B)를 가진 MoE 모델로, 범용 사용과 고급 추론이 필요한 작업에 적합하도록 설계되었습니다.

  • GPT-OSS-20B는 총 21B 파라미터(활성 3.6B)를 가진 MoE 모델로, 낮은 지연 시간과 로컬 배포를 목적으로 설계되었습니다.

두 GPT-OSS 모델은 모델 가중치에 4비트 양자화를 적용해 학습되었으며, 이는 유사한 크기의 기존 모델 대비 속도를 크게 향상시키고 메모리 요구 사항을 줄였습니다.

Kimi(Moonshot AI)

Kimi는 베이징 기반 Moonshot AI가 개발한 오픈 모델 시리즈입니다.

  • Kimi-K2는 총 1조 파라미터(활성 32B)를 가진 텍스트 전용 대형 MoE 모델입니다. 이 모델은 2025년 7월 출시 당시 주요 코딩 벤치마크에서 GPT-4.1 및 Claude Opus 4 모델과 경쟁하거나 때로는 능가하며 큰 주목을 받았습니다.

  • Kimi-K2 Thinking은 Kimi-K2의 추론 모델 변형으로, 까다로운 에이전틱 AI 벤치마크에서 최상위 클로즈드 모델과 다시 한번 경쟁하며 큰 반향을 일으켰습니다.

  • Kimi-K2.5는 Kimi-K2의 업데이트 버전으로, 멀티모달 비전 기능을 추가했습니다. 이 모델은 다양한 “모드”로 운영할 수 있으며, 각 모드는 특정 사용 사례에 맞게 최적화되어 있습니다.

Kimi 모델은 수정된 MIT 라이선스 하에 공개되며, 월간 활성 사용자 1억 명 이상 또는 월 매출 USD 20M 이상인 제품의 경우 “사용자 인터페이스에 ‘Kimi K2’를 명확하게 표시”해야 합니다.

Llama(Meta)

Meta의 Llama 모델(원래 표기는 LLaMA, “Large Language model Meta AI”의 약어)은 오픈 LLM 역사에서 중요한 역할을 해왔습니다. 초기 Llama 모델은 LLM 개발 방식을 대중화하는 데 기여했으며, 학습 방식부터 아키텍처와 크기 설계에 이르기까지 다양한 표준 개발 관행에 큰 영향을 미쳤습니다.

  • 2023년 7월 출시된 Llama 2는 7B, 13B, 70B 크기로 제공되었습니다.

  • 2024년 4월 8B와 70B 크기로 출시된 Llama 3는 학술 벤치마크 전반에서 여러 주요 클로즈드 모델과 경쟁했습니다. 같은 해 7월 Llama 3.1은 컨텍스트 길이를 크게 확장하고 당시로서는 전례 없는 405B 규모의 변형을 추가했습니다. Llama 3.2는 더 작은 변형과 비전 기능을 추가했으며, Llama 3.3은 단일 70B 모델로 Llama 3.1 405B에 필적하는 성능을 보여주었습니다.

  • Llama 4는 출시 시 두 개의 대규모 멀티모달 MoE 모델을 선보였습니다. 총 4,000억 개 매개변수(활성 170억 개)의 Llama 4 Maverick과 총 1,090억 개 매개변수(활성 190억 개)의 Llama 4 Scout입니다. 대부분의 벤치마크에서 이전 Llama 세대보다 성능이 크게 향상되었음에도 불구하고, Llama 3 모델은 여전히 Meta에서 가장 인기 있는 LLM으로 남아 있습니다(Hugging Face 다운로드 기준).10

Meta는 “오픈 소스”라는 용어를 자주 사용하지만, Llama 모델은 사용, 출처 표기 및 액세스에 제약을 두는 맞춤형 Llama 라이선스로 배포됩니다. 이에 대해 Open Source Initiative는 해당 용어 사용을 비판했습니다.

Minimax

상하이에 기반을 둔 MiniMax Group은 2025년 1월 자사의 첫 동명 LLM인 MiniMax-Text-01과 함께 VLM인 MiniMax-VL-01을 출시했습니다. 이후 MiniMax는 대규모 모델과 긴 컨텍스트 윈도우를 중시하며 중국 내 주요 LLM 개발사 중 하나로 부상했습니다.

  • 2025년 6월에 출시된 MiniMax-M1은 MiniMax-Text-01을 미세 조정하여 구축된 텍스트 전용 추론 모델입니다. 이전 모델과 마찬가지로, 총 4,560억 개 매개변수와 토큰당 459억 개의 활성 매개변수를 가진 대규모 MoE 모델입니다.
  • MiniMax-M2는 M1 대비 더 뛰어난 성능과 효율성을 제공합니다. 총 2,300억 개 매개변수를 보유하며, 토큰당 100억 개의 매개변수만 활성화하는 더 정밀한 MoE 아키텍처를 사용합니다. 2025년 10월에 출시되었으며, 두 달 후 MiniMax-M2.1로 업데이트되었습니다. MiniMax는 캐릭터 기반 롤플레이에 맞게 미세 조정된 MiniMax-M2-her도 제공합니다.

  • MiniMax-M2.5MiniMax-M2.5-Lightning은2026년 2월에 출시되었으며, 추가적인 성능 최적화를 통해 일부 코딩 벤치마크에서 Claude Opus 4.5와 견줄 만한 수준에 도달했습니다. 두 모델은 속도와 처리량을 제외하면 동일하며, “Lightning” 버전은 출력 생성 속도가 두 배 빠릅니다.

  • 2026년 3월에 출시된 MiniMax-M2.7은 MiniMax-M2.5의 업데이트 버전으로, 회사는 이 모델이 자체 학습을 지원했다고 주장합니다.11

MiniMax 모델은 수정된 MIT 라이선스로 제공됩니다.

Mistral AI

Mistral AI는 클로즈드 소스 제품과 함께 다양한 고평가된 오픈 모델도 제공합니다. Mistral의 오픈 모델 대부분(전부는 아님)은 표준 Apache 2.0 라이선스로 배포됩니다.

  • Mistral Large 3는 DeepSeek-V3에서 영감을 받은 MoE 아키텍처를 사용하며, 총 6,750억 개 매개변수(활성 410억 개)를 갖추고 있습니다. 벤치마크 성능은 DeepSeek-V3.1 및 Kimi-K2.1과 대체로 유사한 수준입니다.12 2025년 12월에 출시되었으며, 다국어 및 멀티모달을 지원해 텍스트와 이미지 입력을 모두 처리할 수 있습니다.

  • Ministral 3는 Mistral의 소형 모델 시리즈로, 30억, 80억, 140억 규모와 기본, 지시 튜닝, 추론 버전으로 제공됩니다.

  • Mistral Small 3.2는 2025년 6월에 출시된 240억 매개변수 LLM입니다. 성능은 보다 최근의 Ministral 3 14B와 유사한 수준입니다.

  • Devstral은 에이전틱 엔지니어링에 초점을 맞춘 Mistral의 모델 시리즈입니다. 2025년 12월에 출시된 Devstral 2는 두 개의 모델로 구성됩니다. Devstral 2 123B수정된 MIT 라이선스로 배포되며, 월 매출이 2,000만 달러를 초과하는 조직은 Mistral에 상업용 라이선스를 요청해야 합니다. Devstral Small 2 24B는 표준 Apache 2.0 라이선스로 배포됩니다.

  • 2023년 12월에 출시된 Mixtral은 언어 모델에서 mixture of experts 아키텍처를 대중화한 LLM입니다. 2026년 초 기준으로, 8x7B 변형 모델은 Hugging Face에서 월 70만 건 이상의 다운로드를 기록하며 여전히 높은 인기를 유지하고 있습니다.13

Nemotron(NVIDIA)

주요 하드웨어 제조업체인 NVIDIA의 오픈 LLM 시리즈는 성능, 연구 문헌, 아키텍처 혁신 측면에서 높은 평가를 받고 있습니다.

  • NVIDIA-Nemotron-Nano v2는 90억 및 120억 규모의 하이브리드 Mamba-2-LLM 모델 제품군으로, 추론과 일반 추론 작업을 모두 수행할 수 있습니다. 이 모델들은 2025년 8월에 맞춤형 NVIDIA Open Model License Agreement로 배포되었으며, 법적 책임, 사용 조건 및 NVIDIA의 향후 계약 수정 권한과 관련된 중요한 조건이 포함되어 있습니다.
  • 2025년 12월에 출시된 Nemotron 3 Nano는 두 개의 모델로 구성됩니다. Nemotron-3-Nano-4B와 총 300억 개 매개변수(활성 30억 개)를 가진 MoE 모델인 Nemotron-3-Nano-30B-A3B입니다. 이 모델들은 NVIDIA Nemotron Open Model License로 배포되었으며, 이 라이선스는 NVIDIA의 일방적인 향후 약관 변경 권한을 제외합니다.

  • Nemotron 3 Super는 총 1,200억 개 매개변수(활성 120억 개)를 가진 더 큰 MoE 모델로, 2026년 3월에 출시되었습니다.

Olmo(AllenAI)

Allen Institute for AI(Ai2)에서 개발한 Olmo는 오픈 소스 모델 중에서도 가장 “진정한 의미의 오픈”에 가까운 모델로, Ai2는 일반적으로 표준 Apache 2.0 라이선스와 함께 모든 코드, 가중치, 학습 체크포인트 및 관련 데이터 세트를 공개합니다.

  • 2025년 11월에 출시된 Olmo 3는 70억 및 320억 규모의 밀집형 트랜스포머 모델로 구성됩니다. 이 모델들은 기본형, 지시 튜닝형, 그리고 “think” 버전으로 제공됩니다. 2025년 12월에는 320억 모델이 Olmo 3.1로 업데이트되었습니다.
  • 2026년 3월에 출시된 Olmo Hybrid는 70억 규모 모델로, 트랜스포머와 선형 RNN을 결합한 실험적 하이브리드 아키텍처( Qwen에서 대중화된 Gated DeltaNet 기반)를 사용합니다.

Phi(Microsoft)

Phi는 Microsoft의 오픈 모델 라인으로, 역사적으로 소형 모델에 중점을 두고 있습니다. 이 모델들은 표준 MIT 라이선스로 배포됩니다.

  • Phi 4는 2024년 12월에 처음 출시된 140억 매개변수의 텍스트 전용 LLM입니다.

  • 2025년 2월에 출시된 Phi 4-mini는 더 작은 38억 매개변수 모델입니다.

  • Phi 4-multimodal은 Phi 4-mini와 함께 출시되었으며, 텍스트, 이미지 및 음성 입력을 지원합니다.

  • 2026년 3월에 출시된 Phi 4-Reasoning-Vision은 이미지, 텍스트 및 문서 전반에 걸친 통합적인 멀티모달 추론 기능을 추가한 150억 매개변수 모델입니다.

Qwen(Alibaba)

Alibaba에서 개발한 Qwen LLM 시리즈는 업계에서 가장 인기 있는 오픈 모델 중 하나로 자리 잡았습니다. 이 모델 제품군은 다양한 개발자 요구를 충족할 수 있도록 다양한 모델 크기, 아키텍처 및 기능을 제공합니다.

  • Qwen3는 6억, 17억, 40억, 80억, 140억, 320억 규모의 텍스트 전용 밀집형 트랜스포머 모델과 함께 300억-A3B 및 플래그십 모델인 Qwen3-235B-A22B와 같은 MoE 모델로 구성됩니다. 모든 Qwen3 모델은 기본형, 사고형, 지시 튜닝형으로 제공됩니다.

  • Qwen3-Next는 800억 매개변수(활성 30억 개)를 가진 실험적 텍스트 전용 MoE 모델로, 표준 어텐션을 Mamba-2에서 영감을 받은 Gated Delta NetworksGated Attention으로 대체합니다.

  • Qwen3-Omni는 Qwen3-30B-A3B 기반으로 구축된 네이티브 멀티모달 모델로, 텍스트, 이미지, 오디오 또는 비디오 입력과 텍스트 또는 음성 출력을 지원합니다.

  • Qwen3-Coder-Next는 코드 생성을 위해 미세 조정된 Qwen3-Next 버전입니다.

  • 2026년 2월에 출시된 Qwen3.5는 Qwen3-Next에서 처음 도입된 아키텍처를 활용한 멀티모달 모델 제품군입니다. 이 제품군은 8억, 20억, 40억, 90억, 270억 개 파라미터 규모의 기본 및 하이브리드 추론 모델과 함께, 총 350억 중 30억 활성(35B-A3B), 총 1,220억 중 100억 활성(122B-A10B), 그리고 플래그십 총 3,970억 중 170억 활성(397B-A17B) 규모의 MoE 모델을 포함합니다. Qwen3.5-397B-A17B는 최첨단 성능에서 Gemini, GPT, Claude와 같은 주요 모델과 경쟁하는 것을 목표로 합니다.

작성자

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

관련 솔루션
IBM Bob

안전한 의도 인식 개발을 지원하는 AI 파트너인 Bob으로 소프트웨어 제공을 가속화하세요.

IBM Bob 살펴보기
IBM® watsonx Orchestrate

IBM watsonx Orchestrate를 사용하여 확장 가능한 AI 어시스턴트 및 에이전트를 쉽게 설계하고, 반복적인 작업을 자동화하며, 복잡한 프로세스를 간소화합니다.

watsonx Orchestrate 살펴보기
인공 지능 솔루션

업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.

AI 솔루션 살펴보기
다음 단계 안내

개발 라이프사이클의 어느 단계에 있든 Bob은 의도를 이해하고 보안 요구사항에 부합하는 에이전틱 리뷰를 제공해 고품질 소프트웨어의 더 빠른 제공을 지원합니다.

  1. IBM Bob 알아보기
  2. watsonx Orchestrate 살펴보기