대규모 언어 모델(LLM)은 현대 인공지능 개발의 핵심 기반이 되었습니다. 이들은 단순한 챗봇 애플리케이션부터 에이전틱 엔지니어링 및 AI 에이전트가 구동하는 복잡한 자동화 워크플로에 이르기까지 생성형 AI 시대를 열었으며 현재 이를 정의하고 있습니다. 이들의 등장은 머신러닝 역사에서 근본적인 전환점을 의미합니다.
기술이 성숙함에 따라 새로운 LLM은 계속해서 증가하고 있습니다. 선도적인 AI 개발자, 신생 스타트업, 그리고 기존의 대형 기업 모두가 새로운 모델을 지속적으로 출시하고 개선하고 있습니다. 한편 오픈 소스 커뮤니티는 지속적으로 오픈 소스 LLM을 파인튜닝하고, 사용자 정의 데이터 세트를 기반으로 기존 모델을 병합 및 수정하여 끝없이 다양한 변형을 만들어내고 있습니다. 따라서 어떤 LLM 목록도 완전한 목록이 되기는 현실적으로 어렵고, 가장 “포괄적인” 목록조차 오래 유지되지는 않습니다.
다음은 현재 이용 가능한 가장 주목받고 성능이 뛰어난 LLM 중 일부를 정리한 목록입니다. 다음은 참고할 사항입니다.
실무적인 관점에서 LLM은 일반적으로 두 가지 범주로 나눌 수 있습니다. 하나는 모델 개발자를 통해서만 상업적으로 제공되는 클로즈드 소스 LLM이며, 다른 하나는 무료로 공개되는 오픈 모델입니다.
클로즈드 소스 모델 또는 독점 모델은 모델 개발자의 플랫폼, 해당 모델이 라이선스된 다른 플랫폼 또는 모델 제공자의 독점 API를 통해서만 직접 액세스할 수 있습니다.
클로즈드 모델 개발자는 일반적으로 기술 세부 사항을 엄격히 보호되는 영업 비밀로 취급하기 때문에, 모델의 규모, 신경망 아키텍처 또는 학습 과정과 같은 구체적인 사항을 정확히 알기는 어렵습니다. 일부 세부 사항은 추론할 수 있습니다. 예를 들어 클로즈드 모델의 추론 속도, GPU 메모리 사용량, 벤치마크 성능을 공개된 정보를 가진 오픈 모델과 비교함으로써 유추할 수 있지만, 실제로 확인되는 경우는 거의 없습니다.
적어도 2022년경 이후로 특정 시점의 최첨단 프런티어 모델 대부분은 폐쇄형 모델이었지만, 이는 폐쇄형 모델이 오픈 모델보다 본질적으로 우수해서라기보다는 업계의 실제 역사적 상황을 반영한 결과입니다. 다음은 알파벳 순으로 정리한 대표적인 폐쇄형 모델 시리즈입니다.
Anthropic의 Claude 언어 모델은 세계에서 가장 뛰어난 성능을 가진 모델 중 하나입니다. Anthropic은 2021년 전 OpenAI 직원들이 설립한 AI 안전성 연구소로 출발했으며, 모델 개발 접근 방식은 헌법 기반 AI라는 독특한 개념을 중심으로 구축되어 있습니다.Claude의 “헌법”은 Anthropic 직원의 행동을 안내할 뿐만 아니라, Claude 모델 자체의 행동(및 합성 학습 데이터 생성)까지 규정하는 문서입니다.
Claude 3 이후로 Claude의 각 세대는 세 가지 크기의 멀티모달 모델로 제공되고 있습니다.
Claude Haiku, Sonnet, Opus는 모두 텍스트, 오디오, 이미지 입력을 처리할 수 있으며 텍스트 또는 오디오(텍스트 음성 변환 형태)로 출력할 수 있습니다. 과거에는 대부분의 클로즈드 모델 경쟁사와 달리 이들(및 이를 기반으로 하는 Claude 플랫폼)은 이미지 생성 기능을 제공하지 않았지만, 2026년 3월 12일 기준으로 Claude는 이제 이미지를 생성할 수 있습니다. Claude API를 통해 모델에 액세스할 경우, Sonnet 또는 Opus의 추론 과정에 대한 “노력 수준”을 “max”, “high”, “medium”, “low” 또는 “adaptive”로 설정할 수 있습니다.
Gemini는 Google의 자회사인 Google DeepMind가 개발한 클로즈드 언어 모델 시리즈로, 2023년 12월에 처음 출시되었습니다. Google Brain(2023년에 DeepMind와 합병되어 Google DeepMind를 형성)은 최초의 LLM을 가능하게 한 트랜스포머 모델 아키텍처를 개발했으며, 2017년에 기념비적인 “Attention is All You Need” 논문을 발표했다는 점도 주목할 만합니다.
2025년 초 이후 Google은 각 Gemini 모델 세대를 세 가지 크기로 출시했으며, 모두 추론 모델입니다. Gemini API를 통해 접근할 경우 사용자는 여러 “사고 수준” 중 하나를 선택하여 최종 출력을 생성하기 전에 모델이 사용할 토큰 수와 시간을 조정할 수 있습니다.
Gemini Pro, Flash, Flash-Lite 모델은 기본적으로 멀티모달로, 텍스트, 오디오, 이미지 또는 비디오 입력을 처리하고 텍스트 출력을 생성할 수 있습니다. Gemini 플랫폼을 통해 접근할 경우 멀티모달 출력은 이미지 생성, 동영상 생성 또는 음악 생성을 위한 별도의 특화 모델을 통해 생성할 수 있습니다.
2025년 3월 Gemini 2.5 Pro가 대부분의 학술 벤치마크에서 당시 업계 최고 성능을 달성하며 출시된 이후, Gemini 모델은 Claude 및 OpenAI의 GPT 시리즈와 함께 세계에서 가장 높은 성능을 보이는 LLM으로 경쟁하고 있습니다. 일반적으로 세 가지 시리즈 중 하나에서 새로운 프런티어 모델이 출시될 때마다 “최고” 모델의 지위는 바뀝니다.
Grok은 xAI가 개발한 독점 LLM 계열로, 2023년 11월 X(구 Twitter)에서 챗봇 형태의 베타 프리뷰로 처음 출시되었습니다. 2025년 4월 xAI는 당시 최신 플래그십 모델이었던 Grok 3에 대한 API 액세스를 출시했습니다.
Grok의 모델 라인업은 세대별 모델 출시를 거치며 지속적으로 변화해 왔습니다.
Grok 4 기준으로 Grok 모델은 텍스트, 이미지 및 음성 입력을 처리할 수 있습니다. Grok LLM은 멀티모달 출력을 제공하지 않지만, 이미지 및 동영상 출력은 Grok Imagine 플랫폼을 통해 xAI의 Aurora 모델로 생성할 수 있습니다.
성능과는 별개로 Grok의 역사(특히 Grok 챗봇)는 선거 관련 허위 정보 확산, 관련 없는 대화에 분열을 조장하는 관점 삽입, 유해한 고정관념 강화와 같은 논란으로 점철되어 왔습니다.
공식 발언에서 xAI CEO Elon Musk는 “우리의 일반적인 접근 방식은 다음 버전이 완전히 출시되면 이전 버전을 오픈 소스로 공개하는 것”이라고 밝혔습니다.1
xAI는 2024년 3월 Apache 2.0 라이선스로 Grok 1을 오픈 소스로 공개했습니다. Grok 3는 2025년 2월에 출시되었지만, 다음 Grok 모델의 오픈 소스 공개는 2025년 8월까지 이루어지지 않았습니다. 혼란스럽게도 xAI(및 Musk)는 “Grok 2.5”를 오픈 소스로 공개했다고 발표했지만, 2 그 이전에는 해당 이름의 모델이 명명되거나 발표된 적이 없었습니다. 모델의 Hugging Face 모델 카드에서도 해당 모델을 “Grok-2”로 표기하고 있습니다.
2025년 8월 발표에서 Musk는 Grok 3 역시 “약 6개월 내” 오픈 소스로 공개될 것이라고 밝혔습니다. 그러나 8개월이 지난 시점에서도 해당 오픈 소스 공개 일정은 아직 발표되지 않았습니다.
OpenAI의 GPT 시리즈(Generative Pretrained Transformer의 약어)는 특히 2022년 GPT-3.5 모델 기반 ChatGPT 출시 이후 현재의 생성형 AI 시대를 여는 데 크게 기여한 것으로 평가됩니다.
OpenAI의 모델 명명 및 변형 규칙은 2022년 이후 크게 변화했으며, 때로는 혼란스럽게 느껴질 수 있습니다. 예를 들어 GPT-4.1은 GPT-4.5 이후에 출시되었고, o4 추론 모델은 멀티모달 비추론 모델인 GPT-4o와 동시에 제공되었으며, 이는 “o4” 추론 모델과 완전히 별개의 모델로 성능 또한 “o3”보다 낮았습니다. 2025년 초 OpenAI CEO Sam Altman은 “우리의 모델 및 제품 구성이 얼마나 복잡해졌는지 인지하고 있습니다.”라고 인정했습니다.
2025년 8월 GPT-5 출시 이후, 회사의 통합 LLM 제품 구성은 다음과 같습니다.
OpenAI는 또한 2개의 오픈 웨이트 GPT 모델을 출시했으며, 이에 대한 자세한 내용은 이 글의 “오픈 모델” 섹션에서 확인할 수 있습니다.
Mistral AI는 Meta AI와 Google DeepMind 출신 인력들이 설립한 프랑스 기반 기업으로, 2023년 9월 첫 모델(Mistral 7B) 출시 당시에는 전적으로 오픈 소스 모델에 집중했습니다. 이후 Mistral은 일부 프런티어 모델은 클로즈드 소스로 유지하면서, 많은 모델을 오픈 형태로 공개하는 혼합 전략으로 전환했습니다.
2026년 3월 기준 Mistral AI의 대표 독점 LLM은 다음과 같습니다.
Mistral의 오픈 웨이트 모델에 대한 자세한 내용은 이 글의 후반부에서 다룹니다.
머신러닝에서 오픈 소스는 종종 소스 코드가 무료로 공개된 AI 툴을 지칭하는 용어로 사용되지만, 실제로는 Open Source Initiative(OSI)가 관리하는 공식적인 정의입니다. OSI는 특정 소프트웨어 라이선스가 공식 오픈 소스 정의(OSD)에 명시된 10가지 요건을 충족한다고 판단하는 경우에만 “Open Source Initiative 승인”으로 인증합니다.
대부분의 “오픈 소스” 모델은 이러한 모든 요건을 충족하지 않습니다. 이러한 이유로 오픈 모델(또는 오픈 웨이트 모델)이라는 용어가 자유롭게 배포되는 LLM을 보다 정확하게 지칭합니다. 오픈 모델의 범주 내에는 매우 다양한 형태가 존재합니다. 오픈 웨이트(그러나 오픈 소스는 아닌) 모델은 추론 실행 및 파인튜닝이 가능하지만, 전체 소스 코드가 제공되지 않는 경우 가중치 값 변경 이상의 수정은 불가능합니다. 해당 모델의 라이선스는 일부 사용 시나리오(예: 상업적 환경)에서의 사용을 제한하거나 특정 조건을 부과할 수 있습니다.
반대로 학습 코드와 학습 절차 설명이 함께 공개된 진정한 오픈 소스 모델은 어떠한 방식으로든 완전히 수정할 수 있으며 제한 없이 사용할 수 있습니다. 가장 널리 사용되고 표준화된 오픈 소스 라이선스는 Apache 2.0 라이선스와 MIT 라이선스입니다. 다만 오픈 소스 모델의 개발자가 학습 데이터의 세부 정보를 제공하지 않는 한, 해당 모델은 완전히 재현 가능하다고 볼 수는 없습니다.
오픈 소스 공개는 LLM의 지속적인 발전과 개선에 필수적이며, 이러한 모델이 처음 등장할 수 있게 한 주요 요인입니다. 오픈 모델은 일반적으로 모델 개발자 또는 GitHub나 Hugging Face와 같은 대표적인 오픈 소스 플랫폼을 통해 액세스할 수 있습니다. 다음은 주목할 만한 오픈 모델 시리즈를 알파벳 순으로 정리한 목록입니다.
Cohere는 “Attention is All You Need” 논문의 공동 저자 중 한 명이 창립자로 참여한 캐나다 기반 기업으로, 2019년에 설립되었습니다. 이 회사는 각 LLM에 대해 상세한 기술 보고서를 공개하고 이를 오픈 웨이트 모델로 제공하고 있지만, 실제로는 상업적 사용을 금지하는 Creative Commons 4.0 라이선스의 수정 버전으로 라이선스를 부여하고 있습니다.
Command는 기업용 사용 사례를 위해 설계된 Cohere의 대표 파운데이션 모델 시리즈입니다.
2026년 3월 Reddit 댓글에서 Cohere CEO Aidan Gomez는 회사가 Command의 차세대 모델을 적극적으로 개발 중이며, 이는 조직 최초의 전문가 혼합(MoE) 모델이 될 것이라고 밝혔습니다.
Aya는 다국어에 특화된 Cohere의 모델 시리즈로, 2024년 2월 Aya 101과 함께 처음 출시되었으며 이름 그대로 “101개 언어에서 지시를 따를 수 있는” 모델입니다.
DeepSeek는 오픈 소스 에코시스템에서 핵심적인 역할을 하는 기업으로, LLM 아키텍처와 학습 과정에 다양한 혁신을 기여하고 있습니다. 때로는 이들의 모델 성능이 최상위 클로즈드 모델과 경쟁할 수준에 이르기도 했습니다. 이들의 LLM은 가중치와 코드 모두 표준 MIT 라이선스 하에 오픈 소스로 공개되어 있습니다. DeepSeek는 또한 연구 결과와 기술을 상세히 설명하는 기술 논문을 자주 공개합니다.
DeepSeek-V4(또는 “DeepSeek-R2”) 출시가 임박했다는 소문이 있었지만, 아직 실제로 공개되지는 않았습니다.
Falcon LLM 시리즈는 UAE의 Technology Innovation Institute(TTI)에서 개발되었습니다. TII의 2023년 1세대 모델은 당시 가장 큰 오픈 소스 모델 중 하나였던 Falcon-180B로 주목받았지만, 이후에는 더 작은 모델에 집중하고 있습니다. Falcon2는 110억 파라미터를 가졌으며, TII의 첫 멀티모달 모델인 Falcon3(2024년 12월 출시)은 10억에서 100억 파라미터 범위로 제공되었습니다.
최근 Falcon 모델 세대는 하이브리드 Mamba-트랜스포머 모델에 집중하고 있습니다.
Falcon 모델은 Apache 2.0 프레임워크에서 영감을 받았지만 중요한 조건과 제약을 추가한 독점 Falcon 라이선스 하에 공개됩니다.
Gemma는 Google의 오픈 모델 계열입니다. Google에 따르면 Gemma 모델은 “자사의 Gemini 모델을 구동하는 동일한 기술을 기반으로 구축되었습니다.”7
Gemma 모델은 Gemma 라이선스 하에 공개되며, 사용 조건은 Apache 2.0 라이선스와 유사하지만 Gemma 금지 사용 정책의 적용을 받습니다.
GLM은 베이징 기반 Z.ai(Zhipu AI라고도 함)가 개발한 LLM 계열로, 최첨단 성능을 목표로 합니다. 이 회사는 2025년 7월 말 출시된 GLM-4.5로 돌파구를 마련했으며, 초기 출시 당시 학술 벤치마크 전반에서 DeepSeek 및 Qwen의 대표 모델을 포함한 세계 최고 수준의 오픈 모델과 경쟁하는 성능을 보였습니다.
IBM® Granite는 기업용 사용 사례에 최적화된 오픈 소스 LLM 시리즈로, 주로 소형이면서 실용적이고 효율적인 모델에 중점을 둡니다. Granite는 2023년 9월 처음 출시되었으며, 2024년 10월 Granite 3.0 출시를 계기로 동일한 크기의 주요 오픈 모델과 경쟁할 수준의 성능을 달성하며 주목받게 되었습니다.
2025년 10월 출시된 Granite 4는 기존 트랜스포머 모델 대비 특히 대규모 워크로드에서 뛰어난 속도와 메모리 효율성을 제공하는 새로운 하이브리드 Mamba2-Transformer 아키텍처를 도입했습니다.
모든 Granite 모델은 표준 Apache 2.0 라이선스 하에 오픈 소스로 공개되며, 기업 환경에 안전한 데이터로 학습되었습니다. 2025년 10월 Granite 시리즈는 ISO-42001 인증을 획득한 최초의 주요 오픈 모델 계열이 되었습니다.
GPT-OSS는 OpenAI의 오픈 웨이트 언어 모델로, 2025년 8월 표준 Apache 2.0 라이선스 하에 출시되었습니다. 이는 2019년 GPT-2 출시 이후 OpenAI가 처음으로 공개한 오픈 LLM입니다.
두 GPT-OSS 모델은 모델 가중치에 4비트 양자화를 적용해 학습되었으며, 이는 유사한 크기의 기존 모델 대비 속도를 크게 향상시키고 메모리 요구 사항을 줄였습니다.
Kimi는 베이징 기반 Moonshot AI가 개발한 오픈 모델 시리즈입니다.
Kimi 모델은 수정된 MIT 라이선스 하에 공개되며, 월간 활성 사용자 1억 명 이상 또는 월 매출 USD 20M 이상인 제품의 경우 “사용자 인터페이스에 ‘Kimi K2’를 명확하게 표시”해야 합니다.
Meta의 Llama 모델(원래 표기는 LLaMA, “Large Language model Meta AI”의 약어)은 오픈 LLM 역사에서 중요한 역할을 해왔습니다. 초기 Llama 모델은 LLM 개발 방식을 대중화하는 데 기여했으며, 학습 방식부터 아키텍처와 크기 설계에 이르기까지 다양한 표준 개발 관행에 큰 영향을 미쳤습니다.
Meta는 “오픈 소스”라는 용어를 자주 사용하지만, Llama 모델은 사용, 출처 표기 및 액세스에 제약을 두는 맞춤형 Llama 라이선스로 배포됩니다. 이에 대해 Open Source Initiative는 해당 용어 사용을 비판했습니다.
상하이에 기반을 둔 MiniMax Group은 2025년 1월 자사의 첫 동명 LLM인 MiniMax-Text-01과 함께 VLM인 MiniMax-VL-01을 출시했습니다. 이후 MiniMax는 대규모 모델과 긴 컨텍스트 윈도우를 중시하며 중국 내 주요 LLM 개발사 중 하나로 부상했습니다.
MiniMax 모델은 수정된 MIT 라이선스로 제공됩니다.
Mistral AI는 클로즈드 소스 제품과 함께 다양한 고평가된 오픈 모델도 제공합니다. Mistral의 오픈 모델 대부분(전부는 아님)은 표준 Apache 2.0 라이선스로 배포됩니다.
주요 하드웨어 제조업체인 NVIDIA의 오픈 LLM 시리즈는 성능, 연구 문헌, 아키텍처 혁신 측면에서 높은 평가를 받고 있습니다.
Allen Institute for AI(Ai2)에서 개발한 Olmo는 오픈 소스 모델 중에서도 가장 “진정한 의미의 오픈”에 가까운 모델로, Ai2는 일반적으로 표준 Apache 2.0 라이선스와 함께 모든 코드, 가중치, 학습 체크포인트 및 관련 데이터 세트를 공개합니다.
Phi는 Microsoft의 오픈 모델 라인으로, 역사적으로 소형 모델에 중점을 두고 있습니다. 이 모델들은 표준 MIT 라이선스로 배포됩니다.
Alibaba에서 개발한 Qwen LLM 시리즈는 업계에서 가장 인기 있는 오픈 모델 중 하나로 자리 잡았습니다. 이 모델 제품군은 다양한 개발자 요구를 충족할 수 있도록 다양한 모델 크기, 아키텍처 및 기능을 제공합니다.
안전한 의도 인식 개발을 지원하는 AI 파트너인 Bob으로 소프트웨어 제공을 가속화하세요.
IBM watsonx Orchestrate를 사용하여 확장 가능한 AI 어시스턴트 및 에이전트를 쉽게 설계하고, 반복적인 작업을 자동화하며, 복잡한 프로세스를 간소화합니다.
업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.
“Elon Musk, 선거 허위 정보 확산을 막기 위해 Grok AI 봇 통제” The Register, 2024년 8월 28일
“Musk의 xAI 챗봇 Grok, 남아프리카 ‘백인 집단학살’ 관련 응답을 무작위로 반복” CNBC, 2025년 5월 14일
“Elon Musk의 AI 챗봇 Grok, 스스로를 ‘MechaHitler’라고 부르기 시작” NPR, 2025년 7월 9일
@MarioNawfal 트윗, X(구 Twitter), 2025년 2월 18일
“GPT-5.4 pro”, OpenAI, 2026년 3월 12일 API 문서 기준
“Codestral 25.08 및 기업용 Mistral 코딩 스택 전체 발표” Mistral AI, 2025년 7월 30일
Gemma, Google DeepMind, 2026년 3월 12일 기준
“Alibaba 지원 Moonshot, 코딩에서 ChatGPT와 Claude를 능가하면서 비용은 더 낮은 새로운 Kimi AI 모델 출시” CNBC, 2025년 7월 14일
“Kimi K2 Thinking에 대한 5가지 생각” Interconnects, 2025년 11월 6일
10. Meta Llama: 모델 페이지(“Most Downloads” 기준 정렬), Hugging Face, 2026년 3월 11일 기준
“MiniMax M2.7: 자기 진화의 초기 신호” MiniMax, 2026년 3월 18일
“Mistral 3 소개” Mistral AI, 2025년 12월 2일
13. Mistral AI: 모델 페이지(“Most Downloads” 기준 정렬), Hugging Face, 2026년 3월 11일 기준