2025년 8월 7일
OpenAI는 개발자와 기업이 자유롭게 다운로드, 실행 및 사용자 정의할 수 있도록 두 가지 인공 지능 모델을 대중에게 공개했습니다. 모델 중 하나는 지금 IBM의 watsonx.ai 개발자 스튜디오에서 호스팅됩니다.
OpenAI가 이러한 움직임을 보인 것은 2019년 이후 처음입니다. 지난 5년 동안 이 회사는 엄격하게 제어되는 인터페이스를 통해 GPT-4, GPT-4o, o3 및 o4-mini 추론 모델과 같은 가장 강력한 모델을 제공하는 데 거의 전적으로 집중해 왔습니다. 이 최신 릴리스는 한 쌍의 유능한 모델을 사용자에게 직접 제공하여 상업적 사용에 대한 제한 없이 로컬 또는 자체 인프라에서 실행할 수 있습니다.
두 모델 중 더 규모가 큰 gpt-oss-120b는 현재 IBM의 watsonx.ai 플랫폼에서 사용할 수 있습니다. IBM은 이 모델을 엔터프라이즈 인프라 내에 안전하게 배포하고, 내부 데이터를 사용하여 맞춤화하고, 의료, 금융 서비스 및 법률 지원과 같은 산업의 실제 워크플로에서 사용할 수 있다고 말했습니다. 두 번째 모델인 gpt-oss-20b도 곧 플랫폼에 추가될 예정입니다. 개발팀은 곧 watsonx Orchestrate™ 내에서 에이전트를 구축할 때 watsonx.ai®에서 이러한 모델을 활용할 수 있습니다.
IBM watsonx.ai 는기업이 통합 개발 플랫폼에서 AI 애플리케이션을 개발하고 배포하고 확장할 수 있도록 지원합니다. 또한 파운데이션 모델을 사용자 지정하고, 다양한 사전 구축되고 사용자 지정된 오픈 소스 도구에 액세스하고, 주요 프레임워크를 활용하고, 클라우드 및 온프레미스용 하이브리드 배포 옵션을 활용할 수 있는 유연성과 선택권을 개발자에게 제공하여 신속한 실험을 가능하게 하고 비즈니스 가치 실현 시간을 단축합니다. 이를 통해 파운데이션 모델을 사용자 지정하고, 다양한 사용자 지정 오픈 소스 도구에 액세스하고, 주요 프레임워크를 활용하고, 클라우드 및 온프레미스용 하이브리드 배포 옵션을 활용하여 신속한 실험을 가능하게 하고 비즈니스 가치 실현 시간을 단축합니다.
watsonx.ai®에서 gpt-oss를 사용할 수 있게 되면서 플랫폼에서 호스팅되는 오픈 모델 메뉴에 또 다른 옵션이 추가되었으며, watsonx Orchestrate에서 에이전트를 구축하는 팀에 더 많은 선택권이 제공됩니다. 이의 목표는 Meta 및 Mistral과 같은 타사 모델과 IBM의 자체 모델인 Granite 등, 최상위 개방형 모델에 대한 액세스를 watsonx에서 제공함으로써 생성형 AI를 배포하는 고객을 위한 협업 및 유연성 문화를 조성하는 것입니다.
규모가 더 큰 모델인 gpt-oss-120b는 1168억 개의 매개변수를 포함하며 Mixture of Experts(MoE) 아키텍처를 사용합니다. 즉, 모델의 일부만 상시 활성화 상태입니다. 이 설계 덕분에 데이터 센터에서 널리 사용되는 단일 NVIDIA H100 GPU에서 효율적으로 실행할 수 있습니다. 규모가 더 작은 모델인 gpt-oss-20b는 16GB 메모리가 탑재된 노트북과 같은 소비자용 장치에 최적화되어 있습니다.
두 모델 모두 조정 가능한 추론 수준(낮음, 중간 또는 높음)을 지원하므로 사용자는 아웃풋 품질과 비용 및 속도의 균형을 맞출 수 있습니다. 또한 모델은 전체 추론 체인을 출력하므로, 사용자는 최종 답변만 받는 대신 결론에 도달한 방법을 확인할 수 있습니다. OpenAI는 이를 통해 투명성이 향상되며, 모델을 더 쉽게 디버깅하고 신뢰할 수 있다고 말합니다.
OpenAI는 규모가 더 큰 모델이 여러 추론 및 수학 작업에서 경쟁력 있는 성능을 발휘한다는 것을 보여주는 벤치마크 점수를 발표했습니다. 이 모델은 일반 지식을 평가하는 표준 테스트인 MMLU 벤치마크에서 90점을 받았습니다. 또한 GPQA 과학 벤치마크에서 80.1점을 받았으며, AIME 2025 수학 시험에서는 97.9점을 획득해 강력한 기호적 추론 기능을 시사했습니다.
모델에는 이미지, 오디오 또는 비디오 이해가 포함되어 있지 않으며 콘텐츠 필터나 조정 시스템이 탑재되지 않았습니다. 텍스트 전용이며, 사용자는 모델이 배포되는 방식에 따라 자체 보호 장치를 구현해야 합니다. 사용자는 Granite Guardian을 gpt-oss와 함께 활용하여 프롬프트와 응답에서 위험을 감지하는 데 도움이 되는 가드레일 모델로 사용할 수 있습니다.
gpt-oss의 출시는 개방형 모델이 성장하고 있는 시기에 이루어졌습니다. 이는 BM의 개방적인 멀티모델 전략을 강조합니다. 또한 개발자와 비즈니스 사용자 모두가 이용 가능한 가장 앞선 AI 기술에 접근할 수 있도록 하겠다는 IBM의 의지를 보여줍니다. IBM의 Granite와 마찬가지로 Meta의 LLaMA, Mistral 및 Alibaba의 Qwen 제품군은 모두 독립적으로 감사, 개선 및 배포할 수 있는 도구를 찾는 개발자와 연구자들 사이에서 폭넓게 채택되었습니다.
오픈 가중치 모델은 상용 블랙박스 시스템에 대한 대안을 제공하며, 모델 동작을 더 자세히 조사할 수 있도록 합니다.
OpenAI의 경우 gpt-oss의 출시는 상용 인터페이스를 통해서만 최첨단 시스템을 계속 제공하면서도 이러한 역학에 참여하려는 의지를 나타냅니다. Apache 2.0 라이선스는 재배포 또는 독점 애플리케이션에서의 사용에 대한 제한 없이 모델을 기반으로 구축할 수 있는 광범위한 자유를 사용자에게 제공합니다.
IBM의 데이터, AI 및 분석 전략 담당 부사장인 Bruno Aziza는 Mixture of Experts 팟캐스트의 최근 에피소드에서 "미래는 하이브리드입니다."라며, "모든 용도에 적합한 하나의 모델은 없을 것입니다 ... 온전히 폐쇄형이거나 개방형일 수도 없습니다. 기업은 두 가지 모델을 모두 활용할 것입니다."라고 말했습니다.
watsonx.ai에서 gpt-oss-120B를 사용할 수 있도록 함으로써 IBM은 개발자, 데이터 과학자 및 기업이 다음을 수행할 수 있도록 지원합니다.
내부 어시스턴트를 구축하든, 워크플로를 자동화하든 혹은 생성형 AI의 새로운 사용 사례를 탐색하든 gpt-oss-120B on watsonx.ai는 모든 작업을 안전하고 투명하게 수행할 수 있는 유연성과 성능을 제공합니다.
watsonx.ai에서 gpt-oss-120B를 탐색하고 가장 뛰어난 오픈 모델 중 하나로 개발을 시작하세요.