기술 분야의 1년은 여타 분야의 10년에 맞먹는 속도로 흘러갑니다.
1년 전만 해도 우리는 ChatGPT가 "strawberry"의 "r"의 개수를 계산하지 못하는 문제에 대해 논의하고 있었습니다. DeepSeek-R1과 같은 중국의 선도적인 연구소들이 내놓은 추론 모델들은 아직 세계적인 반향을 일으키기 전이었으며, 오픈소스 추론 에이전트들 역시 마찬가지였습니다.
그 당시 Claude의 전용 코딩 에이전트는 존재하지도 않았습니다. IBM에서는 Granite 3.0을 이제 막 출시한 시기였습니다. 에이전트를 둘러싼 담론은 이제 막 시작되는 단계였습니다. MCP(Model Context Protocol)는 지난봄 Sam Altman의 공개적인 지지에 힘입어 본격적으로 탄력을 받기 시작했습니다.
한편, 인프라 분야에서는 칩과 컴퓨팅 리소스가 부족해지면서 새로운 영역이 경쟁 우위를 점하게 되었습니다.
지난 몇 주 동안 IBM Think는 다가올 한 해의 전망을 살펴보기 위해 IBM 안팎의 연구원, 창업자, 리더 등 12명의 기술 전문가들을 만나 그들의 심도 있는 인사이트를 살펴보았습니다. 이들은 2026년에도 혁신의 속도는 둔화되지 않을 것이라는 공통된 견해를 내놓았습니다.
IBM Research Zurich 연구소의 수석 연구원인 Peter Staar는 IBM Think와의 인터뷰에서 "지금은 정말 엄청난 시기입니다. 그리고 그 속도는 점점 더 빨라지고 있습니다."라고 말했습니다.
새로운 에이전트 능력은 기업과 개인 모두에게 새로운 가능성을 제공할 것입니다. IBM의 저명한 엔지니어인 Chris Hay는 IBM Think과의 인터뷰에서 "Rick Rubin 스타일의 음악 제작과 AI 콘텐츠 제작 사이에 유사점이 많다고 생각합니다."라고 말했습니다. "저는 코딩에만 국한하지 않습니다. 마케터, 프로그래머, PM 등 우리 모두가 AI 작곡가가 될 수 있다고 생각합니다."
많은 사람이 효율성의 시대가 열릴 것이라고 생각합니다. IBM의 수석 연구 과학자인 Kaoutar El Maghraoui는 이번 주 Mixture of Experts에서 "GPU는 여전히 왕좌를 지키겠지만 ASIC 기반 가속기, 칩렛 설계, 아날로그 추론, 심지어 양자 기반 옵티마이저도 발전할 것"이라고 말했습니다. "에이전트 작업을 위한 새로운 종류의 칩이 등장할지도 모릅니다."
AI의 투자 대비 수익(ROI)에 대한 수많은 회의론을 뒤로하고, 이제 고도화된 AI 역량은 기업이 비즈니스를 수행하는 새로운 길을 열어줄 것입니다. 그리고 오픈 소스 추론 모델과 에이전트는 엔터프라이즈 AI를 정복하기 위해 계속 그 경계를 뛰어넘을 것입니다.
동시에 많은 기업이 AI 주권에 대한 관심이 높아짐에 따라 신뢰와 보안이 핵심 우선순위가 될 것입니다.
이는 앞으로 기업 기술 분야에서 펼쳐질 일들의 서막에 불과합니다. 2026년에 주목해야 할 18가지 전문가 예측을 확인해 보세요.
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
IBM은 2026년이 양자 컴퓨터가 기존 컴퓨터의 성능을 능가하는 첫 번째 해가 될 것이라고 공식적으로 밝혔습니다. 이는 양자 컴퓨터가 기존의 모든 방식보다 특정 문제를 더 효율적으로 해결할 수 있는 시점에 도달했음을 의미합니다.
IBM에 따르면 이 이정표는 신약 개발, 재료 과학, 재무 최적화 및 매우 복잡한 과제에 직면한 더 많은 산업에서 획기적인 발전을 가져올 것입니다.
“우리는 이제 이론의 단계를 넘어섰습니다.” IBM의 전략 성장 및 양자 파트너십 디렉터인 Jamie Garcia는 IBM Think에 이같이 전했습니다. “현재 우리는 업계 최고 수준의 양자 컴퓨터를 실제 활용 사례에 적용하고 있습니다. 비록 지금은 상용화 규모의 문제가 아닐지라도, 양자 기술이 고도화됨에 따라 가치가 비약적으로 상승할 것이라는 신호탄과 같습니다. 실제로 신약 개발, 신소재 발굴, 그리고 금융 및 물류 최적화 연구 분야에서 놀라운 진전이 나타나고 있습니다.”
Garcia는 또한 AI와의 융합을 강조하며, Qiskit Code Assistant와 같은 도구가 이미 개발자들이 양자 코드를 자동으로 생성하는 데 도움을 주고 있다고 언급했습니다. IBM은 양자 컴퓨팅과 강력한 성능 컴퓨팅 및 AI 인프라를 결합한 양자 중심 슈퍼컴퓨팅 아키텍처를 구축하고 있으며, CPU, GPU 및 기타 컴퓨팅 엔진이 이를 지원한다고 설명했습니다.
이러한 목표를 미래로 확장하기 위해, AMD와 IBM은 AMD의 CPU, GPU, FPGA를 IBM의 양자 컴퓨터와 통합하여 새로운 유형의 차세대 알고리즘을 효율적으로 가속화하는 방안을 모색하고 있습니다. 이는 현재의 기존의 컴퓨팅이나 양자 컴퓨팅 패러다임이 단독으로는 해결할 수 없는 영역입니다.
IBM의 수석 연구원인 Kaoutar El Maghraoui는 최근 IBM의 Mixture of Experts의 한 에피소드에서 “2026년은 프론티어 모델군과 효율성을 강조한 모델군이 격돌하는 한 해가 될 것입니다.”라고 말했습니다. 수십억 개의 파라미터를 갖춘 거대 모델들과 더불어, 일반적인 사양의 가속기에서도 원활하게 구동되는 하드웨어 최적화 기반의 효율적인 모델들이 등장할 전망입니다. "컴퓨팅을 무한정 확장할 수는 없습니다. 업계에서는 그 대신 효율성을 높이는 데 주력해야 합니다."
2025년에는 수요가 공급망을 앞지르면서 기업들은 가용 가능한 컴퓨팅 자원을 중심으로 최적화에 주력해야만 했습니다. 그녀의 설명에 따르면, H200, B200, GB200과 같은 슈퍼칩을 활용한 스케일업 방식과, 엣지 최적화, 양자화 기술 혁신, 소형 LLM을 활용한 스케일아웃 방식으로 하드웨어 전략이 나뉘었습니다.
이는 또한 엣지 AI비로소 실현되는 시대가 왔음을 의미합니다. 하드웨어 경쟁은 이제 더 이상 GPU에만 국한되지 않을 것입니다. El Maghraoui는 “GPU가 여전히 왕좌를 지키겠지만, ASIC 기반 가속기, 칩렛 디자인, 아날로그 추론, 심지어 양자 보조 최적화 도구들까지 성숙 단계에 접어들 것”이라며, “어쩌면 AI 에이전트 작업(Agentic workloads)에 특화된 새로운 유형의 칩이 등장할지도 모릅니다.”고 전망했습니다.
2026년에는 AI 모델이 아니라 시스템 간의 경쟁이 펼쳐질 것입니다.
IBM의 AI 오픈 이노베이션 수석 아키텍트인 Gabe Goodhart는 IBM Think와의 인터뷰에서 "우리는 일종의 상품화 단계에 진입하게 될 것입니다."라고 말했습니다. "지금은 구매자의 시장입니다. 사용 사례에 딱 맞는 모델을 선택하고 바로 시작할 수 있습니다. 모델 자체가 주요 차별화 요소가 되지는 않을 것입니다."
지금 중요한 것은 모델, 툴, 워크플로를 결합하는 오케스트레이션입니다. “ChatGPT로 간다면 AI 모델과 대화하는 것이 아닙니다.”라고 그는 설명했습니다. "웹을 검색하고, 모든 종류의 개별 스크립팅된 프로그래밍 작업을 수행하기 위한 도구를 포함하는 소프트웨어 시스템과 대화하고 있으며, 에이전트 루프일 가능성이 높습니다."
"2026년에는 더 많은 협력적 모델 라우팅이 도입될 것으로 보입니다."라고 Goodhart는 말했습니다. "다양한 업무를 수행할 수 있는 소형 모델이 일차적으로 업무를 처리하고, 필요한 경우에만 거대 모델에 작업을 위임하는 방식이 될 것입니다. 이러한 시스템 차원의 통합을 완벽하게 구현해내는 기업이 시장의 판도를 주도하게 될 것입니다."
2026년에는 문서 처리가 더 이상 한 가지 모델로만 이루어지지 않을 것입니다. 합성 구문 분석 파이프라인은 단일 시스템이 전체 파일을 해석하도록 강제하는 대신, 문서를 제목, 단락, 표, 이미지 등의 부분으로 나누고 각 부분을 가장 잘 이해하는 모델로 라우팅합니다.
“이 방식을 통해 연산 비용은 줄이면서도 결과의 정확도(fidelity)는 높일 수 있습니다. 각 데이터 요소를 가장 잘 이해하는 특정 모델군이 해당 항목을 전담하여 해석하기 때문입니다.” Unstructured의 설립자이자 CEO인 Brian Raymond는 IBM Think와의 인터뷰에서 이같이 설명했습니다. Unstructured에서는 비정형 데이터를 AI에서 사용할 수 있는 정제된 데이터로 변환합니다.
“결과적으로 유연한 재구성 계층(reconstruction layer)이 형성되어, 원본 소스의 정밀한 재현물을 합성해 냅니다. 이 과정에서 데이터의 구조와 계보, 그리고 본래의 의미는 흐트러짐 없이 강력하게 보존됩니다.”라고 Unstructured의 Raymond CEO는 이같이 덧붙였습니다. Unstructured는 이러한 목표를 달성하고 전반적인 정확도를 높이기 위해 최근 IBM Research의 Docling의 객체 탐지 기능을 통합했습니다.
다음은 에이전틱 구문 분석입니다. 이를 특정 분야의 전문가들로 구성된 팀이라고 생각해보세요. 다만 그 정체는 AI 에이전트들로, 이들은 말뭉치(corpus)를 지속적으로 분석하여 심층적인 시맨틱 프로필을 구축하고 모든 데이터를 다차원 그래프상에 인덱싱합니다. Raymond는 “이를 통해 사용자의 의도, 데이터의 구조와 내용, 그리고 메타데이터를 동시에 아우르는 검색이 가능해지며, 이전에는 접근이 불가능했던 사내 지식을 실시간으로 활용할 수 있게 됩니다.”고 강조했습니다.
이러한 발전을 종합하면 2026년에 더 빠른 의사 결정과 더 스마트한 워크플로를 위한 기반이 될 자기 인식 엔터프라이즈 데이터 시스템이 필요합니다.
IBM의 저명한 엔지니어인 Chris Hay는 최근 Mixture of Experts의 한 에피소드에서 "우리는 단일한 목적을 기반으로 하는 에이전트 시대는 벗어났습니다."라고 말했습니다. 2024년의 에이전트들이 이메일 작성이나 리서치 보조와 같이 작고 특화된 기능에 머물렀다면, 이제 추론 능력을 갖춘 에이전트들은 스스로 계획을 수립하고 필요한 도구를 호출하며 복잡한 과제를 완수하는 수준으로 진화했습니다.
"이른바 '슈퍼 에이전트'의 시대가 도래하고 있습니다."라고 Hay는 말합니다.
"2026년에는 에이전트 컨트롤 플레인과 멀티 에이전트 대시보드가 현실화될 것으로 봅니다. 한 곳에서 작업을 시작하면 해당 에이전트가 브라우저, 편집기, 받은 편지함 등 다양한 환경에서 작동하므로 수십 개의 별도 도구를 관리할 필요가 없습니다."라고 Hay는 말합니다. 사용자 경험과 인터페이스에 있어 정적인 소프트웨어의 시대는 이제 지나갔습니다. 모든 시나리오에 적응할 수 있는 인터페이스와 앱을 기대하며, 이를 통해 모든 사용자가 AI 작곡가가 될 수 있다고 Hay는 예측합니다.
"슈퍼 에이전트로 진입하는 관문을 누가 먼저 여느냐 따라 시장이 형태는 달라질 것입니다."
엔터프라이즈 AI 플랫폼 Writer의 최고 전략 책임자인 Kevin Chung은 2026년 한 해가 AI가 개인의 생산성 향상을 넘어 그 이상의 가치를 창출하게 될 세 가지 트렌드에 의해 정의될 것이라고 밝혔습니다.
"첫째, AI는 개인 사용에서 팀 및 워크플로 오케스트레이션으로 전환되고 있습니다."라고 Chung은 IBM Think와의 대화에서 말했습니다. 이는 워크플로를 조정하고, 부서 간에 데이터를 연결하고, 프로젝트를 아이디어에서 완료로 옮기는 것을 의미합니다.
둘째, 추론 기능이 향상되면 시스템은 지침을 따르기만 하는 것이 아니라 요구 사항을 예측하게 됩니다. "이러한 진화는 AI를 수동적인 어시스턴트에서 의미 있는 문제 해결과 의사 결정이 가능한 능동적인 협력자로 변화시킵니다."라고 그는 말합니다.
마지막으로, Chung은 AI 에이전트 개발의 대중화를 꼽으며 이것이 가장 흥미로운 부분으로 보고 있습니다. "지능형 에이전트를 설계하고 배포하는 기능은 개발자를 넘어 일상적인 비즈니스 사용자의 손에 들어가고 있습니다."라고 그는 설명했습니다. "기술 장벽을 낮춤으로써 조직은 현실 문제에 가장 가까이 맞닿아 있는 사람들이 혁신을 주도하는 현상을 보게 될 것입니다."
에이전틱 시스템은 2025년에 LLM과 코딩 어시스턴트를 더욱 역동적인 존재로 변화시켰습니다. IBM 연구소의 Quantum 및 AI 부문 부사장인 Ismael Faro에 따르면, 이는 단지 시작에 불과합니다. 그는 소프트웨어가 비공식적인 상호 작용에서 사용자가 목표를 설정하고 진행 상황을 검증하는 동안 자율 에이전트가 작업을 실행하고 사람의 승인을 요청하는 구조화된 접근 방식으로 전환하고 있다고 생각합니다.
Faro는 IBM Think와의 인터뷰에서 "소프트웨어 개발 관행은 이른바 느낌에 의존하는 바이브 코딩(Vibe coding)에서 객관적 검증 프로토콜(Objective-Validation Protocol) 단계로 진화할 것입니다."라고 언급했습니다. "사용자는 목표를 정의하고 검증하여 에이전트 컬렉션이 자율적으로 실행되는 동안 중요한 체크포인트에서 사람의 승인을 요청하는 휴먼 인 더 루프의 개념을 확장할 수 있습니다."
이러한 전환은 제어 메커니즘을 통해 복잡한 워크플로우를 실행하는 에이전틱 런타임의 등장을 가능하게 할 것입니다. 또한, 유연성과 제어의 균형을 맞춘 정책 기반 스키마를 통해 에이전트의 행동을 기존의 정적이고 코드에 종속된 출력 방식에서 동적 적응 방식으로 진화시킬 것입니다.
Faro는 이것이 에이전틱 운영체제(Agentic Operating System, AOS)의 근간이 될 것이라고 설명했습니다. AOS는 여러 에이전트 스웜(agent swarms)에 걸쳐 오케스트레이션, 안전성, 규정 준수 및 리소스 거버넌스를 표준화하는 역할을 하게 될 것입니다.
"보안, 자원 관리, 준수 및 운영 우수성에 대한 엄격한 주의를 기울이면, 기업은 전문가 시스템 에이전트를 활용하여 미션 크리티컬 컴퓨팅 분야에서 리더십을 되찾을 수 있습니다"고 그는 설명합니다.
IBM 펠로우이자 마스터 인벤터(Inventor)인 Aaron Baughman은 최근 Mixture of Experts 에피소드에서 '생성형 모델은 인간처럼 세상을 해석하고, 심지어 우리가 놓칠 수 있는 신호까지 감지할 수 있도록 다중 감각을 갖춰야 한다'고 언급했습니다.
Baughman은 스포츠 분야에서 멀티모달 AI를 활용했으며 특히 US 오픈, ESPN 판타지 풋볼 마스터스에서 IBM의 일부 작업을 이끌었습니다. 그는 2026년에 멀티모달 AI가 더 많이 활용될 것이라고 예상합니다.
"이러한 모델은 인간과 훨씬 더 유사한 세상을 인식하고 행동할 수 있을 것입니다. 그들은 언어, 비전, 행동을 모두 하나로 연결할 수 있을 것입니다."라고 그는 말했습니다. "가까운 미래에는 복잡한 의료 사례처럼 사물을 해석하기 위해 다양한 작업을 자율적으로 완료할 수 있는 멀티모달 디지털 작업자를 보게 될 것입니다."
하지만 자율성이란 사람의 감독이 완전히 필요하지 않다는 것을 의미하진 않습니다. Baughman은 "미래에는 휴먼 인 더 루프 AI를 보유하여 인간이 미세 조정하고 변경할 수 있도록 하는 것도 중요합니다."라고 말했습니다.
Anthropic이 MCP를 출시하고, IBM의 ACP와 구글(Google)의 A2A가 함께 등장한 지 불과 1년이 지났습니다. IBM의 Kate Blair는 IBM Think 인터뷰에서 '2025년이 에이전트의 해였다면, 2026년은 모든 멀티 에이전트 시스템이 실제 상용화 단계로 진입하는 해가 될 것'이라고 밝혔습니다. 이러한 전환은 프로토콜의 성숙도와 융합에 달려 있습니다.
IBM의 BeeAI 및 Agent Stack 이니셔티브를 이끌고 있는 Blair는 '2026년은 이러한 패턴들이 연구실을 벗어나 실제 현장에 적용되는 시기가 될 것'이라고 말했습니다. 두 프로젝트 모두 Linux 재단에 기탁되었습니다.
Linux 재단은 에이전트 AI 재단의 설립과 앤스로픽의 MCP 기여를 최근 발표했습니다. Blair는 "MCP가 개방형 거버넌스 체제로 전환된 것을 기쁘게 생각합니다"고 말했습니다. "투명하게 관리되는 커뮤니티 표준이야말로 더 많은 창의성, 혁신, 그리고 해결책을 이끌어낼 것입니다."
A2A 프로젝트가 곧 첫 번째 주요 릴리스를 앞두고 있습니다. "우리는 이미 A2A와 MCP 간의 협력을 통해 엔티티가 MCP의 툴이나 리소스이든 A2A의 에이전트이든 관계없이 단일 카드로 표준화하는 것을 목격하고 있습니다."라고 그녀는 말합니다.
Blair는 이 통합 카드를 상호 운용성의 촉매제이자 에이전트와 에이전틱 시스템 전반에서 레지스트리, 검색 및 활용도를 공유할 수 있는 기회 보고 있습니다.
"저는 에이전트가 다른 에이전트와 서로 소통하고, 광범위한 실제 상용화 사례들에 대해 본격적으로 논의하게 될 다음 단계로 진입하게 된 것에 매우 고무되어 있습니다."
Atolio는 엔터프라이즈용의 안전한 프라이빗 AI 플랫폼을 제공합니다. 이들이 고객들 사이에서 관찰한 과제는 AI 데이터에 대한 통제력을 잃을 위험을 완화하면서 새로운 기술을 빠르게 실험해야 한다는 점입니다.
Atolio의 공동 설립자이자 CEO인 David Lanstein은 IBM Think와의 인터뷰에서 '내년에 나타날 가장 중요한 트렌드는 AI 실험과 흥미에서 벗어나 기업 내에서 실제 ROI가 기대되는 사설 및 보안 배포로 전환되는 것'이라고 말했습니다.
"데이터 유출은 계속해서 기업의 신뢰를 떨어뜨리고 있습니다."라고 그는 말합니다. "상용화 환경에서 여전히 해결되지 않은 과제인 프롬프트 인젝션 공격으로 인해 데이터 주권과 최고 수준의 권한 부여는 타협할 수 없는 필수 요구사항이 되었습니다."
해결책은 더 큰 모델이 아니라 더 스마트한 데이터입니다. Lanstein은 '진정한 가치는 모델에 권한 체계가 반영된 고품질의 구조화된 데이터를 제공함으로써, 지능적이고 관련성이 높으며 신뢰할 수 있는 답변을 생성하는 것에서 창출될 것'이라고 강조했습니다.
그는 '제가 가장 기대하는 것은 이를 실현하기 위해 필요한 기술적 융합'이라며, 보안에 대한 강화된 의지, 컨텍스트와 사용자 요구사항을 더욱 깊이 있게 파악하는 솔루션의 발전, 그리고 MCP 생태계의 지속적인 진화를 그 핵심 요소로 꼽았습니다.
2020년에 설립된 AuthMind는 사이버 보안에서 가장 어려운 문제 중 하나를 해결하고 있습니다. 모든 ID의 액세스 및 활동을 실시간에 가깝게 명확하게 제공하여 공격이 시작되기 전에 차단할 수 있도록 하는 것입니다.
"앞으로 몇 년 안에 에이전틱 AI와 기타 비인간 ID가 조직 내 인간 사용자보다 훨씬 더 많아질 것입니다."라고 AuthMind의 CEO 겸 공동 설립자인Shlomi Yanai는 IBM Think와의 인터뷰에서 말합니다.
이러한 변화는 기업 보안과 거버넌스를 재정의할 것입니다. "이제는 각 에이전트가 의도한 대로 처리되고 행동하여 생산성과 보안을 모두 향상하는 것이 기업 이사진의 관심사입니다."라고 Yanai는 말합니다. 조직이 AI 도입을 확장함에 따라 모델을 배포하는 것만이 더 이상 과제가 아닙니다. 새로운 사용자, 즉 시스템 전반에서 작동하는 자율 에이전트의 ID를 관리하는 것입니다.
기업의 입장에서 이러한 흐름 속의 경쟁 우위를 확보한다는 것은 다음의 세 가지 핵심적인 질문에 답할 수 있음을 의미합니다. 우리는 존재하는 모든 AI 에이전트를 파악하고 있는가? 그 에이전트가 무엇에 접근하고 있는지 이해하고 있는가? 에이전트가 시스템에 접근했을 때 하는 행동을 신뢰할 수 있는가?
인간뿐 아니라 모든 AI 에이전트까지 발견하고 관찰하고 보호하는 것은 책임감 있고 안전한 AI 도입에 필수적인 요소가 되고 있습니다. Yanai는 "모든 AI 에이전트의 정체성에 걸쳐 가시성, 책임감, 신뢰를 완벽하게 확보하는 기업들을 지켜보는 것이 매우 기대됩니다"고 말했습니다.
"내년에 가장 강력한 트렌드는 AI가 복잡한 엔터프라이즈 워크플로를 다루는 것입니다."라고 구매/조달 생태계에 중점을 둔 AI 네이티브 스타트업 Rohirrim의 설립자인 Steven Aberle은 IBM Think와의 인터뷰에서 말했습니다. "개념 증명이 아니라 심층적인 작업을 엔드투엔드로 실행할 수 있는 신뢰할 수 있는 시스템으로 활용해야 합니다."
생성형 및 에이전틱 시스템은 의도를 해석하고, 방대한 네트워크를 검색하고, 올바른 도구를 선택하고, 결과를 얻을 때까지 계속 작업합니다. "이러한 변화는 완전히 새로운 카테고리의 플랫폼, 심지어 새로운 시장까지 창출합니다. 더 이상 사람 한 명이나 애플리케이션이 염두에 둘 수 있는 범위에 제한을 받지 않기 때문입니다."라고 그는 설명했습니다. "이것이 진정한 머신 자동화입니다."
트랜스포머 덕분에 이것이 가능해졌습니다. "그들은 방대한 양의 텍스트, 코드, 그리고 내력을 흡수한 다음, 효과적인 안전장치를 마련해 미묘한 차이와 정확성을 고려하여 대응할 수 있는 시스템을 우리에게 제공했습니다."라고 Aberle는 말했습니다. "우리는 AI가 단순히 질문에 답하는 것에서 결과에 직접적인 영향을 미치는 시대로 접어들고 있습니다."
구매/조달에서 이는 요구사항을 추적하고 조기에 빈틈을 발견하며, 수정 방안을 제안하고 전문가들에게 명확하면서도 신속한 정보를 제공하여 공정하고 빠른 결정을 내릴 수 있도록 하는 것을 의미합니다.
1년 전,PyTorch Foundation의 전무 이사인 Matt White는 더 작은 모델이 AI를 최첨단으로 끌어올릴 것이라고 예측했습니다.
"업계에서는 더 작고 영역별로 최적화된 모델이 중심이 될 것이라는 가설을 검증했습니다."라고 White는 최근 IBM Think와의 인터뷰에서 말했습니다. "지식 증류(distillation), 양자화 및 메모리 효율적 런타임 기술의 발전은 비용 절감, 지연 시간 단축, 데이터 주권 확보라는 필요성에 힘입어 AI 추론의 영역을 엣지 클러스터와 임베디드 기기까지 확장시켰습니다."
White에 따르면, 2026년의 오픈소스 AI는 세 가지 동력에 의해 정의될 것입니다. 중국의 다국어 및 추론 특화(reasoning-tuned) 모델들이 주도하는 글로벌 모델의 다각화, 프레임워크와 런타임이 공통 표준을 중심으로 정렬되면서 핵심 경쟁 축으로 부상한 상호운용성, 그리고 보안 감사를 거친 릴리스와 투명한 데이터 파이프라인을 통한 강화된 거버넌스가 바로 그것입니다.
White는 '에이전틱 시스템이 부상함에 따라 학습, 시뮬레이션, 그리고 오케스트레이션을 위한 공통 토대(substrate)로서 PyTorch의 역할은 더욱 공고해질 것'이라며, '개발자들에게는 멀티모달 추론, 메모리 컴포넌트, 그리고 안전성이 검증된 평가를 위한 유연한 도구가 필요하며, 이것이 바로 오픈소스가 번영하는 이유'라고 강조했습니다.
IBM의 Peter Staar는 2026년이 인공지능 연구가 감각적인 것에 더 집중하는 방향으로 전환되는 해가 될 것이라고 예측합니다. '로보틱과 피지컬 AI는 분명히 발전할 것'이라고 그는 말했습니다. 대규모 언어 모델이 여전히 지배적이지만, Staar는 업계가 확장으로 인한 수익 감소에 직면하고 있다고 지적합니다. "사람들은 확장에 지쳐가고 있으며 새로운 아이디어를 찾고 있습니다."라고 그는 설명합니다.
Staar는 실제 환경에서 감지, 행동, 학습할 수 있는 AI에 대한 많은 관심을 보고 있는 반면, 여기에는 기술적 과제가 있습니다. 하지만 바로 이것이 혁신을 위한 새로운 개척지가 될 수 있다는 것입니다.
이와 동시에 Staar는 오픈 소스 AI가 계속해서 경쟁 구도를 형성할 것이라고 믿습니다. "선두에 있는 사람들은 폐쇄적인 시장을 원하고, 추격하는 이들은 개방을 유지하려고 합니다."라고 그는 말합니다.
NVIDIA의 비즈니스가 독점 모델보다는 GPU의 광범위한 보급에 의존하고 있기 때문에 개방형 생태계의 주요 동력으로 부상하고 있습니다. 이에 대해 Staar는 AI가 스크린을 넘어 물리적 세계로 진출함에 따라 기업 간의 협업이 더욱 가속화될 것이라고 전망합니다.
2024년은 Meta의 Llama 모델이 주목을 받으면서 오픈 소스 AI에 대한 높은 평가를 얻었습니다. 그 이후로 오픈 소스 생태계는 크게 성장했으며, 소규모의 영역별 모델들이 인상적인 성과를 거두었습니다. IBM의 Granite, Ai2의 Olmo 3, 그리고 DeepSeek의 모델 등이 그 예입니다. IBM과 AI 얼라이언스의 오픈 소스 AI 디렉터인 Anthony Annunziata는 2026년에 이러한 추세가 가속화될 것으로 보고 있습니다.
"우리는 멀티모달을 지원하고 특정 도메인에 맞게 조정하기 쉬운 더 작은 규모의 추론 모델을 보게 될 것입니다."라고 그는 IBM Think와의 인터뷰에서 말했습니다.
미세 조정 및 강화 학습의 발전으로 기업은 오픈 소스 AI를 채택하여 더 작고 효율적인 모델에 대한 수요를 충족할 수 있습니다. 그는 "모든 것을 위한 하나의 거대한 모델 대신, 적절한 사용 사례에 맞춰 조정하면 정확도는 같거나 오히려 더 높은, 더 작고 효율적인 모델들을 갖게 될 것"이라고 말했습니다.
오픈 소스, 에이전틱 AI는 이러한 추세를 가속화할 것입니다. "법률, 의료, 제조업에서는 범용 에이전트만으로는 충분하지 않습니다."라고 Annunziata는 말합니다. “전문가 워크플로를 반영하는 도메인 강화 모델 및 아키텍처가 필요합니다.”
오픈 소스 AI는 필수입니다. 그는 "AI의 자동화 역량이 업무의 상당 부분을 수행하는 경제 체제로 나아가고 있다고 믿는다면, 상호작용을 위한 표준은 반드시 개방되어야 합니다"라고 강조했습니다. "그렇지 않으면 파편화된 사일로가 형성되거나 승자 독식 플랫폼으로 귀결될 수 있습니다."
다중 모델 AI 인프라 플랫폼인 Not Diamond의 공동 설립자인 Tomás Hernando Kofman은 IBM Think와의 인터뷰에서 "업용 AI 시장의 대다수를 차지하는 중간층이 이제 단순 실험 단계를 넘어 실제 서비스 운영이 가능한 프로덕션 등급 시스템으로 이동하기 시작했습니다."라고 말했습니다.
"AI 팀은 평가, 안정성, 최적화, 효율성, 확장성 및 유지 관리 가능성에 막대한 투자를 해야 할 것입니다."라고 그는 말합니다.
이를 위해서는 상당한 협업과 리소스가 필요합니다. 기업들이 제때 투자하지 않는다면 결국 정체에 빠지게 될 것입니다. 적절한 역량을 갖추지 못하면 시스템의 실효성이 떨어지게 되고, 이러한 유용성 결여는 다시 투자를 주저하게 만드는 악순환을 강화할 뿐입니다.
기술의 최전선에서 마주하는 도전 과제들은 그 양상이 다릅니다. Kofman은 "앞으로 이 분야는 세 가지 주요 난제, 즉 연속 학습(continuous learning), 메모리(memory), 그리고 확장성(scalability) 문제와 본격적으로 씨름하게 될 것"이라고 언급했습니다.
작업은 모델 아키텍처 수준과 에이전틱 시스템 모두에서 이루어집니다.
그는 "서로 학습하고 정보를 공유하며 몇 주, 몇 달, 심지어 몇 년 동안 중요한 지식을 유지할 수 있는 분산형 에이전트 네트워크를 보게 될 것"이라고 말했습니다. "이러한 시스템은 역동성과 지속적인 개선 능력을 향상하는 동시에, 에이전트와 모델들이 효율적이고 집중된 역량을 갖춘 전문 분야로 특화될 수 있게 해줄 것입니다."
딥페이크 탐지 도구를 제공하는 사이버 보안 기업 Reality Defender의 공동 창립자이자 CEO인 Ben Colman은 "특히 올해 말에 등장한 무기화된 AI 에이전트와 같은 새로운 위협 벡터들로 인해, 그 어떤 단일 주체도 딥페이크와 무기화된 AI 위기를 독자적으로 해결할 수는 없습니다"고 말했습니다. 생성형 AI가 빠르게 진화하려면 협업 생태계가 필요합니다.
그는 IBM Think와의 인터뷰에서 "전략적 파트너십은 단순히 방어 체계를 강화하는 것을 넘어, 차세대 고성능 모델의 등장과 산업별로 특화된 취약점을 선제적으로 예측하고 대비하기 위해 필수적입니다"라고 밝혔습니다.
"저는 우리 업계 내부, 즉 유사한 문제의 각기 다른 측면을 다루는 여러 주체 간의 파트너십이 AI의 발전 속도만큼이나, 어쩌면 그보다 더 빠르게 형성되고 있는 것을 목격하고 있습니다."
Colman은 계층화된 보안 모델로의 전환을 관찰합니다. "서로 다른 방어 체계를 겹침으로써 한 계층의 틈새를 다른 계층으로 덮어 뚫을 수 없는 방패를 만듭니다."라고 그는 말합니다.
통합은 다음 단계를 정의합니다. "이러한 새로운 기술이 우리와 같은 탐지 플랫폼과 결합되면 포괄적인 '심층 방어' 전략이 탄생합니다."라고 그는 말합니다. "이를 통해 조직은 단일 장애 지점에 의존하지 않고 모든 미디어 형식과 진입점, 모든 사용 사례 및 모든 도구 세트에서 보호받을 수 있습니다."
기업들은 AI 프로젝트가 중단되는 상황을 감당할 여유가 없지만, 비즈니스 리더가 스스로 통제할 수 있는 부분에는 한계가 있습니다. IBM 기업가치연구소(IBV) 수석 이사이자 부사장인 Anthony Marshall은 '외부 주체에 의존하지 않고 AI 시스템, 데이터 및 인프라를 관리할 수 있는 역량인 AI 주권이 이제 전사적 핵심 과제가 되었습니다'라고 밝혔습니다.
IBV가 설문 조사한 경영진 중 93%에게 2026년 AI 주권을 비즈니스 전략에 반영하는 것은 필수 사항이 될 것입니다. "이는 단순한 요식 행위가 아닙니다."라고 Marshall은 강조했습니다.
경영진의 절반은 특정 지역의 컴퓨팅 자원에 대한 과도한 의존을 우려하고 있는데, 특히 중동 및 아태지역 리더들 사이에서 우려가 높습니다. 많은 이들이 특정 지역의 자원에 기대는 것이 데이터 유출, 데이터 접근 권한 상실, 지적 재산권 도난 등 광범위한 위험을 초래할 수 있다고 믿고 있습니다.
투명성과 신뢰 또한 최우선 과제로 남을 것입니다. "규제 기관과 소비자 모두 조직에 AI 에이전트가 특정 결정을 내리는 방법을 설명해 달라고 요청합니다. 조직은 가장 복잡한 결과물에 대해서도 투명하게 작업을 보여줄 수 있는 에이전트를 설계해야 합니다.”라고 Marshall은 말했습니다.
즉, 워크로드, 데이터, 에이전트가 신뢰할 수 있는 지역과 공급자 간에 이동할 수 있도록 AI 환경을 설계하는 모듈화를 통해 주권을 구축하는 것을 의미합니다.
"성능이 저하되거나 편향이 발생하기 전에 모델 드리프트를 감지하고 해결하려면 지속적인 모니터링이 필수적입니다."라고 Marshall은 말합니다.