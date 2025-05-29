OpenAI의 규모 우선 사고방식은 단순한 기술적 결론이 아니었습니다. 이는 정통적이진 않지만, 경영진이 공유한 일관된 신념 시스템의 결과였다고 하오는 지적합니다. 하오는 OpenAI의 수석 과학자인 일리야 수츠케버(Ilya Sutskever)가 딥러닝 절대주의자라고 말했습니다. 수츠케버는 충분히 큰 신경망에 충분한 데이터가 공급되면 결국 인간과 같은 지능이 개발될 것이라고 믿었습니다. 반면 OpenAI의 CEO인 샘 알트먼(Sam Altman)은 기업가로서 인공 지능에 접근했으며, 기하급수적인 확장이 지배력을 확보하는 가장 빠른 길이라고 생각했습니다. OpenAI의 사장인 그렉 브록만(Greg Brockman)은 이러한 확장을 실현하는 데 집중한 엔지니어링 담당자였습니다.

이 원칙을 가능하게 한 아키텍처는 2017년에 처음 소개된 신경망의 일종인 트랜스포머였습니다. 트랜스포머는 문장 내 멀리 떨어진 단어 간 관계를 추적할 수 있기 때문에 텍스트와 같은 데이터 시퀀스를 모델링하는 데 탁월합니다. 무엇보다도, 효율적으로 확장할 수 있습니다. 더 많은 계층과 매개변수를 추가하면 성능이 향상됩니다.

OpenAI 연구팀은 충분한 연산 능력을 갖춘 방대한 데이터 세트에서 트랜스포머를 학습시키면 수작업으로 설계된 특징, 기호 추론, 모듈러 설계를 생략할 수 있다는 사실을 깨달았습니다 OpenAI 연구팀의 견해에 따르면, 인텔리전스는 데이터로부터 나올 것입니다.

GPT-4와 같은 모델을 학습시키기 위해 OpenAI는 아이디어뿐 아니라 인프라도 필요했습니다. 이 정도 크기의 언어 모델에는 수만 개의 그래픽 처리 장치로 구성된 클러스터가 필요합니다. 원래 3차원 이미지를 렌더링하기 위해 설계된 GPU는 신경망의 핵심인 행렬 곱셈 연산에 매우 유용하다는 것이 입증되었습니다. 하지만 이를 연결하여 하나의 통합 시스템으로 작동시키기 위해서는 맞춤형 소프트웨어와 하드웨어 오케스트레이션이 필요했습니다.

OpenAI의 엔지니어들은 모델을 여러 칩에 분산하여 병렬로 학습할 수 있는 샤드로 분할하는 기술을 개발했습니다. 부분 학습 실행을 보존하기 위한 체크포인팅 프로토콜을 만들어 치명적인 실패 위험을 줄였습니다. 또한 여러 머신에서 업데이트를 동기화하기 위해 맞춤형 통신 프로토콜을 구축했습니다. 이는 화려한 발전은 아니었지만 꼭 필요한 것이었습니다.

"이전에는 아무도 10,000개의 칩 규모로 학습한 적이 없었습니다."라고 하오는 말합니다. "그래서 실시간으로 이를 해결해 나가야 했습니다."

이러한 발전을 통해 경쟁사보다 더 빠르고 효율적으로 모델을 확장할 수 있었습니다. 그러나 또한 새로운 형태의 비밀주의를 낳았습니다. OpenAI는를 획기적인 발전의 배경이 된 많은 세부 사항의 공개 중단했습니다. 너무 많은 정보를 공개하는 것은 경쟁 우위를 포기하는 것이라고 주장했습니다.

2024년에는 대부분의 주요 기술 기업이 이를 따라잡았습니다. IBM, Google, Meta, Amazon, Anthropic 및 Mistral과 같은 신생 기업은 모두 유사한 트랜스포머 아키텍처 및 교육 기술을 사용하여 대규모 언어 모델을 생성했습니다. 많은 기업이 인간의 피드백을 통한 강화 학습을 사용했는데, 이는 인간이 모델의 아웃풋 품질을 평가하는 방법으로, 모델을 미세하게 조정하여 인간의 선호도에 더 잘 맞출 수 있습니다.

외부인이 보기에는 이러한 시스템 간의 차이점을 구분하기가 더 어려워졌습니다. 애플리케이션 개발자는 백그라운드에서 어떤 모델이 돌아가든 작동할 수 있도록 설계하기 시작하여 필요에 따라 공급 업체를 바꿀 수 있게 되었습니다. 가격, 지연 시간, 가동 시간이 인텔리전스의 미미한 차이보다 더 중요해졌습니다.

"이제 모두가 모델에 구애받지 않으려고 노력하고 있습니다."라고 하오는 말합니다. "OpenAI는 더 이상 좋은 모델을 독점하지 않습니다."

규모가 더 이상 차별화 요소가 되지 못하자 기업들은 에이전시(agency)라는 다른 패러다임에 투자하기 시작했습니다. 인공 지능에서 에이전시란 시스템이 주도적으로 행동하고 시간에 걸쳐 지속적으로 존재하며 자신의 목표를 향해 행동할 수 있는 능력을 의미합니다. 프롬프트에 단순히 반응하는 것이 아니라, 에이전트는 행동을 계획하고 결과를 모니터링하며 그에 따라 행동을 조정합니다.

이를 위해서는 새로운 능력이 필요했습니다. 모델은 세션 전반에 걸쳐 메모리를 유지하고 타사 도구와 통합하며 명시적인 프롬프트 없이 결정을 내려야 했습니다. 목표는 수동적인 챗봇에서 능동적인 협업자로 전환하는 것이었습니다.

OpenAI는 사용자가 자신의 요구에 완벽하게 적응하는 AI 어시스턴트와 사랑에 빠지는 영화 '허(Her)'에서 영감을 받았습니다. 이러한 시스템을 만든다는 것은 지능뿐만 아니라 존재감을 개발하는 것을 의미했습니다. 하오는 OpenAI의 내부 팀이 제품 및 연구 영역 전반에 걸쳐 이러한 꿈을 추구해 왔다고 언급했습니다.

"모델에 메모리, 지속성 및 자율성을 제공하지 않으면 이러한 종류의 어시스턴트를 구축할 수 없습니다."라고 하오는 말합니다.

하지만 에이전트를 진정으로 효과적으로 만들려면 OpenAI에 알고리즘 이상의 것이 필요했습니다. 새로운 종류의 데이터와 이를 수집할 새로운 방법이 필요했습니다. 한때 풍부한 학습 데이터 소스였던 인터넷은 이제 합성 콘텐츠로 포화 상태가 되었습니다. 현재 온라인에서 볼 수 있는 문서 중 상당수는 이전 모델을 통해 생성되었습니다.

이로 인해 온라인 학습의 가치가 점점 더 떨어지는 피드백 루프가 생성됩니다. 이 루프를 깨기 위해, 기업들은 더 친밀한 데이터 수집 방식으로 눈을 돌리고 있 하오는 OpenAI가 모바일 상호 작용부터 음성 대화 및 환경적 맥락에 이르기까지 실시간 사용자 행동을 포착할 수 있는 맞춤형 디바이스를 모색하고 있다고 보고했습니다.

"온라인에는 AI가 생성한 콘텐츠가 너무 많습니다."라고 하오는 말합니다. "고품질 데이터를 원한다면 사람들로부터 직접 데이터를 얻어야 합니다."

하오는 AI가 생성한 콘텐츠의 홍수가 커져 가면서 동의, 감시 및 제어에 대한 어려운 질문이 제기된다고 말합니다. 사람들이 진정으로 자신의 데이터가 수집되지 않도록 선택할 수 있을까요? 그리고 사람들이 자신의 말, 이미지, 행동을 학습한 모델에 대해 어떤 발언권을 가질 수 있을까요?

하오에게 해답은 기술에 대한 낙관주의나 종말론이 아니라 투명성에 있습니다. 하오는 자신이 '부머(boomer)'라고 부르는 인공 지능이 인류를 구원할 것이라고 믿는 사람들 또는 '두머(doomer)라고 부르는 인공 지능이 인류를 파괴할 것이라고 믿는 사람들과 같은 AI의 지배적인 이데올로기에 동의하지 않습니다.

"저는 책임감 진영에 속해 있습니다." 하오는 말합니다. "이러한 시스템은 제도적 권력을 담고 있습니다. 우리는 이것들이 어떻게 만들어지고 누가 혜택을 받는지 알아야 합니다."

기업은 모델을 테스트하는 방법, 사용하는 데이터, 결과를 이해하는 방법을 설명해야 한다고 하오는 말합니다. 실수를 추적하고 발견한 내용을 공유하여 다른 사람들이 더 자세히 살펴볼 수 있도록 해야 합니다.

하오는 이러한 개방성이 없다면 AI는 강력하지만 책임지지 않는 독점적인 블랙박스가 될 위험이 있다고 경고합니다.