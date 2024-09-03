2023년 봄, 인공지능(AI) 분야에서 꽤 오랜 시간이 지난 시점에, Goldman Sachs는 생성형 AI의 등장으로 전 세계 GDP가 매년 7%씩 증가할 수 있으며, 이는 매년 미화 7조 달러 이상의 추가 증가에 이를 수 있다고 추정하는 보고서를 발표했습니다.
생성형 AI는 어떻게 이를 달성할 수 있을까요? 이 기술의 응용 분야는 다양하지만, 일반적으로 인간과 기계 간 커뮤니케이션 효율성을 향상시키는 것으로 설명될 수 있습니다. 이러한 개선은 하위 수준의 작업을 자동화하고 인간의 능력을 강화하여 작업자가 더 높은 숙련도로 더 많은 성과를 달성할 수 있게 합니다.
생성형 AI는 적용 범위가 넓고 복잡하기 때문에, 많은 언론 보도를 통해 독자들은 생성형 AI가 거의 마법 같은 만병통치약이라고 믿게 될 수 있습니다. 실제로, 이 관점은 2022년 ChatGPT와 기타 툴의 출시에 따라 생성형 AI가 대중화되면서 생성형 AI를 둘러싼 많은 보도에서 특징적으로 나타났으며, 일부 분석가들은 우리가 업무의 미래를 재구성할 혁명을 목전에 두고 있다고 예측하기도 했습니다.
2년이 지나지 않아 생성형 AI에 대한 언론의 열기는 조금 식었습니다. 6월에 Goldman Sachs는 생성형 AI의 이점이 개발에 대한 1조 달러 투자를 정당화할 수 있는지에 대한 보다 신중한 평가가 포함된 또 다른 보고서를 발표했습니다. Financial Times 등 여러 매체에서도 비슷한 회의적인 시각을 담은 사설을 게재했습니다. IBM Think Newsletter 팀은 이전 게시물에서 이러한 불확실성 중 일부를 요약하고 이에 답변했습니다.
이후 주식 시장의 변동으로 인해 여러 분석가들은 'AI 버블'이 곧 터질 것이며 90년대 닷컴 붕괴와 같은 규모의 시장 조정이 뒤따를 수 있다고 선언했습니다.
생성형 AI에 대한 미디어의 회의론은 개발자가 직면한 네 가지 주요 위기로 대략 나눌 수 있습니다.
이는 심각한 장애물이지만, 많은 사람들은 마지막 문제(사용 사례)를 해결하면 나머지 세 문제도 해결하는 데 도움이 될 것이라고 낙관합니다. 좋은 소식은, 이미 의미 있는 사용 사례들을 식별하고 작업하고 있다는 점입니다.
IBM의 저명한 엔지니어인 크리스 헤이(Chris Hay)는 "생성형 AI는 우리 자신과 고객에게 뚜렷하고 측정 가능한 영향을 미치며, 근본적으로 우리의 업무 방식을 변화시키고 있다."고 말합니다. “이는 브랜드 콘텐츠를 통한 HR 프로세스 혁신과 마케팅 혁신부터 문의 센터 또는 소프트웨어 개발에 이르기까지 모든 산업 및 분야에 걸쳐 있습니다.” 헤이는 우리가 종종 과열 시기에 뒤이은 시정 단계에 있으며, 아마도 최근 언론의 비관주의는 돌이켜 보면 이전의 과장된 기대처럼 보이는 발언과 균형을 맞추려는 시도로 볼 수 있다고 말합니다.
"저는 그런 분석가가 되고 싶지는 않습니다."라고 헤이는 최근 AI의 미래에 대한 암울한 전망을 언급하며 말합니다. "저는 'AI가 앞으로 10년 동안은 아무 쓸모도 없을 것입니다'라고 말하는 사람이 되고 싶지는 않습니다. 그런 말을 하면 평생 인용되고 기억될 테니까요."
이러한 주장은 초기 인터넷이 그다지 중요하지 않을 것이라는 주장이나 1943년 IBM 창립자 Thomas Watson이 세상에 컴퓨터가 5대 이상 필요하지 않을 것이라고 추측한 것처럼 근시안적인 것으로 판명될 수 있습니다. Hay는 미디어가 종종 생성형 AI를 ChatGPT와 같은 LLM 기반 챗봇의 좁은 적용 범위와 혼동하는 것도 문제 중 하나라고 주장하며, 이러한 챗봇들은 실제로 기업이 직면한 모든 문제를 해결할 수 있도록 설계된 것은 아닐 수 있다고 말합니다.
데이터, 컴퓨팅, 전력 등 공급 병목 현상이 발생하기 시작하면 엔지니어들이 창의력을 발휘하여 이러한 장애물을 해결할 수 있을 것이라고 헤이는 믿습니다.
"풍부한 것을 가지고 있으면 소비하게 됩니다."라고 Hay는 말합니다. "수십만 대의 GPU가 있다면 이를 사용하게 될 것입니다. 하지만 제약이 있을 때 더 창의적이 될 수 있습니다."
예를 들어 합성 데이터는 데이터 위기를 해결할 수 있는 유망한 방법입니다. 이 데이터는 실제 데이터의 특성을 모방하기 위해 알고리즘 방식으로 생성되며, 실제 데이터의 대체 또는 보완 역할을 할 수 있습니다. 머신 러닝 엔지니어는 합성 데이터의 남용에 주의해야 하지만, 하이브리드 접근 방식은 단기적으로 실제 데이터의 부족을 극복하는 데 도움이 될 수 있습니다. 예를 들어, 최근 Microsoft PHI-3.5 모델 또는 Hugging Face SMOL 모델은 상당한 양의 합성 데이터로 학습되었으며, 그 결과 성능이 뛰어난 소형 모델이 탄생했습니다.
오늘날의 LLM은 전력을 많이 소비하지만, 현재의 트랜스포머가 최종 아키텍처라고 믿을 이유는 거의 없습니다. Mistral Codestral Mamba, Jamba 1.5 또는 Falcon Mamba 1.5와 같은 SSM 기반 모델은 향상된 컨텍스트 길이 기능으로 인기를 얻고 있습니다. 여러 유형의 모델을 사용하는 하이브리드 아키텍처도 주목을 받고 있습니다. 엔지니어들은 아키텍처 외에도 양자화, 추론을 위해 특별히 설계된 칩, 특정 사용 사례에 맞게 사전 학습된 모델을 조정하는 딥 러닝 기술인 미세 조정과 같은 다른 방법에서도 가치를 찾고 있습니다.
"저는 업계에서 사전 학습보다는 미세 조정에 관한 커뮤니티가 더 많아졌으면 합니다."라고 Hay는 말합니다. "사전 학습은 이 프로세스에서 가장 비용이 많이 드는 부분입니다. 미세 조정은 훨씬 저렴하며 잠재적으로 훨씬 더 큰 가치를 얻을 수 있습니다."
헤이는 기술이 훨씬 더 효율적이 되었기 때문에 미래에는 우리가 처리할 수 있는 것보다 더 많은 GPU를 갖게 될 것이라고 말합니다. 헤이는 최근 개인용 노트북을 모델을 학습할 수 있는 머신으로 전환하는 실험을 했습니다. 현재 보다 효율적인 데이터 파이프라인을 재구축하고 일괄 처리를 수정함으로써 한계 내에서 작업할 수 있는 방법을 모색하고 있습니다. 헤이는 당연히 값비싼 H100 Tensor Core GPU에서 이 모든 작업을 수행할 수 있었지만, 자원 희소성에 대비한 사고 방식 덕분에 원하는 결과를 얻을 수 있는 더 효율적인 방법을 찾을 수 있었습니다. 필요는 발명의 어머니였습니다.
모델은 점점 더 작아지고 강력해지고 있습니다.
"오늘날의 소형 모델을 보면 작년의 대형 모델보다 더 많은 토큰으로 학습되어있습니다."라고 헤이는 말합니다. "사람들은 더 작은 모델에 더 많은 토큰을 채우고 있으며, 이러한 모델은 더 효율적이고 빨라지고 있습니다."
“실제 비즈니스 문제를 해결하기 위해 AI를 적용할 때 이러한 특수 모델이 더욱 중요해지고 있다는 사실을 발견하게 됩니다.”라고 IBM의 기술, 데이터 및 AI 전략 글로벌 책임자인 Brent Smolinksi는 말합니다. 여기에는 소위 소규모 언어 모델과 좁은 데이터 집합을 필요로 하는 예측 모델과 같은 비생성 모델이 포함됩니다. 이러한 상황에서는 데이터의 양보다 질이 더 중요한 경우가 많습니다. 또한 이러한 특수 모델은 전력 소비가 적고 제어하기가 더 쉽습니다.
스모링크시(Smolinksi)는 "보다 계산 효율적인 알고리즘을 개발하기 위해 많은 연구가 진행되고 있습니다."라고 덧붙입니다. 더 효율적인 모델은 제안된 네 가지 위기를 모두 해결합니다. 더 적은 데이터, 전력, 계산 자원을 소비하고, 더 빠르기 때문에 새로운 사용 사례가 가능해집니다.
"LLM은 대화형 인터페이스가 매우 자연스럽고, 더 많은 데이터를 입력할수록 대화가 더욱 자연스러워진다는 점에서 훌륭합니다."라고 스모링크시는 말합니다. “하지만 이러한 LLM은 좁은 영역이나 문제의 맥락에서 할루시네이션의 대상이 되며, 이는 실질적인 문제입니다. 따라서 고객은 작은 언어 모델을 선택하는 경우가 많으며, 인터페이스가 완벽하게 자연스럽지 않더라도 특정 문제에 대해서는 그럴 필요가 없으니 괜찮습니다."
생성형 AI가 만병통치약은 아니지만, 강력한 도구는 될 수 있습니다. 에이전트 워크플로란 LLM과 AI 에이전트를 사용하여 작업을 수행하는 다단계 접근 방식을 말합니다. 이러한 에이전트는 어느 정도의 독립성과 의사 결정 능력을 갖추고 데이터, 시스템, 때로는 사람과 상호 작용하여 할당된 작업을 완료합니다. 전문 에이전트는 특정 업무나 전문 분야를 처리하도록 설계되어 LLM에게 부족한 심층적인 지식과 경험을 제공할 수 있습니다. 이러한 에이전트는 보다 전문화된 데이터를 활용하거나 도메인별 알고리즘과 모델을 통합할 수 있습니다.
LLM이 조율하는 에이전트 워크플로가 고객 지원 문의를 효율적으로 관리하는 통신 회사를 상상해 보세요. 고객이 요청을 제출하면 LLM은 문의를 처리하고 문제를 분류하며 특정 에이전트가 다양한 작업을 처리하도록 트리거합니다. 예를 들어, 한 에이전트는 고객의 계정 세부 정보를 검색하고 제공된 정보를 확인하는 동안 다른 에이전트는 네트워크 확인 또는 청구 불일치 검사와 같은 문제를 진단합니다.
문제가 확인되면 제3의 에이전트가 장비 재설정, 환불 제공, 기술자 방문 예약 등 해결책을 수립합니다. 그런 다음 LLM은 커뮤니케이션 에이전트가 고객에게 개인화된 답변을 생성하도록 지원하여 메시지가 명확하고 회사의 브랜드 보이스와 일관성을 유지하도록 돕습니다. 문제가 해결된 후에는 상담원이 고객 피드백을 수집하여 만족도를 파악하는 피드백 루프가 시작됩니다. 고객이 만족하지 못하는 경우 LLM은 피드백을 검토하고 상담원의 전화와 같은 다른 후속 조치를 취할 수 있습니다.
LLM은 다재다능하지만, 깊은 도메인 전문 지식이나 전문 지식이 필요한 작업, 특히 이러한 작업이 LLM의 학습 데이터에 속하지 않는 경우 어려움을 겪을 수 있습니다. 또한 속도가 느리고 동적인 환경에서 실시간 의사 결정을 내리는 데 적합하지 않습니다. 반면 에이전트는 더 간단한 의사 결정 알고리즘을 사용하여 실시간으로 자율적이고 능동적으로 운영할 수 있습니다.
에이전트는 대규모 모놀리식 LLM과 달리 환경에서 학습하고 환경에 적응하도록 설계될 수도 있습니다. 강화 학습 또는 피드백 루프를 사용하여 이전 작업의 성공 또는 실패에 따라 전략을 조정해 시간이 지남에 따라 성능을 개선할 수 있습니다. 에이전트 워크플로 자체가 새로운 데이터를 생성하며, 이 데이터는 이후 추가 학습에 사용될 수 있습니다.
이 시나리오는 LLM이 비즈니스 문제를 해결하는 데 유용한 부분이지만, 전체 솔루션이 아니라는 점을 강조합니다. 이는 좋은 소식입니다. LLM이 종종 가치 사슬에서 가장 비용이 많이 드는 부분이기 때문입니다.
Smolinksi는 사람들이 새로운 기술에 열광할 때 종종 극단으로 치닫는다고 주장합니다. 새로운 기술이 세상을 바꿀 것이라고 생각하지만, 실제로 그렇게 하지 못하면 지나치게 비관적이 될 수 있습니다.
"저는 그 중간 어딘가에 답이 있다고 생각합니다."라고 말하며, AI는 비즈니스 문제를 해결하기 위한 보다 광범위한 전략의 일부가 되어야 한다고 주장합니다. "보통 AI가 단독으로 작동하는 경우는 거의 없으며, 설령 그렇다 하더라도 여러 종류의 AI 모델들을 동시에 적용하여 문제를 해결하는 경우가 많습니다. 하지만 문제부터 시작해야 합니다. 의사 결정 능력에 실질적인 영향을 미쳐 결국 실질적인 재무적 영향을 초래할 수 있는 AI 애플리케이션이 있다면, 그 분야에 집중한 후 적절한 기술과 AI를 적용하는 방법을 찾아야 합니다. LLM뿐만 아니라 사용 가능한 모든 도구를 포함한 전체 툴킷을 활용해야 합니다.”
소위 '사용 사례 위기'에 관해서, 헤이는 이러한 모델의 비용을 정당화하는 훨씬 더 매력적인 사용 사례가 등장할 것이라고 확신합니다.
“기술이 완벽해질 때까지 기다렸다가 모든 것이 정상화되고 나서야 시장에 진입하는 것도 좋은 방법이 될 수 있습니다.”라고 그는 말합니다. “저는 그런 기회를 잡을 수 있을지 확신할 수 없습니다.”