생성형 모델이란?

작성자

Staff writer

생성형 모델이란 무엇인가요?

생성형 모델은 학습 데이터와 유사한 새 데이터를 생성하도록 설계된 머신 러닝 모델입니다. 생성형 인공 지능(AI) 모델은 학습 데이터의 패턴과 분포를 학습한 다음, 이러한 이해를 적용하여 새로운 인풋 데이터에 대한 응답으로 새로운 콘텐츠를 생성합니다.

콘텐츠를 생성하는 행위는 생성형 AI 모델이 다른 유형의 AI와 구분되는 특징입니다. 생성형 모델은 인간 뇌의 구조를 모방하고 복잡한 머신 러닝 알고리즘을 적용하여 학습 데이터를 처리하고 새로운 아웃풋을 생성하는 고급 신경망입니다.

생성형 AI 모델과 그 개발자들은 지난 몇 년 동안 주로 AI 시대 정신을 주도해 왔습니다. 생성형 AI 모델은 여전히 AI 관련 뉴스 보도의 대부분을 차지하고 있으며 상당한 관심과 투자를 받고 있습니다.

생성형 AI란 무엇인가요?

생성형 AI는 정교한 모델을 사용하여 인풋 프롬프트에 따라 새로운 콘텐츠를 생성하는 AI 유형입니다. 생성형 모델은 생성형 AI의 실행을 용이하게 하기 위해 데이터와 알고리즘을 사용하는 컴퓨터 프로그램입니다. 생성형 AI 사용 사례에는 텍스트 요약, 텍스트 생성, 이미지 생성, 3D 모델링 및 오디오 제작이 있습니다.

생성형 모델은 어떻게 작동하나요?

생성형 모델은 학습 데이터에서 패턴과 분포를 식별한 다음 이러한 결과를 사용자 인풋을 기반으로 새로운 데이터 생성에 적용하는 방식으로 작동합니다. 학습 프로세스를 통해 모델은 학습 데이터 세트 내 특징의 결합 확률 분포를 인식합니다. 그런 다음 학습한 내용을 바탕으로 학습 데이터와 유사한 새 데이터 샘플을 생성합니다.

생성형 모델은 일반적으로 비지도 학습 기법으로 학습하는데, 레이블이 지정되지 않은 대량의 데이터를 제공받아 스스로 분류하는 방식으로 이루어집니다. 모델은 데이터의 분포를 파악하여 내부 논리를 형성하고 새 데이터를 생성하는 데 이를 사용합니다.

학습 중에 모델은 손실 함수를 적용하여 실제 결과와 모델의 예측 사이의 차이를 측정합니다. 학습의 목표는 손실 함수를 최소화하여 생성된 아웃풋을 가능한 한 현실에 가깝게 만드는 것입니다.

콘텐츠 생성은 확률적 프로세스입니다. 생성형 모델은 사람과 같은 방식으로 사물을 인지하지 못합니다. 오히려 생성형 모델은 학습한 규칙을 기반으로 복잡한 수학 방정식을 사용하여 가장 가능성이 높은 아웃풋을 예측합니다.

생성형 모델과 다른 모델 유형 비교

생성형 모델은 특정 클래스의 새 데이터를 생성하려고 시도합니다. 판별 모델은 항목을 알려진 그룹으로 분리하는 반면, 클러스터링 모델은 항목을 데이터 세트에 그룹화하는 방법을 알아냅니다. 예측 모델은 과거 데이터를 기반으로 향후 발생 또는 상태를 추정합니다.

판별 모델은 데이터의 레이블이나 카테고리가 알려진 지도 학습 작업에서 사용됩니다. 많은 판별 모델은 특징과 레이블 간의 관계를 식별한 다음, 해당 레이블의 조건부 확률에 따라 새 데이터에 클래스 레이블을 할당하는 분류기입니다.

예를 들어, 물고기와 새의 이미지를 구별하도록 학습한 판별 모델은 이미지가 물고기인지 새인지를 추측할 수 있습니다. 머신 러닝의 한 분류 유형인 이미지 인식은 판별 모델의 일반적인 애플리케이션입니다.

생성형 모델과 판별 모델은 뚜렷한 차이가 있지만 생성적 적대적 네트워크(GAN)에서처럼 함께 작동하는 경우가 많습니다.

클러스터링 모델은 비지도 학습 작업에서 데이터 세트 내의 레코드를 클러스터로 그룹화하는 데 사용됩니다. 유사한 항목을 식별할 수 있으며 해당 항목을 데이터 세트의 다른 그룹과 구분하는 요소도 학습할 수 있습니다.

클러스터링 모델에는 데이터 세트의 항목에 대한 사전 지식이 없으며 얼마나 많은 그룹이 있을 수 있는지도 알지 못합니다. 시장 조사자는 대상 인구 통계 내에서 구매자 페르소나를 파악하기 위해 클러스터링 모델을 사용할 수 있습니다.

예측 모델은 머신 러닝 및 통계 분석을 통해 과거 데이터를 처리하여 미래 이벤트를 예측합니다. 비즈니스 리더가 데이터 기반 의사 결정을 내리는 데 도움이 되는 경우가 많습니다. 예측 모델은 또한 예측 텍스트 서비스, 얼굴 인식 소프트웨어, 사기 탐지 및 공급망 관리 솔루션을 지원합니다.

생성형 모델에는 학습 중에 레이블이 지정되지 않은 데이터가 제공됩니다. 이 모델은 분류 기준을 리버스 엔지니어링합니다. 특정 레이블에 대해 해당 레이블을 받게 되는 데이터 포인트의 특징은 무엇일까요? 생성형 모델은 이러한 레이블의 특징을 예측한 다음, 이 특징을 사용하여 해당 데이터의 새로운 예를 생성하려고 합니다.

동물의 이미지를 생성하도록 학습한 생성형 모델은 다른 동물과 구분되는 물고기의 특징을 판단하여 물고기의 이미지를 생성하려고 합니다. 이미지 생성은 생성형 모델이 자주 사용되는 사례입니다.

전문가가 전하는 최신 AI 트렌드

가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.

생성형 모델의 유형

다양한 유형의 생성형 모델이 존재하며 각각 고유한 정의 아키텍처, 즉 작동 방식을 지배하는 모델 구조가 있습니다. 딥 생성형 모델은 데이터 세트 내 데이터 포인트 간의 복잡하고 다면적인 관계를 이해하기 위해 다층 딥 러닝 신경망 구조를 사용하는 생성형 모델의 하위 유형입니다.

자기회귀 모델은 이전 데이터 인스턴스를 기반으로 시퀀스의 다음 데이터 포인트를 예측합니다. 트랜스포머는 컨텍스트 처리 능력이 향상되어 자연어 처리(NLP) 작업에 탁월합니다.

확산 모델은 데이터 세트에 점진적으로 노이즈를 추가한 다음, 노이즈를 제거하고 새로운 아웃풋을 산출하는 방법을 알아내어 새로운 데이터를 생성합니다.

생성적 적대적 네트워크(GAN)는 서로 경쟁하는 판별 모델과 생성형 모델을 함께 쌍으로 구성하며, 생성기가 판별기를 속이는 아웃풋을 생성하는 것을 목표로 합니다.

변이형 오토인코더(VAE)는 인코더로 인풋 데이터를 압축한 다음, 디코더로 프로세스를 역으로 수행하여 새로운 유사한 데이터를 생성합니다.

흐름 기반 모델은 가역적인 수학 연산을 통해 데이터의 단순 분포와 복잡한 분포 간의 관계를 학습합니다.

자기회귀 모델

자기회귀 모델은 이전 항목을 기반으로 시퀀스의 다음 항목을 예측합니다. 이 모델은 시퀀스의 구성 요소를 평가하여 구성 요소 간의 확률적 상관 관계를 결정한 다음, 해당 정보를 사용하여 뒤따를 가능성이 있는 새로운 구성 요소를 식별합니다.

자기회귀는 선형 회귀의 한 유형으로, 1개 이상의 변수 값을 기반으로 변수 값을 예측하는 통계 기법입니다. 자기회귀는 대상 변수에 초점을 맞추지만 시간 경과에 따른 값을 고려합니다. 자기회귀는 정의된 값을 예측하는 반면 로지스틱 회귀는 지정된 이벤트가 발생할 확률을 백분율로 산출한다는 점에서 차이가 있습니다.

자기회귀 모델은 순환 신경망(RNN) 또는 트랜스포머 아키텍처의 형태를 취합니다.

트랜스포머 모델

2017년에 처음 등장한¹ 트랜스포머 모델은 그때까지 자기회귀 모델의 선두 형태였던 RNN을 빠르게 능가했습니다. 트랜스포머는 몇 가지 눈에 띄는 RNN 약점을 해결했습니다. RNN은 장거리 종속성(시퀀스에서 거리 항목 간의 관계)을 포착하기가 어려웠고 항목을 하나씩 순차적으로 처리했기 때문에 컴퓨팅이 비효율적이었습니다.

트랜스포머는 2가지 혁신에 힘입어 RNN을 뛰어넘는 아키텍처로 도약하고 생성형 AI의 대규모 언어 모델(LLM)을 위한 사실상의 표준으로 자리 잡았습니다.

병렬 처리: 트랜스포머는 시퀀스의 모든 항목을 동시에 처리하므로 순차적 RNN에 비해 효율성이 향상됩니다. 트랜스포머는 특히 최고의 LLM 성능에 필요한 대규모 데이터 세트를 훨씬 짧은 시간에 학습할 수 있습니다.

셀프 어텐션 메커니즘: 트랜스포머는 항목을 처리할 때 시퀀스에 있는 모든 항목의 상대적 중요도를 고려할 수 있습니다. 셀프 어텐션을 통해 트랜스포머는 시리즈에서 멀리 떨어진 항목 간의 주요 관계를 포착할 수 있으므로 RNN에 부족했던 컨텍스트 이해가 가능합니다. 대규모 인풋 시퀀스에서 컨텍스트를 처리하는 능력 때문에 트랜스포머는 텍스트 생성 및 언어 번역과 같은 NLP 작업에서 탁월한 능력을 발휘할 수 있습니다.

트랜스포머 모델의 3가지 유형인 인코더, 디코더, 인코더-디코더 중 후자의 2가지에는 자기회귀 구성 요소가 포함되어 있습니다. 디코더는 생성 구성 요소이며, 자기회귀를 사용하여 이전에 생성된 토큰의 정보를 기반으로 하는 토큰을 생성합니다.

자기 회귀 모델 사용 사례

자기회귀 모델, 특히 트랜스포머는 오늘날 널리 사용되고 있습니다. OpenAI의 GPT 및 GPT-4o, Anthropic의 Claude, Meta의 Llama, Google의 Gemini, IBM의 Granite 등 주요 생성형 AI 모델 중 다수가 트랜스포머입니다.

자기회귀 모델 사용 사례는 다음과 같습니다.

자연어 처리: 트랜스포머는 복잡한 자연어 쿼리를 처리하고 자동화된 텍스트 생성을 통해 대화형으로 응답할 수 있으므로 챗봇으로 사용하기에 적합합니다. 예를 들어, ChatGPT는 OpenAI의 GPT 생성형 모델을 구현한 챗봇입니다. 다른 NLP 응용 분야에는 감정 분석, 음성 인식, 텍스트 음성 변환(TTS) 애플리케이션 및 문서 요약이 있습니다.

코딩 지원: 트랜스포머는 자기회귀 기능을 통해 텍스트 생성에 탁월한 능력을 발휘하는 것과 마찬가지로, 자기회귀 기능을 통해 코드를 디버그하고 코드 조각을 생성할 수도 있습니다.

시계열 예측: 자기회귀는 모델이 이전 추세를 기반으로 미래 값을 예측하는 시계열 예측에 쉽게 적용할 수 있습니다. 시계열 예측은 재무 모델링, 시장 예측 및 일기 예보에 자주 사용됩니다.

강화 학습: 트랜스포머는 자율적 의사 결정을 가르치는 머신 러닝 학습 기술인 강화 학습에서 사용되기 시작했습니다. 트랜스포머는 분류 작업에도 적용되고 있습니다.

확산 모델

확산 모델은 노이즈를 추가하여 인풋 데이터를 점진적으로 난독화하거나 확산한 다음, 생성된 혼란을 유사한 새로운 데이터로 정제합니다. 노이즈를 학습 데이터 세트와 유사한 데이터로 정제하는 방법을 학습하여 새로운 데이터를 생성합니다. 확산 모델은 3단계 프로세스를 통해 작동합니다.

1단계: 확산: 학습하는 동안 모델은 데이터를 더 이상 인식할 수 없을 때까지 인풋 데이터에 점진적으로 노이즈를 추가합니다. 이 모델은 마르코프 체인(Markov chain)으로 알려진 수학적 과정의 각 단계에서 데이터에 소량의 가우스 노이즈를 추가합니다.

확산 과정은 기타리스트가 앰프의 게인 노브를 천천히 올려 기타 소리가 완전한 노이즈가 되도록 하는 것과 유사합니다. 대체로 이 정도까지는 아니지만 록 기타리스트는 이러한 방법으로 음악에서 왜곡된 사운드를 얻습니다.

2단계: 학습: 모델은 현재 파괴되어 있는 데이터의 진화를 추적하여 노이즈 프로세스를 통해 데이터가 어떻게 변경되었는지 파악합니다. 확산 모델은 노이즈가 발생하는 각 단계에서 이 과정을 반복합니다.

3단계: 역확산: 확산 모델은 노이즈가 데이터를 어떻게 변화시키는지 파악함으로써 노이즈 프로세스를 역으로 수행하고 인풋 데이터를 재구성하는 방법을 학습합니다. 역확산의 목표는 마르코프 체인을 통해 역방향으로 이동하여 순수한 데이터만 남을 때까지 가우스 노이즈를 제거하는 것입니다. 1단계의 기타리스트가 밴드 동료들로부터 따끔한 충고를 듣고 게인을 다시 허용 가능한 수준으로 낮추는 것입니다.

1단계와 2단계는 확산 모델을 학습시키는 데 적용됩니다. 학습 후 확산 모델은 사용자의 프롬프트에서 요청된 데이터를 '찾기' 위해 랜덤 노이즈를 역확산하여 데이터를 생성합니다.

확산 모델 사용 사례

확산 모델은 이미지 생성에 자주 사용되며 그 외에도 두드러진 사용 사례가 있습니다. 확산 모델 응용 분야는 다음과 같습니다.

이미지 생성: 확산 모델은 Midjourney, Stable Diffusion, OpenAI의 DALL-E 2와 같은 주류 이미지 생성 및 이미지 합성 툴을 지원합니다.이러한 모델은 사용자 프롬프트에 대한 응답으로 이미지를 생성합니다. 확산 모델은 사람의 얼굴을 포함한 사실적인 고품질 이미지를 생성할 수 있습니다.

미국 저작권청(US Copyright Office)은 2023년에 AI가 생성한 이미지는 저작권 보호를 받을 자격이 없다고 판결했습니다. 한편, 현재 진행 중인 수많은 소송²을 통해 AI가 생성한 이미지가 저작권 위반에 해당하는지 여부가 결정될 예정입니다.

인페인팅과 아웃페인팅: 인페인팅은 이미지 내의 콘텐츠를 추가하거나 제거하는 프로세스인 반면, 아웃페인팅은 이미지를 원래 테두리 너머로 확장합니다.

3D 모델링: Google의 DreamFusion과 NVIDIA의 Magic3D는 텍스트 인풋으로 3D 모델을 만드는 확산 모델입니다.

시장 조사: 확산 모델은 시간이 지남에 따라 사물이 어떻게 진화하는지 보여주기 때문에 소비자가 제품에 어떻게 반응하는지 이해하는 데 유용합니다.

이상 징후 탐지: 확산 모델은 데이터가 시간이 지남에 따라 어떻게 변화하는지 학습할 수 있기 때문에 데이터 포인트가 기존 추세에 맞지 않는 경우를 식별할 수 있습니다. 이상 징후 탐지 애플리케이션에는 사이버 보안, 사기 방지 및 질병 탐지가 포함됩니다.

생성적 적대적 네트워크(GAN)

2014년에 도입된 생성적 적대적 네트워크(GAN)는 경쟁하는 두 모델을 함께 결합하는 최초의 생성형 AI 모델 유형 중 하나입니다. 생성형 모델은 아웃풋을 생성하고 판별기 모델은 이것이 진짜인지 아니면 가짜인지 판단합니다. 경쟁의 목적은 생성기가 생성한 콘텐츠를 판별기가 진짜로 간주하도록 하는 것입니다.

생성기가 예술품 위조자라면 판별기는 예술품 진품 감별사입니다. 미술품 딜러가 위조된 작품을 입수하여 박물관에 판매를 시도할 수 있지만, 이를 위해서는 먼저 작품이 인증을 통과해야 합니다. 위조자가 대가들의 작품을 모방하는 데 능숙해지면 진품 감별사는 이후의 위조품을 감지하는 데 어려움을 겪을 것입니다. 얼마 지나지 않아 박물관은 위작으로 가득 찬 전시회를 개최하게 됩니다.

사실적인 아웃풋을 만드는 동일한 학습 프로세스가 모드 붕괴로 이어질 수도 있습니다. 즉, 생성기가 일부 학습 데이터를 생략하고 좁은 범위의 샘플 유형으로 제한하는 것입니다. GAN은 물론 확산 모델 및 트랜스포머도 효과적인 성능을 위해 대량의 학습 데이터 세트를 필요로 합니다.

GAN의 두 네트워크는 모두 콘볼루션 신경망(CNN)인 경우가 많습니다. 콘볼루션 신경망은 컴퓨팅 비전 작업에서 강력한 성능을 보이는 것으로 유명한 신경망의 초기 유형입니다.

GAN 사용 사례

GAN은 주로 컴퓨팅 비전 분야와 기타 그래픽 관련 작업에 사용됩니다.

컴퓨팅 비전: 컴퓨팅 비전은 머신 러닝을 사용하여 이미지의 정보를 처리하는 것입니다. 일반적인 컴퓨팅 비전 작업에는 객체 감지 및 분류, 얼굴 인식, 수화 번역 및 객체 추적이 있습니다.

이미지 생성: GAN은 사실적인 이미지를 생성할 때 확산 모델보다 성능이 뛰어날 수 있습니다. 확산 모델은 더 세밀한 제어와 다양한 기능, 안정성을 제공하지만, GAN은 학습 시간이 더 짧고 컴퓨팅 효율이 더 높습니다. Diffusion-GAN 프레임워크³는 두 모델 유형의 이점을 극대화하기 위해 확산으로 GAN을 학습시킵니다.

이상 징후 탐지: 정상적인 데이터 세트를 생성하도록 학습한 GAN을 이상 징후 탐지 작업에 적용할 수 있습니다. GAN은 실제 데이터를 기반으로 모델링된 합성 데이터 세트를 생성하며, 이 두 가지를 비교하면 실제 데이터의 이상 징후가 드러납니다. 판별기는 특정 데이터 포인트가 가짜일 가능성이 높다고 선언하여 이상 징후를 감지할 수도 있습니다.

데이터 증강: 데이터 증강(기존 데이터를 사용하여 더 많은 데이터 샘플 생성)은 CNN을 사용하여 컴퓨팅 비전 성능을 더욱 높일 수 있습니다. 이 프로세스는 무언가를 처음부터 새로 생성하는 것이 아니라 실제 데이터를 확장한다는 점에서 합성 데이터와 다릅니다.

데이터 증강의 예

변이형 오토인코더(VAE)

변이형 오토인코더(VAE)는 인풋 데이터를 압축한 다음 해당 압축을 확장하거나 디코딩하여 새로운 유사 데이터를 생성합니다. VAE는 학습 데이터 세트의 분포를 학습하고 인코딩된 샘플에서 새 데이터를 생성할 때 이러한 기대치를 적용합니다. 모든 오토인코더와 마찬가지로 VAE는 엔코더와 디코더의 2가지 구성 요소로 구성됩니다.

인코더의 역할은 데이터 세트의 잠재 변수를 학습하는 것입니다. 잠재 변수는 직접 관찰할 수 없지만 데이터 배포에서 중요한 역할을 합니다. 잠재 공간은 데이터 세트의 모든 잠재 변수에 대한 집합적인 이름입니다. 인코더는 데이터를 정확하게 재구성하는 데 필요한 정보를 캡처하는 방식으로 잠재 공간을 모델링합니다. 다른 모든 변수는 생략됩니다.

디코더는 병목 현상이라고 하는 데이터의 압축된 표현을 가져와서 데이터의 원래 형태로 다시 추정합니다. 효과적인 디코더는 미리 압축된 원본 데이터와 유사한 아웃풋을 생성합니다.

VAE 사용 사례

VAE는 확산 모델 및 GAN에 비해 이미지 생성 작업에 어려움이 있지만 다른 영역에서는 탁월합니다.

이미지 생성: VAE는 이미지 생성에 사용되지만 주류 이미지 생성 애플리케이션에서는 확산 모델이 이를 널리 대체하고 있습니다. 다른 이미지 생성기에 비해 VAE는 잠재 공간의 '평균화'로 인해 더 흐릿한 이미지를 생성하는 경향이 있습니다.

유전체학: VAE는 유전학자가 번식 가치(동물이 자손에게 제공할 예상 가치)를 계산하고 질병 위험 점수를 할당하는 데 도움이 됩니다.

이상 징후 탐지: VAE는 GAN과 디퓨저보다 학습이 더 용이하고 비용이 낮기 때문에 이상 징후 탐지 작업에 적합합니다. 재생성된 데이터를 원래 데이터와 비교하여 예측된 분포에서 벗어난 인스턴스를 격리합니다.

데이터 대체: VAE는 새 데이터를 생성하여 누락된 데이터를 대체하고 손상된 파일을 복원할 수 있습니다. 예를 들어 오디오 파일 지우기, 비디오 노이즈 제거, 의료 영상 등이 있습니다. VAE는 처음부터 새로 생성할 때 흐릿한 이미지를 생성하는 경향이 있지만, 이미지의 노이즈를 제거하여 기존의 흐릿한 이미지를 복원할 수 있습니다.

준지도 학습: VAE는 레이블이 불완전한 데이터 세트의 데이터 분포를 캡처하여 분류기를 학습시키는 데 도움이 됩니다. VAE는 데이터 증강을 수행하여 분류기를 위한 추가 학습 샘플을 생성할 수도 있습니다.

흐름 기반 모델

흐름 기반 모델은 일련의 반전 또는 가역적 수학적 변환을 통해 데이터 분포를 학습합니다. 데이터는 정규화 흐름이라고 하는 이 파이프라인을 통해 어느 방향으로든 손실 없이 진행될 수 있습니다. VAE와 GAN은 데이터 분포를 추정하는 반면, 흐름 기반 모델은 데이터 세트에 대한 확률 밀도 함수를 명시적으로 학습합니다.

특정 데이터 세트에서 확률 밀도 함수는 데이터가 어떻게 분포되는지를 설명합니다. 정규화 흐름은 대상 변수의 확률 밀도 함수가 식별될 때까지 단순 분포에서 복잡한 분포로 진행됩니다.

흐름 기반 모델은 초기 데이터 세트와 동일한 통계적 속성을 유지하는 새로운 데이터 샘플을 생성할 수 있습니다. 모든 생성형 모델링과 마찬가지로, 이 프로세스는 학습 데이터에서 샘플을 추출하고 복잡한 통계 수학을 적용하여 유사하면서도 새로운 결과를 도출한다는 개념을 기반으로 합니다.

흐름 기반 모델 사용 사례

흐름 기반 모델은 데이터 분포에 대한 정확한 평가가 가장 중요한 경우에 효과적입니다.

이미지 생성: 흐름 기반 모델이 이미지를 생성하는 방법은 정규화 흐름을 통해 무작위로 샘플링된 노이즈를 실행하여 깨끗한 이미지를 생성하는 것입니다. 2016년 주목할 만한 이미지 생성 모델인 PixelCNN은 변환 시퀀스에 자기회귀를 적용하여 이미지를 픽셀 단위로 모델링합니다.

정확한 밀도 추정: 밀도 추정은 관찰 가능한 데이터를 기반으로 데이터 세트의 확률 밀도 함수를 식별하는 과제입니다. 흐름 기반 모델은 복잡한 데이터 분포를 정확하게 나타낼 수 있지만 트랜스포머와 비교할 때 장기적인 종속성을 포착하는 데 어려움이 있습니다.

분자 그래프 생성: 흐름 기반 모델은 생성형 AI 모델에 의해 새로운 분자 구조를 그래프로 모델링하는 분자 그래프 생성에 사용됩니다. 분자 그래프 생성은 과학자와 엔지니어가 신약 및 물질을 발견하는 데 도움이 되는 중요한 툴입니다.

생성형 모델과 할루시네이션

종종 인상적인 결과를 만드는 동일한 프로세스가 생성형 모델의 할루시네이션을 일으켜, 잘못된 정보나 오해의 소지가 있는 정보를 산출하기도 합니다. 할루시네이션 또는 허구는 모델이 실제 세계에 존재하지 않는 학습 데이터 세트의 패턴을 인식할 때 발생합니다.

예를 들어, ChatGPT-4o mini에 "크레이머가 방글라데시로 가는 사인필드 에피소드는 무엇이지?"라는 질문을 던지자 다음과 같은 답변이 반환되었습니다.

크레이머는 사인필드의 145번째 에피소드인 'The Little Jerry'에서 방글라데시를 여행합니다. 이 드라마의 145번째 [sic] 에피소드로, 원래 시즌 8에서 방영되었습니다. 이 에피소드에서 크레이머는 방글라데시에서 장난감을 수입하려는 계획에 연루됩니다.

The Little Jerry는 사인필드의 145번째 에피소드로 시즌 8에서 방영되었는데, 크레이머가 수탉을 사서 훈련시키는 모습을 담고 있습니다. 이 수탉이 바로 Little Jerry입니다. 챗봇에 같은 질문을 다시 던지자 두 번째, 다른 할루시네이션이 나타났습니다.

시즌 9의 18번째 에피소드인 'The Maldives' 에피소드에서 크레이머는 방글라데시를 방문합니다. 이 에피소드에서 크레이머는 여행 후 새로운 삶을 시작하려고 시도하며, 크레이머가 '방글라데시' 어부가 되는 이야기를 중심으로 스토리가 진행됩니다.

사실, 사인필드 시즌 9의 에피소드 18은 The Frogger이고, 여기서 크레이머는 경찰서를 방문합니다. 사인필드에서 The Maldives라는 에피소드는 존재하지 않으며, 쇼 전체에서 크레이머가 방글라데시에 가는 부분은 없습니다.

GPT와 같은 자기회귀 모델이 꾸며낸 사실로 할루시네이션을 일으키는 것으로 알려져 있듯이, 다른 유형의 모델도 각자의 방식으로 할루시네이션을 일으킬 수 있습니다. 이미지 생성에 사용되는 확산 모델은 때때로 현실과 일치하지 않는 방식으로 실제 물체를 묘사합니다.

할루시네이션을 완화하는 방법

생성형 AI 모델이 할루시네이션을 일으킬 가능성을 완전히 제거하는 것은 아직 불가능하지만, 할루시네이션을 완화할 수 있는 다음과 같은 모범 사례가 있습니다.

명확한 프롬프트: 사용자 프롬프트가 더 명확할수록 AI는 더 구체적인 답변을 제시할 수 있습니다. 프롬프트 내에서 AI가 자세히 답변할 수 있는 여지를 주어야 합니다.

명확한 방향: AI에게 명확한 역할을 부여하고 진실되고 검증 가능한 정보를 제공하도록 지시하면 AI가 현실을 더 정확히 반영하는 답변을 제시할 수 있습니다.

고품질 데이터: AI 모델의 학습 데이터가 최신이고 관련성이 높을수록 답변이 편향될 가능성이 낮아집니다.

인적 검증: AI가 생성한 결과는 지식이 풍부한 사람이 먼저 검증한 후 사용해야 합니다.

RAG 및 미세 조정: RAG를 사용하여 신뢰할 수 있는 데이터로 AI를 보강하고 도메인에 특화되도록 모델을 미세 조정하는 것은 모두 할루시네이션을 줄이는 데 효과적입니다.

AI 아카데미

비즈니스용 생성형 AI의 부상

역사적인 생성형 AI의 부상과 이것이 비즈니스에 의미하는 바를 살펴봅니다.

에피소드로 이동

ROI 실현 시작: 에이전틱 AI 실용 가이드

기업 전반에서 측정 가능한 ROI를 달성할 수 있도록 에이전틱 AI를 확장하는 방법을 알아보세요. 이 플레이북에서는 효과를 제한하는 주요 장벽, ROI를 효과적으로 측정하는 방법, 그리고 기업 전반에서 성공적인 도입을 추진하기 위한 실용적인 프레임워크를 설명합니다.

리소스

2030년 엔터프라이즈: 지속적인 혁신을 위한 설계

2030년 가장 성공적인 기업을 결정짓는 다섯 가지 전망과, 리더가 AI 중심 경쟁 우위를 확보하기 위해 취해야 할 단계를 확인하세요.

생성형 AI 기술 업그레이드

실습, 강좌, 가이드 프로젝트, 평가판 등을 통해 기본 개념을 배우고 기술을 쌓으세요.

업무에 AI 활용: 생성형 AI로 ROI 향상

AI 투자에 대해 더 나은 수익을 얻고 싶으신가요? 주요 영역에서 차세대 AI를 확장하여 최고의 인재들이 혁신적인 새 솔루션을 구축하고 제공하도록 지원함으로써 변화를 주도하는 방법을 알아보세요.

AI 프로젝트에서 수익으로: 에이전틱 AI로 지속 가능한 재무 성과를 달성하는 방법

조직이 서로 다른 파일럿을 통해 AI를 도입하는 것에서 AI를 적용하여 조직의 중심에서 혁신을 추진하는 것으로 전환하는 방법을 알아보세요.

생성형 AI 설명

IBM의 Techsplainers에서 핵심 개념부터 실제 사용 사례까지 생성형 AI의 필수 요소를 분석합니다. 짧고 명확한 에피소드를 통해 기본 사항을 빠르게 익힐 수 있습니다.

생성형 AI를 위한 CEO 가이드

생성형 AI가 창출할 수 있는 가치와 AI가 요구하는 투자 및 그로 인한 위험에서 CEO가 균형을 맞출 수 있는 방법을 알아보세요.

watsonx 개발자 허브

다음 프로젝트를 가속화하는 데 필요한 필수 툴과 리소스를 살펴보세요. IBM에서 제공하는 모든 지원 모델을 살펴보고 시작하세요.

성공적인 생성형 AI의 진실

기술, 프로세스, 모범 사례를 통해 파운데이션 모델을 맞춤화하여 생성형 AI 라이프사이클을 쉽게 운영할 수 있도록 지원하는 AI 플랫폼의 이점을 알아보세요.

IBM Granite 살펴보기

IBM Granite는 비즈니스에 맞춰 설계되고 AI 애플리케이션 확장에 최적화되었으며 개방적이고 성능이 뛰어나며 신뢰할 수 있는 AI 모델 제품군입니다. 언어, 코드, 시계열 및 가드레일 모델을 살펴보세요.

적절한 파운데이션 모델을 선택하는 방법

사용 사례별로 가장 적합한 AI 파운데이션 모델을 선택하는 방법을 알아보세요.

신뢰와 확신을 바탕으로 새로운 AI 시대에 성공하는 방법

강력한 AI 전략의 3가지 핵심 요소인 경쟁 우위 확보, 비즈니스 전반의 AI 확장, 신뢰할 수 있는 AI 발전에 대해 자세히 알아보세요.

각주

1. Attention Is All You Need, Vaswani 외, 2023년 8월 2일

2. Artists Score Major Win in Copyright Case Against AI Art Generators, Winston Cho, The Hollywood Reporter, 2024년 8월 13일

3. Diffusion-GAN: Training GANs with Diffusion, Wang 외, 2023년 8월 25일

생성형 모델이란?