생성적 적대적 네트워크(GAN)란 무엇인가요?

작성자

Technical Content Writer

IBM

GAN이란 무엇인가요?

생성적 적대적 네트워크(GAN)는 기존 학습 데이터 세트에서 패턴을 학습하여 사실적인 데이터를 생성하도록 설계된 머신 러닝 모델입니다. 두 개의 신경망이 반대로 작동하는 딥 러닝 기술을 사용하여 비지도 학습 프레임워크 내에서 작동합니다. 신경망 중 하나는 데이터를 생성하고 다른 하나는 데이터가 실제인지 생성된 것인지 여부를 평가합니다.

딥 러닝은 이미지 분류 및 음성 인식과 같은 작업에서 탁월했지만 사실적인 이미지나 텍스트를 포함한 새로운 데이터를 생성하는 것은 생성 모델의 복잡한 계산으로 인해 더 어려웠습니다.

Ian Goodfellow가 2014년 논문 Generative Adversarial Nets에서 소개한 GAN은 이 문제에 대한 획기적인 솔루션을 제공합니다.¹ 이 혁신적인 프레임워크를 통해 생성형 모델링을 혁신하여 고품질의 사실적인 데이터를 생성할 수 있는 모델과 알고리즘을 더 쉽게 개발할 수 있게 되었습니다.

GAN은 어떻게 작동하나요?

GAN 아키텍처는 생성기 네트워크와 판별기 네트워크의 두 가지 심층 신경망으로 구성됩니다. GAN 학습 프로세스에는 생성기가 무작위 입력(노이즈)으로 시작하여 주어진 학습 세트의 실제 데이터를 모방하는 이미지, 텍스트 또는 사운드와 같은 합성 데이터를 생성하는 작업이 포함됩니다. 판별기는 생성된 샘플과 학습 세트의 데이터를 모두 평가하고 진짜인지 가짜인지 결정합니다. 0에서 1 사이의 점수를 할당하며, 점수가 1이면 데이터가 진짜처럼 보인다는 의미이고 점수가 0이면 가짜임을 의미합니다. 그런 다음 역전파를 사용하여 두 네트워크를 최적화합니다. 이는 네트워크의 매개변수에 따라 손실 함수의 기울기가 계산되고 이러한 매개변수가 손실을 최소화하도록 조정된다는 것을 의미합니다. 그런 다음 생성기는 판별기의 피드백을 사용하여 개선하고 보다 사실적인 데이터를 생성하려고 시도합니다.

GAN 아키텍처의 학습에는 적대적 프로세스가 포함됩니다. 생성기 모델은 판별기 모델을 속여 가짜 데이터를 진짜로 분류하도록 시도하는 반면, 판별기는 진짜 데이터와 가짜 데이터를 구별하는 능력을 지속적으로 향상시킵니다. 이 프로세스는 각 네트워크의 성능을 측정하는 손실 함수에 의해 가이드됩니다. 생성기 손실은 생성기가 판별기를 속여 자신의 데이터가 실제라고 믿도록 얼마나 잘 속일 수 있는지를 측정합니다. 생성기 손실이 적다는 것은 생성기가 현실적인 데이터를 성공적으로 생성하고 있음을 의미합니다. 판별기 손실은 판별기가 가짜 데이터와 실제 데이터를 얼마나 잘 구별할 수 있는지를 측정합니다. 판별기 손실이 낮다는 것은 판별기가 가짜 데이터를 성공적으로 식별했음을 나타냅니다.

예를 들어, 개 이미지를 생성하도록 훈련된 GAN에서 생성기는 무작위 노이즈를 개와 유사한 이미지로 변환하고 판별기는 학습 세트의 실제 개 사진과 비교하여 이러한 이미지를 평가합니다.

시간이 지남에 따라 이러한 적대적 프로세스는 두 네트워크 모두를 개선합니다. 이를 통해 생성기는 원본 학습 데이터 세트와 매우 유사하며 설득력 있고 사실적인 데이터를 생성할 수 있으며, 판별기는 실제 데이터와 가짜 데이터 간의 미묘한 차이를 식별하는 능력을 강화합니다.

GAN의 유형

바닐라 GAN

바닐라 GAN은 생성기와 일반적인 적대 게임에 참여하는 판별기를 포함하는 생성적 적대적 네트워크의 기본 형태입니다. 생성기는 가짜 샘플을 생성하고, 판별기는 실제 데이터 샘플과 가짜 데이터 샘플을 구별하는 것을 목표로 합니다. 바닐라 GAN은 생성기와 판별기 모두에 대해 간단한 다층 퍼셉트론(MLP) 또는 뉴런 레이어를 사용하므로 구현이 쉽습니다. 이러한 MLP는 데이터를 처리하고 입력을 분류하여 데이터 세트에서 알려진 객체를 구별합니다. 그러나 학습 중에 불안정한 것으로 알려져 있으며 좋은 결과를 얻으려면 하이퍼파라미터를 신중하게 조정해야 하는 경우가 많습니다.

조건부 GAN(cGAN)

cGAN은 생성기와 판별기 모두에 대해 '레이블' 또는 '조건'이라고 하는 추가 정보를 포함하는 일종의 생성적 적대적 네트워크입니다.² 이러한 레이블은 컨텍스트를 제공하여 생성기가 바닐라 GAN에서와 같이 무작위 노이즈에만 의존하는 대신 주어진 입력을 기반으로 특정 특성을 가진 데이터를 생성할 수 있도록 합니다. 이러한 제어된 생성으로 인해 cGAN은 아웃풋에 대한 정밀한 제어가 필요한 작업에 유용합니다. cGAN은 특정 객체, 주제 또는 스타일에 맞는 이미지, 텍스트 및 합성 데이터를 생성하는 데 널리 사용됩니다. 예를 들어, cGAN은 그레이스케일을 빨간색, 녹색, 파란색 모델(RGB) 으로 변환하도록 생성기를 조절하여 흑백 이미지를 컬러 이미지로 변환 할 수 있습니다. 마찬가지로 '흰 털복숭이 고양이 이미지 만들기'와 같은 텍스트 입력에서 이미지를 생성하여 제공된 설명과 일치하는 아웃풋을 생성할 수 있습니다.

심층 컨볼루션 GAN(DCGAN)

심층 컨볼루션 GAN(DCGAN)은 생성기와 판별기 모두에 컨볼루션 신경망(CNN)을 사용합니다. 생성기는 임의 노이즈를 입력으로 받아 이미지와 같은 구조화된 데이터로 변환합니다. 전치된 컨볼루션(또는 디콘볼루션)을 사용하여 노이즈를 '확대'하여 의미 있는 이미지를 생성함으로써 입력 노이즈를 더 크고 상세한 아웃풋으로 업스케일링합니다. 판별기는 표준 컨볼루션 계층을 사용하여 입력 데이터를 분석합니다. 이러한 레이어는 판별기가 데이터의 전체 구조와 세부 사항을 '축소'하고 보며 결정을 내리는 데 도움이 됩니다. 이 접근 방식을 통해 DCGAN은 고품질 이미지 및 기타 구조화된 데이터를 생성하는 데 효과적입니다.

StyleGAN

Style GAN은 1024 x 1024 해상도까지 고해상도 이미지를 생성하는 일종의 생성적 적대적 네트워크입니다. StyleGAN은 동일한 객체의 데이터 세트를 사용하여 학습됩니다. 생성기 네트워크는 여러 레이어로 구성되며, 각 레이어는 기본 기능부터 복잡한 텍스처에 이르기까지 이미지에 다양한 수준의 세부 정보를 추가하는 역할을 합니다. 또한 판별기 네트워크에는 여러 레이어가 있어 세부 수준을 평가하고 전반적인 품질을 평가합니다.

CycleGAN

CycleGAN에서는 생성기와 판별기가 주기적으로 학습됩니다. 페어링되지 않은 데이터 세트를 사용하여 이미지를 이미지로 변환하도록 설계되었습니다. 생성기를 사용하여 이미지를 그림과 같은 다른 스타일로 변환한 다음 역방향 생성기를 사용하여 원래 스타일로 다시 변환하는 방식으로 작동합니다. 이 방법은 사이클 일관성이라는 프로세스를 통해 재구성된 이미지가 원본과 매우 유사하도록 하는 데 도움이 됩니다. 이러한 결과는 이미지 스타일 전송 및 이미지 향상과 같은 작업에 특히 유용합니다.

라플라시안 피라미드 GAN(LAGAN)

라플라시안 피라미드 GAN(LAPGAN)은 여러 축척으로 이미지를 세분화하여 고품질 이미지를 생성하도록 설계되었습니다. 저해상도 이미지를 생성하는 것으로 시작한 다음 일련의 GAN을 사용하여 더 높은 해상도에서 점진적으로 더 많은 세부 정보를 추가합니다. LAPGAN은 라플라시안 피라미드(Laplacian pyramid)로 알려진 이 다중 스케일 접근 방식을 통해 고해상도 이미지 생성의 복잡성을 보다 효과적으로 처리할 수 있습니다.

DiscoGAN

DiscoGAN은 쌍을 이루는 학습 데이터 없이 도메인 간 관계를 학습하는 데 사용됩니다. 2개의 생성기와 2개의 판별기를 사용하여 이미지를 한 도메인에서 다른 도메인으로 변환하고 다시 반대로 변환하여 사이클 일관성을 통해 재구성된 이미지가 원본과 매우 유사하도록 합니다. 따라서 DiscoGAN은 데이터 세트가 쌍을 이루지 않은 경우에도 이미지 간 변환, 스타일 전송 및 이미지 향상과 같은 작업에 효과적입니다.

업계 뉴스레터

전문가가 전하는 최신 AI 트렌드

가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.

GAN의 애플리케이션

GAN은 컴퓨팅 비전, 이미지 생성, 객체 감지, 이미지-이미지 변환, 텍스트에서 이미지 생성, 비디오의 다음 프레임 예측 등의 다양한 애플리케이션에 사용할 수 있습니다.

이미지 생성

GAN은 존재하지 않았던 샘플의 사실적인 이미지를 생성하고 텍스트 설명에서 시각적 요소를 생성하는 데 사용되므로 지정된 속성이나 장면을 기반으로 이미지를 생성할 수 있습니다. 대규모 데이터 세트에 대해 훈련된 BigGAN은 특정 클래스 또는 조건을 기반으로 데이터를 생성하고 이미지 생성에서 최첨단 결과를 달성합니다.³ 이미지 합성, 채색, 재구성 등 다양한 애플리케이션에 사용됩니다. 예를 들어, 새로운 GAN 기반 베이지안 시각 재구성 방법인 GAN-BVRM은 분류기를 활용하여 기능적 자기공명영상(fMRI) 데이터를 해독합니다. 사전 학습된 BigGAN 생성기는 카테고리별 이미지를 생성하고 인코딩 모델은 뇌 활동에 맞는 이미지를 선택하여 이미지 자극을 재구성할 때 자연스러움과 충실도를 향상시킵니다. GAN은 학습 및 분석을 위해 MRI, CT 스캔 및 X-레이와 같은 사실적인 의료 데이터를 생성하고 신약 개발을 위한 새로운 분자 구조를 생성함으로써 의료 분야에서 상당한 진전을 이루고 있습니다.

이미지 초고해상도

GAN은 고해상도 변형을 생성하여 저해상도 이미지를 향상시켜 이미지의 품질과 디테일을 향상시킬 수 있습니다. 예를 들어, NVIDIA의 StyleGAN2는 콘텐츠, 정체성, 표현 및 포즈를 포함한 속성을 세밀하게 제어하여 고해상도의 매우 사실적인 이미지를 생성하여 사용자가 예술적이고 실용적인 애플리케이션을 위한 이미지를 만들고 조작할 수 있도록 합니다.⁴

이미지 간 변환

GAN은 스케치를 페인팅된 버전으로 변환하는 등 이미지를 한 도메인에서 다른 도메인으로 변환하여 스타일 전송 및 이미지 편집을 수행합니다. 예를 들어, 사진을 그림으로 변환하는 데는 CycleGAN이 사용됩니다. 이 프로세스에는 순환 제약 조건을 통해 소스 도메인(사진)에서 대상 도메인(그림)으로 또는 그 반대로 이미지를 변환하는 하나의 생성기가 포함되어 매핑이 의미론적 일관성을 유지하도록 합니다.

동영상 재지정

GAN은 비지도 동영상 재지정에 사용되며, 중요한 시각적 정보를 유지하면서 다양한 종횡비와 형식에 맞게 동영상 콘텐츠를 조정합니다. Recycle-GAN은 CycleGAN에서 흔히 볼 수 있는 유사한 순환 전략을 활용하여 특히 동영상 데이터에 적용합니다. 예를 들어, Recycle-GAN은 와이드스크린 동영상을 소셜 미디어 플랫폼용 정사각형 형식으로 변환하여 동영상의 주요 요소와 움직임이 그대로 유지되도록 할 수 있습니다.⁵

얼굴 속성 조작

GAN은 표정 변화나 노화 효과와 같은 이미지의 얼굴 특징을 변경할 수 있도록 하여 엔터테인먼트 및 소셜 미디어 애플리케이션에서의 잠재력을 보여줍니다. StyleGAN은 잠재 공간에서 추출한 '스타일'을 기반으로 생성된 샘플에 레이어 단위의 수정을 적용하여 작동합니다. 이 프로세스를 통해 머리 색깔, 표정 등 다양한 속성을 직관적으로 제어할 수 있어 사용자가 수동으로 조정할 필요 없이 특정 기능에 따라 얼굴을 조작할 수 있습니다. 예를 들어, StyleGAN을 사용하여 사람의 머리 색깔을 갈색에서 금발로 변경하거나 무표정한 얼굴에 미소를 추가할 수 있습니다.

객체 감지

GAN은 객체 감지에 사용되어 학습 데이터의 품질과 다양성을 향상시켜 객체 감지 모델의 성능을 크게 향상시킬 수 있습니다. GAN은 실제 데이터와 매우 유사한 합성 이미지를 생성함으로써 학습 데이터 세트를 보강하여 모델이 더 잘 일반화되고 더 정확하게 수행되도록 돕습니다. 예를 들어, 연구에 따르면 객체 감지를 위한 딥 러닝 모델의 성능은 노이즈, 흐림 또는 기타 왜곡의 영향을 받는 이미지와 같이 품질이 저하된 이미지에 적용될 때 크게 저하되는 것으로 나타났습니다.⁶ 이 논문은 모델 아키텍처나 추론 속도에 복잡성을 추가하지 않고도 GAN을 활용하여 다양한 이미지 품질에 대해 객체 감지 모델의 견고성을 향상시키는 GAN-DO 프레임워크를 제시합니다. 실험 결과에 따르면 GAN-DO는 기존의 미세 조정 방법보다 성능이 뛰어나 물체 감지의 정확도가 향상됩니다.

Mixture of Experts | 12월 12일, 에피소드 85

AI 디코딩: 주간 뉴스 요약

세계적인 수준의 엔지니어, 연구원, 제품 리더 등으로 구성된 패널과 함께 불필요한 AI 잡음을 차단하고 실질적인 AI 최신 소식과 인사이트를 확인해 보세요.

Mixture of Experts의 모든 에피소드 보기

합성 데이터 생성을 위한 기타 생성형 모델

GAN 외에도 변형 오토인코더(VAE)는 실제 데이터를 모방하는 새로운 데이터 샘플을 생성할 수 있는 또 다른 딥 러닝 모델입니다. VAE는 확률적 모델로, 데이터에서 다양한 결과나 값이 발생할 가능성을 설명하는 확률 분포 측면에서 데이터를 나타냅니다. 이러한 모델은 학습 데이터 세트에서 패턴을 학습하고 정확한 복제본이 아닌, 원본 데이터 세트의 변형인 새로운 데이터를 생성하도록 설계되었습니다. 변형 오토인코더(VAE)에는 두 가지 구성 요소가 포함되어 있습니다. 인코더(인식 모델)는 이미지와 같은 복잡한 입력 데이터를 더 단순한 저차원 데이터로 압축하고, 디코더(생성 모델)는 압축된 표현에서 원래 입력을 다시 생성합니다. VAE는 또한 학습 데이터 세트의 패턴에서 완전히 새로운 데이터 학습 샘플을 생성할 수 있습니다. VAE는 일반적으로 흐릿하고 덜 선명한 아웃풋을 생성하지만 학습하기에 더 안정적인 반면, GAN은 더 선명하고 사실적인 아웃풋을 생성하지만 불안정성으로 인해 학습하기가 더 어렵습니다.

궁극적으로 VAE와 GAN 중 선택은 원하는 아웃풋 품질, 학습 안정성 및 해석 가능한 잠재 표현의 필요성과 같은 작업의 특정 요구 사항에 따라 달라지므로, 각 모델은 다양한 애플리케이션에서 고유한 가치를 지닙니다.

GAN의 이점과 과제

생성적 적대적 네트워크(GAN)는 이미지, 텍스트, 오디오 등 매우 현실적이고 다양한 데이터를 생성할 수 있습니다. 텍스트 데이터를 생성하고 언어 모델을 개선하기 위한 자연어 처리(NLP), 새로운 작곡과 사실적인 악기 사운드를 만들기 위한 음악 생성 등의 애플리케이션에 사용됩니다. 시뮬레이션 및 게임은 GAN을 사용하여 사실적인 환경과 캐릭터를 생성하고 표준에서 벗어난 패턴을 식별하여 이상 징후를 감지합니다. GAN은 또한 비용이 많이 들거나 수행하기에 비실용적인 실험을 위해 복잡한 데이터를 시뮬레이션하여 과학 연구를 지원합니다. 데이터 증강을 통해 머신 러닝(ML) 프로세스를 강화하고 학습 세트의 양과 다양성을 늘려 제한된 빅 데이터의 문제를 해결합니다. GAN은 강화 학습, 로보틱, NLP 등의 기술과 더욱 통합되어 인공 지능(AI) 시스템을 발전시킬 것으로 예상됩니다.

트랜스포머의 부상에도 불구하고 GAN은 경량 아키텍처와 계산 효율성으로 인해 관련성을 유지하므로 엣지 배포에 이상적입니다. 트랜스포머에 비해 매개변수가 적은 GAN은 특징(예: 얼굴 속성)의 세분화된 조작을 위한 제어 생성 기능을 제공하여 특정 작업에 대한 미세 조정을 단순화합니다. GAN은 단일 정방향 패스(또는 아웃풋을 생성하기 위해 신경망을 통한 일회성 입력 흐름)가 필요하기 때문에 더 빠른 추론 속도를 제공합니다. 따라서 휴대폰 및 IoT 시스템과 같이 리소스가 제한된 엣지 디바이스의 실시간 애플리케이션에 이상적입니다. 이러한 장점으로 인해 GAN은 엣지 환경에서 이미지 변환, 초고해상도 및 실시간 비디오 합성과 같은 작업에 실용적인 선택이 될 수 있습니다.

그러나 GAN은 상당히 큰 문제에 직면해 있습니다. 주요 문제 중 하나는 생성기와 판별기가 제대로 수렴되지 않아 아웃풋의 품질이 저하될 수 있는 학습 불안정성입니다. 모드 붕괴는 또 다른 문제로, 생성기가 제한된 다양성을 생성하여 학습 데이터의 전체 다양성을 캡처하지 못하는 경우입니다. 또한 GAN에는 대량의 데이터와 상당한 컴퓨팅 리소스가 필요하므로 광범위한 사용에 장벽이 될 수 있습니다. 기존 지표로는 생성된 데이터의 뉘앙스를 완전히 포착하지 못할 수 있기 때문에 GAN에서 생성된 아웃풋의 품질을 평가하는 것은 어려운 일입니다. GAN은 딥페이크 및 기타 잠재적으로 유해한 콘텐츠를 만드는 데 사용될 수 있으므로 생성된 샘플의 윤리적 사용을 보장하는 것이 점점 더 중요해지고 있습니다.

GAN 모델을 구현하는 방법

GAN은 Tensorflow와 Keras를 사용하여 구현할 수 있습니다. Python에서 GAN 모델을 만들려면 데이터 세트, 생성기 스크립트 및 판별기 스크립트가 필요합니다. 다음은 시작하는 데 도움이 되는 단계별 가이드입니다.

1단계: TensorFlow를 포함한 필수 라이브러리와 GAN 모델 구축 및 학습에 필요한 numpy 및 matplotlib를 가져옵니다.

2단계: 데이터 세트를 로드하고 전처리하여 대상 데이터 분포(예: 이미지, 텍스트 등)를 나타내는지 확인합니다.

3단계: 무작위 노이즈를 가져와 대상 분포와 일치하는 데이터 샘플을 생성하는 TensorFlow 또는 Keras 레이어를 사용하여 생성기 모델을 구축합니다.

4단계: 판별기 모델을 구축하여 진짜 데이터 샘플과 생성기에서 생성된 가짜 데이터 샘플을 분류합니다.

5단계: 생성기와 판별기 모두에 적합한 옵티마이저를 사용하고 손실 함수를 정의합니다.

6단계: 생성기와 판별기를 단일 GAN 모델로 결합하여 판별기를 속이도록 생성기를 학습시킵니다.

7단계: 실제 데이터와 가짜 데이터로 판별기와 생성기를 번갈아 학습시키는 루프를 구현합니다.

8단계: 에포크에 걸쳐 생성기의 아웃풋 및 판별기 정확도를 분석하여 수렴을 보장합니다.

9단계: 학습된 생성기를 사용하여 대상 데이터 분포를 모방하는 새 샘플을 생성합니다.

10단계: 생성된 데이터를 플로팅하거나 분석하여 GAN이 대상 분포를 얼마나 잘 학습했는지 검증합니다.

다음 단계를 따르면 TensorFlow를 사용하여 기본 GAN 모델을 구현할 수 있습니다.

GAN의 미래는 현실성, 안정성, 효율성 및 윤리적 고려 사항에서 발전이 기대되기 때문에 유망합니다. GAN이 다른 기술과 더욱 통합되고 새로운 애플리케이션을 찾음에 따라 다양한 산업과 분야에 계속해서 혁신을 일으킬 것입니다.

생성형 AI + ML의 힘 활용하기

생성형 AI와 머신 러닝을 비즈니스에 자신 있게 통합하는 방법 알아보기

리소스

기초부터 시작하는 신경망

신경망, 신경망의 기본 기능 및 신경망 구축의 기본 사항에 대해 심층적으로 이해합니다.

IBM Granite 살펴보기

IBM Granite는 비즈니스에 맞게 맞춤화되고 AI 애플리케이션 확장에 최적화된 신뢰할 수 있는 고성능의 개방형 AI 모델 제품군입니다. 언어, 코드, 시계열 및 가드레일 옵션을 살펴보세요.

2024년 AI 활용 현황

IBM은 2,000개 조직을 대상으로 AI 이니셔티브에 대한 설문조사를 실시하여 효과적인 전략과 효과적이지 못한 전략, 그리고 앞서나갈 수 있는 방법을 알아보았습니다.

생성형 AI + ML의 힘 활용하기

생성형 AI와 머신 러닝을 비즈니스에 자신 있게 통합하는 방법 알아보기

적절한 파운데이션 모델을 선택하는 방법

사용 사례에 가장 적합한 AI 파운데이션 모델을 선택하는 방법을 알아보세요.

생성형 AI를 위한 CEO 가이드

생성형 AI가 창출할 수 있는 가치와 AI가 요구하는 투자 및 그로 인한 위험에서 CEO가 균형을 맞출 수 있는 방법을 알아보세요.

업무에 AI 활용: 생성형 AI로 ROI 향상

AI 투자에 대해 더 나은 수익을 얻고 싶으신가요? 주요 영역에서 차세대 AI를 확장하여 최고의 인재들이 혁신적인 새 솔루션을 구축하고 제공하도록 지원함으로써 변화를 주도하는 방법을 알아보세요.

각주

¹ Goodfellow, I. J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... 및 Bengio, Y. (2014년). Generative adversarial nets. Advances in neural information processing systems, 27.

² Alqahtani, Hamed 및 Kavakli, Manolya 및 Kumar, Gulshan. (2019년). Applications of Generative Adversarial Networks (GANs): An Updated Review. Archives of Computational Methods in Engineering. 28. 10.1007/s11831-019-09388-y.

³ Qiao, K., Chen, J., Wang, L., Zhang, C., Tong, L. 및 Yan, B. (2020년). BigGAN-based Bayesian reconstruction of natural images from human brain activity. Neuroscience, 444, 92–105. https://doi.org/10.1016/j.neuroscience.2020.07.040.

⁴ Alarcon, N. (2020년). Synthesizing High-Resolution Images with StyleGAN2. NVIDIA 기술 블로그. https://developer.nvidia.com/blog/synthesizing-high-resolution-images-with-stylegan2.

⁵ Bansal, A., Ma, S., Ramanan, D. 및 Sheikh, Y. (2018년). Recycle-GAN: Unsupervised Video Retargeting. arXiv. https://doi.org/10.48550/arXiv.1808.05174.

⁶ Prakash, CD, Shrivastava, A. 및 Torresani, L. (2019년). It GAN DO Better: GAN-based Detection of Objects on Images with Varying Quality. arXiv. https://arxiv.org/abs/1912.01707.