1 분 소요

개요

  • 2014년 Ian Goodfellow가 제안한 생성 모델
  • 생성자(Generator)판별자(Discriminator)가 대립적으로 학습하며 서로의 능력을 향상시키는 시스템
  • 예시로 배운 만큼 실지에 가까운 데이터를 생성하는 능력 보유
  • 이미지 생성 분야에서 Diffusion Model로 점차 대체되는 추세


구조

생성자 (Generator)

  • 랜덤 노이즈(Latent Vector) z를 입력받아 가짜(Fake) 데이터 생성
  • 판별자를 속이는 것이 목표 (Loss 최소화)
  • 트랜스포즈 합성곱(Transposed Convolution)로 해상도 업스케일

판별자 (Discriminator)

  • 입력된 데이터가 진짜인지 가짜인지를 0~1 확률로 출력
  • 진짜 데이터를 1로, 가짜 데이터를 0으로 분류하도록 학습
  • 범주형 합성곱 네트워크로 구성


학습 과정

  • 생성자와 판별자가 번갈아 학습 (minimax 게임)
  • 판별자 학습: 진짜/가짜 데이터 Label로 Binary Cross-Entropy Loss 최소화
  • 생성자 학습: 판별자가 생성노를 진짜(1)로 판단하도록 Loss 최소화
  • 수렴 조건: D(x)=0.5 (판별자가 진짜와 가짜를 구분 못하는 상태)

    랜덤 노이즈 z -> Generator -> Fake 이미지 Discriminator <- Real 이미지 진짜(1) vs 가짜(0) 판단


주요 변형 모델

모델 특징
DCGAN CNN 기반 GAN, 안정적 학습
StyleGAN2 고해상도 얼굴 생성, NVIDIA
CycleGAN 짝 없는 이미지 도메인 변환
Pix2Pix 짝지어진 이미지 변환
BigGAN 대규모 이미지 생성, 공뢡 콘디셔드
ProgressiveGAN 저해상도에서 고해상도로 점진적 학습


한계

  • 모드 붕괴 (Mode Collapse): 생성자가 다양성 없이 부분적 패턴만 반복 생성
  • 학습 불안정: 생성자와 판별자의 대립으로 하이퍼파라미터 튜닝이 어려움
  • 평가 지표 부재: 생성 질을 정량적으로 평가하는 FID, IS 등 지표를 별도 사용
  • 현재 Diffusion Model이 이미지 생성 품질과 다양성 적면에서 우위


활용

  • 이미지 생성: StyleGAN으로 사실적인 인물 사진 생성
  • 스타일 변환: CycleGAN — 말/얼룩 사진
  • 데이터 증강: 한정된 의료 영상 데이터 보완
  • 딥페이크 (Deepfake): 얼굴 합성 (Deepfake 악용 위험 주의)
  • 콘텐츠 크리에이터 도구: 게임 아트, 정유 디자인 생성


관련 포스트