chp

99점이 100점이 되기 위해 일을 더하는 개발자

[AI] GAN (생성적 적대 신경망)

1 분 소요

개요

2014년 Ian Goodfellow가 제안한 생성 모델
생성자(Generator)와 판별자(Discriminator)가 대립적으로 학습하며 서로의 능력을 향상시키는 시스템
예시로 배운 만큼 실지에 가까운 데이터를 생성하는 능력 보유
이미지 생성 분야에서 Diffusion Model로 점차 대체되는 추세

구조

생성자 (Generator)

랜덤 노이즈(Latent Vector) z를 입력받아 가짜(Fake) 데이터 생성
판별자를 속이는 것이 목표 (Loss 최소화)
트랜스포즈 합성곱(Transposed Convolution)로 해상도 업스케일

판별자 (Discriminator)

입력된 데이터가 진짜인지 가짜인지를 0~1 확률로 출력
진짜 데이터를 1로, 가짜 데이터를 0으로 분류하도록 학습
범주형 합성곱 네트워크로 구성

학습 과정

생성자와 판별자가 번갈아 학습 (minimax 게임)
판별자 학습: 진짜/가짜 데이터 Label로 Binary Cross-Entropy Loss 최소화
생성자 학습: 판별자가 생성노를 진짜(1)로 판단하도록 Loss 최소화
수렴 조건: D(x)=0.5 (판별자가 진짜와 가짜를 구분 못하는 상태)

랜덤 노이즈 z -> Generator -> Fake 이미지 Discriminator <- Real 이미지 진짜(1) vs 가짜(0) 판단

주요 변형 모델

모델	특징
DCGAN	CNN 기반 GAN, 안정적 학습
StyleGAN2	고해상도 얼굴 생성, NVIDIA
CycleGAN	짝 없는 이미지 도메인 변환
Pix2Pix	짝지어진 이미지 변환
BigGAN	대규모 이미지 생성, 공뢡 콘디셔드
ProgressiveGAN	저해상도에서 고해상도로 점진적 학습

한계

모드 붕괴 (Mode Collapse): 생성자가 다양성 없이 부분적 패턴만 반복 생성
학습 불안정: 생성자와 판별자의 대립으로 하이퍼파라미터 튜닝이 어려움
평가 지표 부재: 생성 질을 정량적으로 평가하는 FID, IS 등 지표를 별도 사용
현재 Diffusion Model이 이미지 생성 품질과 다양성 적면에서 우위

활용

이미지 생성: StyleGAN으로 사실적인 인물 사진 생성
스타일 변환: CycleGAN — 말/얼룩 사진
데이터 증강: 한정된 의료 영상 데이터 보완
딥페이크 (Deepfake): 얼굴 합성 (Deepfake 악용 위험 주의)
콘텐츠 크리에이터 도구: 게임 아트, 정유 디자인 생성

관련 포스트

공유하기

X Facebook LinkedIn Bluesky

참고

[React] 실무 패턴

3 분 소요

개요 React 앱을 실제로 개발하다 보면 반복적으로 등장하는 패턴들이 있습니다. 인증 보호, 환경변수, 에러 처리, 코드 분할, 로딩 UI 등 자주 쓰이는 실무 패턴을 정리합니다.

[React] 테스트 (Vitest, Testing Library)

2 분 소요

개요 테스트는 코드가 올바르게 동작하는지 자동으로 검증하는 작업입니다. Vitest는 Vite 기반 테스트 러너이고, Testing Library는 실제 사용자 관점에서 컴포넌트를 테스트하는 라이브러리입니다.

[React] shadcn/ui

1 분 소요

개요 shadcn/ui는 Radix UI와 Tailwind CSS를 기반으로 만들어진 UI 컴포넌트 모음입니다. npm 패키지가 아니라 소스 코드를 프로젝트에 직접 복사하는 방식이라, 컴포넌트를 자유롭게 수정할 수 있습니다.

[React] Tailwind CSS

1 분 소요

개요 Tailwind CSS는 미리 정의된 유틸리티 클래스를 조합해 스타일을 지정하는 CSS 프레임워크입니다. 별도의 CSS 파일을 만들지 않고 HTML(JSX)에 클래스만 추가하면 스타일이 적용됩니다.