개요
- 텍스트 프롬프트 또는 기존 이미지를 기반으로 새로운 이미지를 생성하는 AI
- Diffusion Model 기반이 주류, 일부는 자체 토큰 + 흐름 매칭 아키텍처
- 광고·디자인·콘텐츠 제작 분야에서 생산성 혁신 가져오는 중
주요 서비스 비교
| 서비스 |
개발사 |
기술 |
특징 |
| DALL-E 3 |
OpenAI |
Diffusion |
ChatGPT 통합, 안전 필터 강함 |
| Stable Diffusion |
Stability AI |
LDM |
오픈소스, 로컬 실행 가능 |
| Flux.1 |
Black Forest Labs |
Flow Matching |
SD 후계 오픈소스 |
| Midjourney V6 |
Midjourney |
자체 |
예술적 품질 최고 |
| Imagen 3 |
Google |
Diffusion |
사실적 이미지 강점 |
| Adobe Firefly |
Adobe |
자체 |
Creative Cloud 통합, 저작권 대응 |
DALL-E (OpenAI)
- DALL-E 2 (2022) → DALL-E 3 (2023): 텍스트 충실도 대폭 향상
- ChatGPT에 통합되어 대화형으로 이미지 생성 가능
- 저작권자 콘텐츠 필터링 강화, 안전 정책 철저
- CLIP 모델로 텍스트-이미지 의미 정렬
Stable Diffusion
- 오픈소스, 로컬 실행 가능 (GPU 4GB 이상 권장)
- 광범위한 커뮤니티 모델·LoRA 생태계
- 주요 UI 도구
- Automatic1111 (WebUI): 가장 널리 사용
- ComfyUI: 노드 기반 오케스트레이션 도구
- Flux.1: SD의 후계자, Black Forest Labs (SD 팀)
Midjourney
- Discord 기반 서비스 (구독 필요, 더 이상 무료 테스트 불가)
- 예술적·드라마틱한 이미지 생성에 강점
- 광고·콘셉트·매거진 커버 등 상업적 활용 가능 (유료 플랜)
활용
- 광고·마케팅: 소재 사진 대체, 캠프 제작
- 게임 아트: 콘셉트, 아이콘, 배경화면
- 웹 디자인: 히어로 이미지, 에셋 시각화
- 콘텐츠 제작: 블로그/SNS 썸네일, 사뮬본
- 영화·애니: 스토리보드, 콘셉트 아트
관련 포스트