1 분 소요

개요

  • 텍스트 프롬프트 또는 기존 이미지를 기반으로 새로운 이미지를 생성하는 AI
  • Diffusion Model 기반이 주류, 일부는 자체 토큰 + 흐름 매칭 아키텍처
  • 광고·디자인·콘텐츠 제작 분야에서 생산성 혁신 가져오는 중


주요 서비스 비교

서비스 개발사 기술 특징
DALL-E 3 OpenAI Diffusion ChatGPT 통합, 안전 필터 강함
Stable Diffusion Stability AI LDM 오픈소스, 로컬 실행 가능
Flux.1 Black Forest Labs Flow Matching SD 후계 오픈소스
Midjourney V6 Midjourney 자체 예술적 품질 최고
Imagen 3 Google Diffusion 사실적 이미지 강점
Adobe Firefly Adobe 자체 Creative Cloud 통합, 저작권 대응


DALL-E (OpenAI)

  • DALL-E 2 (2022) → DALL-E 3 (2023): 텍스트 충실도 대폭 향상
  • ChatGPT에 통합되어 대화형으로 이미지 생성 가능
  • 저작권자 콘텐츠 필터링 강화, 안전 정책 철저
  • CLIP 모델로 텍스트-이미지 의미 정렬


Stable Diffusion

  • 오픈소스, 로컬 실행 가능 (GPU 4GB 이상 권장)
  • 광범위한 커뮤니티 모델·LoRA 생태계
  • 주요 UI 도구
    • Automatic1111 (WebUI): 가장 널리 사용
    • ComfyUI: 노드 기반 오케스트레이션 도구
  • Flux.1: SD의 후계자, Black Forest Labs (SD 팀)


Midjourney

  • Discord 기반 서비스 (구독 필요, 더 이상 무료 테스트 불가)
  • 예술적·드라마틱한 이미지 생성에 강점
  • 광고·콘셉트·매거진 커버 등 상업적 활용 가능 (유료 플랜)


활용

  • 광고·마케팅: 소재 사진 대체, 캠프 제작
  • 게임 아트: 콘셉트, 아이콘, 배경화면
  • 웹 디자인: 히어로 이미지, 에셋 시각화
  • 콘텐츠 제작: 블로그/SNS 썸네일, 사뮬본
  • 영화·애니: 스토리보드, 콘셉트 아트


관련 포스트