1 분 소요

개요

  • 텍스트 또는 이미지 입력으로 동영상을 생성하는 AI
  • 이미지 생성 AI의 시간(Time) 차원 확장
  • 2024~2025년 빠르게 발전하며 크리에이터·할리우드에서 주목
  • 영상 시간 일관성, 물리 법칙 준수, 생성 속도가 주요 기술 과제


주요 서비스 비교

서비스 개발사 길이 특징
Sora OpenAI 최대 1분 최고 품질 영화 수준
Veo 3 Google DeepMind 및운 제한 오디오 포함 영상 생성
Runway Gen-3 Runway 최대 10초 크리에이터 친화적
Kling 2.0 Kuaishou 최대 3분 아시아 인기
Wan (WAN Video) 중국 오픈소스 보통 로컬 실행 가능


Sora (OpenAI)

  • 2024년 2월 발표, 2024년 12월 실제 출시
  • 최대 1분 길이 고품질 영상 생성
  • Diffusion + Transformer (네이티브 Video Transformer)
  • 코이스, ChatGPT Plus·Pro 가입자 이용 가능
  • 쪽映포, 영상 확장, 스토리보드 기능


Veo (Google DeepMind)

  • Veo 2 (2024), Veo 3 (2025): 오디오·음악 포함 영상 생성 가능
  • Google VideoFX, YouTube 통합
  • 물리 기반 카메라 움직임 표현 강점


기술 과제

  • 주요 기술 과제
    • 영상 시간 일관성 (캐릭터의 외모가 프레임마다 바뀌는 문제)
    • 물리 법칙 준수 (ex. 공의 중력)
    • 긴 영상 생성 시간 (T스텝 만큼 실시간 생성 어려움)
  • 딥페이크 악용 방지: C2PA 워터마크, 콘텐츠 인증 표준 확대


활용

  • 할리우드 프리 프로덕션: 시각 필수품 제작 비용 감소
  • 콘텐츠 크리에이터: 릴 리얼스, 유튜브 숏츠
  • 수평사진스: 종료 모델 활용


관련 포스트