개요
- 텍스트 또는 이미지 입력으로 동영상을 생성하는 AI
- 이미지 생성 AI의 시간(Time) 차원 확장
- 2024~2025년 빠르게 발전하며 크리에이터·할리우드에서 주목
- 영상 시간 일관성, 물리 법칙 준수, 생성 속도가 주요 기술 과제
주요 서비스 비교
| 서비스 |
개발사 |
길이 |
특징 |
| Sora |
OpenAI |
최대 1분 |
최고 품질 영화 수준 |
| Veo 3 |
Google DeepMind |
및운 제한 |
오디오 포함 영상 생성 |
| Runway Gen-3 |
Runway |
최대 10초 |
크리에이터 친화적 |
| Kling 2.0 |
Kuaishou |
최대 3분 |
아시아 인기 |
| Wan (WAN Video) |
중국 오픈소스 |
보통 |
로컬 실행 가능 |
Sora (OpenAI)
- 2024년 2월 발표, 2024년 12월 실제 출시
- 최대 1분 길이 고품질 영상 생성
- Diffusion + Transformer (네이티브 Video Transformer)
- 코이스, ChatGPT Plus·Pro 가입자 이용 가능
- 쪽映포, 영상 확장, 스토리보드 기능
Veo (Google DeepMind)
- Veo 2 (2024), Veo 3 (2025): 오디오·음악 포함 영상 생성 가능
- Google VideoFX, YouTube 통합
- 물리 기반 카메라 움직임 표현 강점
기술 과제
- 주요 기술 과제
- 영상 시간 일관성 (캐릭터의 외모가 프레임마다 바뀌는 문제)
- 물리 법칙 준수 (ex. 공의 중력)
- 긴 영상 생성 시간 (T스텝 만큼 실시간 생성 어려움)
- 딥페이크 악용 방지: C2PA 워터마크, 콘텐츠 인증 표준 확대
활용
- 할리우드 프리 프로덕션: 시각 필수품 제작 비용 감소
- 콘텐츠 크리에이터: 릴 리얼스, 유튜브 숏츠
- 수평사진스: 종료 모델 활용
관련 포스트