바이트댄스가 오늘 Volcano Engine FORCE 컨퍼런스에서 Seedance 2.5를 공개했어요. 업계 최초로 30초 영상을 원샷으로 생성하고, 레퍼런스를 최대 50개까지 동시에 입력할 수 있어요. 4K 출력을 지원하며 7월 초 공개 예정으로, AI 영상 생성 기술의 새로운 기준을 세웠어요.
바이트댄스가 오늘 꽤 충격적인 걸 들고 나왔어요. 틱톡 모회사로 알려진 바이트댄스의 클라우드 사업부 볼케이노 엔진(Volcano Engine)이 오늘 FORCE 컨퍼런스에서 Seedance 2.5를 발표했는데, AI 영상 생성의 기존 한계를 몇 가지 동시에 뚫는 내용이에요.
가장 눈에 띄는 건 30초 원샷 생성이에요. 기존 AI 영상 모델들은 대부분 5~15초 정도의 클립을 생성하는 게 한계였어요. Sora, Runway, Kling 같은 모델들도 그 이상은 여러 클립을 이어붙이는 방식을 썼어요. Seedance 2.5는 처음부터 30초를 하나의 생성으로 만들어내요. 이게 단순히 숫자가 커진 게 아니라 — 긴 영상일수록 인물과 배경의 일관성 유지가 극도로 어렵거든요. 그걸 30초 내내 유지한다는 게 기술적으로 의미 있는 지점이에요.
두 번째 포인트는 레퍼런스 입력 개수예요. Seedance 2.5는 이미지, 오디오, 영상을 포함해서 최대 50개의 레퍼런스를 동시에 받아들일 수 있어요. 이전 버전 Seedance 2.0이 12개였는데, 이번에 4배 이상 늘어난 거예요. 이게 왜 중요하냐면 — 영화나 광고 제작에서는 특정 인물 얼굴, 특정 장소 분위기, 특정 의상 스타일을 동시에 참조해야 하는 경우가 많아요. 레퍼런스가 많을수록 제작자 의도에 훨씬 가까운 결과물이 나와요.
해상도는 4K를 지원해요. Seedance 2.0은 이날 행사에서 4K 업데이트를 받았고, Seedance 2.5는 처음부터 4K를 기본으로 해요. 게다가 프레임 일부만 다시 그리는 인페인팅 기능도 강화됐는데, 나머지 부분은 건드리지 않으면서 특정 영역만 수정할 수 있어요.
다만 아직 쓸 수 없어요. 현재는 글로벌 엔터프라이즈 베타 단계이고, 일반 공개는 7월 초를 목표로 하고 있어요. 바이트댄스는 이날 행사에서 Seedance 2.5 외에도 Seedance 2.0의 4K 업데이트, Seedream 5.0 이미지 모델, 새로운 Doubao 언어 모델 티어까지 한꺼번에 발표했어요.
경쟁 구도를 보면, OpenAI의 Sora, Google의 Veo 2, Runway가 AI 영상 시장의 주요 플레이어예요. 근데 바이트댄스는 틱톡을 통해 이미 수억 명의 영상 소비 데이터와 창작자 생태계를 보유하고 있어요. Seedance 2.5가 틱톡 창작자들에게 풀린다면 — 영상 제작의 문턱이 또 한 번 낮아질 수 있어요. 7월 공개 때 어떤 반응이 나올지 주목할 만해요.
출처