Krea AI가 6월 22일 129억 파라미터 텍스트-이미지 모델 Krea 2의 가중치를 공개했어요. Raw(베이스)와 Turbo(2초 생성) 두 버전이 Hugging Face에서 다운로드 가능해요. 50석 미만 소규모 팀은 무료, 그 이상은 엔터프라이즈 계약이 필요한 커스텀 라이선스예요.
이미지 생성 AI 분야에서 꽤 의미 있는 오픈소스 공개가 나왔어요. Krea AI가 6월 22일 자사 텍스트-이미지 모델 Krea 2의 가중치를 허깅페이스에 올렸는데, 스펙을 보면 단순한 '공개용 경량 모델'이 아니에요. 📸
모델 아키텍처는 디퓨전 트랜스포머(DiT) 단일 스트림 구조, 파라미터 수는 128억 9,000만 개예요. 블록 수 28개, 너비 6144. 스케일만 보면 상당히 진지한 모델이에요. Krea는 앞서 8,300만 달러(약 1,100억 원) 투자를 받았고 사용자가 3,000만 명을 넘어선다고 주장하는 스타트업인데, 이 규모의 모델 가중치를 외부에 공개한 건 꽤 과감한 결정이에요.
공개된 버전은 두 가지예요.
Krea 2 Raw는 중간 훈련 체크포인트를 그대로 꺼낸 베이스 모델이에요. RLHF 같은 후처리를 거치지 않아서 바로 쓰기엔 불편하지만, 파인튜닝·파생 모델 개발에는 오히려 '백지 캔버스'처럼 쓸 수 있어요. 연구자나 파인튜너들이 환영할 만한 릴리즈예요.
Krea 2 Turbo는 실제 서비스용으로 다듬어진 버전이에요. 근데 특징이 꽤 인상적인데, 추론 스텝 8번만으로 2초 안에 이미지를 뽑아낸다는 거예요. guidance_scale=0.0으로 돌리는 고도로 증류된 모델인데, 이 속도면 실시간에 가까운 워크플로에서 쓸 수 있어요. ⚡
라이선스는 커스텀 라이선스를 적용했어요. 핵심 조건은 두 가지인데, 직원 50명 이하 팀은 무료로 쓸 수 있고, 50명 초과 기업은 엔터프라이즈 계약이 필요해요. 또 규모와 무관하게 모든 사용자가 불법 콘텐츠·아동 성착취물·비동의 친밀 이미지 생성을 막는 기술적 안전장치를 반드시 구현해야 해요. 오픈소스라고 해도 책임을 사용자에게 완전히 전가하지 않겠다는 입장이에요.
솔직히 '2초 이미지 생성'이라는 숫자가 제일 눈에 띄어요. 현재 오픈소스 이미지 모델 중에서 이 속도를 내는 건 많지 않거든요. Stable Diffusion 계열 빠른 버전들도 보통 4~10초대인 걸 생각하면, Krea 2 Turbo는 그 절반 이하예요. 디자인 툴이나 실시간 인터랙티브 앱을 만드는 개발자들한테는 꽤 매력적인 옵션이 될 것 같아요.
출처