알리바바가 Qwen 3.7 Max(1조+ 파라미터)와 Qwen 3.7 Plus(멀티모달)를 6월 초 잇달아 공개했어요. Max 가격은 Claude Opus 4.7의 절반, Plus는 Max보다 6배 저렴한 $0.40/$1.60/M 토큰이에요. 중국 AI 모델이 가격 경쟁력으로 프런티어 모델 시장을 또 한 번 뒤흔들고 있습니다.
알리바바 클라우드가 조용하지만 꽤 도발적인 두 모델을 연달아 내놨어요. 🚀 Qwen 3.7 Max와 Qwen 3.7 Plus예요. 5월 20일 싱가포르에서 열린 첫 번째 Qwen 컨퍼런스에서 공개됐고, 6월 1~2일 정식 출시됐어요. 지금은 알리바바 클라우드 Model Studio, OpenRouter, Together AI 등에서 바로 쓸 수 있어요.
Max부터 보면, 파라미터 수가 1조 개를 넘어요. 컨텍스트 윈도우는 100만 토큰(1M)이고, 가격은 입력 100만 토큰당 2.50달러, 출력은 7.50달러예요. Artificial Analysis Intelligence Index 기준 56.6점을 기록했는데, 이게 Claude Opus 4.7과 유사한 수준이에요. 근데 Opus 4.7 요금은 Max의 두 배 정도예요. 이게 핵심이에요.
Max의 또 다른 특이한 스펙은 '35시간 자율 운영'이에요. 성능 저하 없이 35시간 동안 혼자서 에이전트 작업을 처리할 수 있다고 알리바바가 밝혔어요. 아직 측정 조건이 완전히 공개되진 않았는데, 에이전틱 AI 방향으로의 분명한 포지셔닝이에요.
Plus는 또 다른 각도예요. 💼 Qwen 3.7 Max의 텍스트 백본 위에 비전·비디오 이해 기능을 얹은 멀티모달 에이전트 모델인데, 가격이 Max의 6분의 1 수준이에요 — 입력 100만 토큰당 0.40달러, 출력은 1.60달러예요. GUI 조작, 브라우저 자동화, 화면 인식 같은 에이전트 작업에 특화돼 있고요. 참고로 이건 오픈웨이트 공개 습관을 깨고 처음으로 완전 비공개(closed-weight)로 출시한 Qwen 모델이에요.
ScreenSpot Pro 벤치마크 — GUI 에이전트 능력을 평가하는 테스트 — 에서 Qwen 3.7 Plus는 79.0점이에요. GPT-5.4가 67.4점, Claude Opus 4.6이 49.5점이었으니 꽤 의미 있는 격차예요. 물론 하나의 벤치마크로 모든 걸 판단할 순 없지만, 화면을 보고 클릭·입력하는 에이전트 작업에서 강점을 보이는 건 분명해요.
이 두 모델이 갖는 의미는 "중국 AI가 또 새 모델 냈네"를 훨씬 넘어요. DeepSeek, MiniMax M3에 이어 Qwen 3.7까지 — 프런티어 성능을 드라마틱하게 낮은 가격에 제공하는 패턴이 이어지고 있어요. 기업 고객 입장에서는 "굳이 GPT나 Claude를 쓸 이유가 있나?"라는 질문을 점점 더 진지하게 하게 될 거예요. OpenAI와 Anthropic이 가격 경쟁력 이상의 차별화를 어떻게 보여줄 수 있을지가 앞으로의 관전 포인트 같아요.
출처