오픈소스가 GPT-5.5를 이겼다 — GLM-5.2, 6분의 1 가격에 코딩 벤치마크 1위

Z.ai의 오픈소스 AI 모델 GLM-5.2가 코딩 벤치마크에서 GPT-5.5를 앞질렀어요. 753B 파라미터 MoE 모델로, 입력 토큰 비용은 GPT-5.5의 6분의 1인 $1.4/백만 토큰이에요. 중국발 오픈소스 AI가 클로즈드 프론티어를 실제로 넘어서는 전환점이 됐어요.

6월 17일, 중국 AI 스타트업 Z.ai가 GLM-5.2를 허깅페이스에 전면 공개했어요. 발표하자마자 개발자 커뮤니티가 술렁거렸는데, 이유는 단순해요. 코딩 벤치마크에서 GPT-5.5보다 높은 점수가 나왔거든요.

근데 이게 단순히 숫자 하나 높은 게 아니에요. 장기 코드 엔지니어링 과제를 측정하는 FrontierSWE 벤치마크에서 GLM-5.2가 74.4%, GPT-5.5가 72.6%를 기록했어요. 모델 훈련 능력을 측정하는 PostTrainBench에서는 34.3% 대 28.4%로 격차가 더 벌어졌고요. 블라인드 아레나 코딩 테스트에서도 전체 2위를 기록해 Claude Opus 4.8을 넘어섰어요.

사실 성능보다 더 눈에 띄는 건 가격이에요. 입력 토큰 기준으로 GPT-5.5 대비 약 6분의 1 수준이에요. 입력 $1.4/백만 토큰, 출력 $4.4/백만 토큰이거든요. 스타트업이나 개인 개발자들한테는 사실상 가격 혁명에 가까워요. 허깅페이스와 Z.ai API에서 바로 사용 가능하고, 20개 이상 서드파티 코딩 환경에서도 통합이 완료됐어요.

아키텍처 얘기를 잠깐 하면, GLM-5.2는 Mixture-of-Experts(MoE) 방식이에요. 총 파라미터는 753B지만 추론 시 실제로 활성화되는 건 약 40B 수준이에요. 대형 모델 성능을 내면서도 연산 비용을 낮출 수 있는 구조죠. 거기다 IndexShare라는 아키텍처 최적화 기술로 컴퓨팅 오버헤드를 3배 가까이 줄였다고 해요.

컨텍스트 윈도우도 주목할 만해요. 1M 토큰을 손실 없이 처리한다고 Z.ai가 주장하는데, 이 정도면 대규모 코드베이스 전체를 한 번에 넣고 분석하는 것도 가능한 거예요. 최대 출력도 131,072 토큰이고요.

솔직히 Z.ai가 완전히 생소한 이름이에요. GLM 시리즈 자체는 칭화대 AI연구소 KEG랩이 만들던 건데, Z.ai는 그 계보를 이어받은 상용화 조직이에요. 이제까지 글로벌 주목도는 DeepSeek이나 Moonshot AI에 비해 낮았거든요. 그런데 이번에 MIT 라이선스로 전면 공개하면서 분위기가 달라진 것 같아요.

개인적으로 흥미로운 건 오픈소스 AI의 성장 속도예요. 불과 몇 달 전만 해도 "오픈소스는 클로즈드 모델에 비해 6개월~1년 뒤처진다"는 게 업계 정설이었는데, 이제 격차가 거의 없어졌거나 오히려 역전된 벤치마크까지 나오고 있어요. DeepSeek R1, Kimi K2.7에 이어 GLM-5.2까지, 중국발 오픈소스 모델들이 프론티어 경쟁을 실제로 뒤흔들고 있어요.

앞으로 어떻게 될지는 아직 모르겠어요. 엔터프라이즈 지원, 안전성, 규정 준수 측면에서는 여전히 클로즈드 모델들이 강점이 있을 거예요. 하지만 순수 성능과 비용 면에서 오픈소스가 이미 프론티어에 도달했다면, 고가 모델들이 그 프리미엄을 정당화하기가 점점 어려워질 거예요.

출처

오픈소스가 GPT-5.5를 이겼다 — GLM-5.2, 6분의 1 가격에 코딩 벤치마크 1위

비슷한 주제의 글

덩치는 역대 최대, 그런데 공짜로 푼다 — 알리바바 큐원3.8-맥스 오픈소스 전환

역대 처음, 톱5 전부 중국산 — 오픈라우터 AI 모델 랭킹 뒤집혔다

예고한 그날 왔다 — 키미 K3, 사상 최대 오픈웨이트 모델 전체 공개 [후속]

사이트 인기 글

[후속] 브로드컴 장중 -14% 확정, 시총 3,000억 달러 증발 — 반도체 섹터 전방위 충격

마이크로소프트 양자 칩 Majorana 2 공개 — AI가 설계하고 신뢰도 1,000배 향상

스페이스X, 역사상 최대 IPO 시작 — 6월 12일 나스닥 SPCX로 데뷔