Lofted

Z.ai의 오픈소스 AI 모델 GLM-5.2가 코딩 벤치마크에서 GPT-5.5를 앞질렀어요. 753B 파라미터 MoE 모델로, 입력 토큰 비용은 GPT-5.5의 6분의 1인 $1.4/백만 토큰이에요. 중국발 오픈소스 AI가 클로즈드 프론티어를 실제로 넘어서는 전환점이 됐어요.

6월 17일, 중국 AI 스타트업 Z.ai가 GLM-5.2를 허깅페이스에 전면 공개했어요. 발표하자마자 개발자 커뮤니티가 술렁거렸는데, 이유는 단순해요. 코딩 벤치마크에서 GPT-5.5보다 높은 점수가 나왔거든요.

근데 이게 단순히 숫자 하나 높은 게 아니에요. 장기 코드 엔지니어링 과제를 측정하는 FrontierSWE 벤치마크에서 GLM-5.2가 74.4%, GPT-5.5가 72.6%를 기록했어요. 모델 훈련 능력을 측정하는 PostTrainBench에서는 34.3% 대 28.4%로 격차가 더 벌어졌고요. 블라인드 아레나 코딩 테스트에서도 전체 2위를 기록해 Claude Opus 4.8을 넘어섰어요.

사실 성능보다 더 눈에 띄는 건 가격이에요. 입력 토큰 기준으로 GPT-5.5 대비 약 6분의 1 수준이에요. 입력 $1.4/백만 토큰, 출력 $4.4/백만 토큰이거든요. 스타트업이나 개인 개발자들한테는 사실상 가격 혁명에 가까워요. 허깅페이스와 Z.ai API에서 바로 사용 가능하고, 20개 이상 서드파티 코딩 환경에서도 통합이 완료됐어요.

아키텍처 얘기를 잠깐 하면, GLM-5.2는 Mixture-of-Experts(MoE) 방식이에요. 총 파라미터는 753B지만 추론 시 실제로 활성화되는 건 약 40B 수준이에요. 대형 모델 성능을 내면서도 연산 비용을 낮출 수 있는 구조죠. 거기다 IndexShare라는 아키텍처 최적화 기술로 컴퓨팅 오버헤드를 3배 가까이 줄였다고 해요.

컨텍스트 윈도우도 주목할 만해요. 1M 토큰을 손실 없이 처리한다고 Z.ai가 주장하는데, 이 정도면 대규모 코드베이스 전체를 한 번에 넣고 분석하는 것도 가능한 거예요. 최대 출력도 131,072 토큰이고요.

솔직히 Z.ai가 완전히 생소한 이름이에요. GLM 시리즈 자체는 칭화대 AI연구소 KEG랩이 만들던 건데, Z.ai는 그 계보를 이어받은 상용화 조직이에요. 이제까지 글로벌 주목도는 DeepSeek이나 Moonshot AI에 비해 낮았거든요. 그런데 이번에 MIT 라이선스로 전면 공개하면서 분위기가 달라진 것 같아요.

개인적으

검색

오픈소스가 GPT-5.5를 이겼다 — GLM-5.2, 6분의 1 가격에 코딩 벤치마크 1위