어제도 없던 모델이 오늘 나왔습니다. 중국 상하이의 AI 스타트업 MiniMax가 6월 1일, 새 플래그십 모델 M3를 정식 출시했어요. 조용히 등장한 것치고는 내용이 꽤 충격적인데요, 소프트웨어 엔지니어링 벤치마크인 SWE-bench Pro에서 OpenAI의 GPT-5.5(58.6%)를 제치고 **59.0%**를 기록했거든요. Gemini 3.1 Pro도 뒤로 밀렸고요.
솔직히 처음엔 "또 중국 회사 자체 발표 아닌가?" 싶었는데, SWE-bench Pro는 제3자 기관 기준이라서 그냥 흘려보내기가 좀 어렵더라고요. BrowseComp(웹 탐색 능력 평가) 에서도 83.5점을 기록하면서 Claude Opus 4.7(79.3점)을 앞섰습니다.
MiniMax는 2022년 초 설립됐습니다. 창업자 옌쥔제(Yan Junjie)는 중국 AI 대기업 SenseTime 부사장 출신이고, 알리바바가 2024년에 6억 달러 투자 라운드를 이끌었어요. 텐센트, HongShan, IDG Capital도 투자자 명단에 있습니다. 올해 초 홍콩 증시에 상장(종목코드 00100.HK)한 이후 주가가 IPO 대비 약 400% 올라서 지금 시가총액은 약 337억 달러(한화 약 46조 원) 수준이에요. 최근엔 상하이 스타마켓(STAR) 이중 상장도 준비 중이라는 소식도 들리고요.
근데 이 정도 규모 회사인데 한국에서는 왜 잘 모르냐고요? 저도 잘 모르겠어요. 중국 AI 회사들이 종종 그렇게 조용히 커있더라고요. 이번엔 그냥 넘어가기 어렵겠다 싶었습니다.
M3의 핵심: Sparse Attention
M3의 가장 특징적인 기술은 MiniMax Sparse Attention(MSA) 아키텍처입니다. 기존 트랜스포머 모델들이 모든 토큰 쌍 간의 관계를 전부 계산하는 Dense Attention 방식을 쓴다면, MSA는 꼭 필요한 관계에만 집중합니다. 그 덕분에 연산량이 이전 모델 대비 약 1/20 수준으로 줄었다고 해요. 성능을 올리면서 비용을 그렇게까지 낮춘 게 이 아키텍처 덕분이라는 거고요.
컨텍스트 창은 최대 100만 토큰(1M)으로, 이전 모델(M2.7)의 무려 5배입니다. 512K 토큰까지는 고품질로 보장되고, 텍스트·이미지·영상 입력을 모두 기본 지원합니다.
12시간 동안 혼자 돌아간 코딩 에이전트
MiniMax가 공개한 데모 중 눈에 띄