Lofted

어제도 없던 모델이 오늘 나왔습니다. 중국 상하이의 AI 스타트업 MiniMax가 6월 1일, 새 플래그십 모델 M3를 정식 출시했어요. 조용히 등장한 것치고는 내용이 꽤 충격적인데요, 소프트웨어 엔지니어링 벤치마크인 SWE-bench Pro에서 OpenAI의 GPT-5.5(58.6%)를 제치고 **59.0%**를 기록했거든요. Gemini 3.1 Pro도 뒤로 밀렸고요.

솔직히 처음엔 "또 중국 회사 자체 발표 아닌가?" 싶었는데, SWE-bench Pro는 제3자 기관 기준이라서 그냥 흘려보내기가 좀 어렵더라고요. BrowseComp(웹 탐색 능력 평가) 에서도 83.5점을 기록하면서 Claude Opus 4.7(79.3점)을 앞섰습니다.

MiniMax는 2022년 초 설립됐습니다. 창업자 옌쥔제(Yan Junjie)는 중국 AI 대기업 SenseTime 부사장 출신이고, 알리바바가 2024년에 6억 달러 투자 라운드를 이끌었어요. 텐센트, HongShan, IDG Capital도 투자자 명단에 있습니다. 올해 초 홍콩 증시에 상장(종목코드 00100.HK)한 이후 주가가 IPO 대비 약 400% 올라서 지금 시가총액은 약 337억 달러(한화 약 46조 원) 수준이에요. 최근엔 상하이 스타마켓(STAR) 이중 상장도 준비 중이라는 소식도 들리고요.

근데 이 정도 규모 회사인데 한국에서는 왜 잘 모르냐고요? 저도 잘 모르겠어요. 중국 AI 회사들이 종종 그렇게 조용히 커있더라고요. 이번엔 그냥 넘어가기 어렵겠다 싶었습니다.

M3의 핵심: Sparse Attention

M3의 가장 특징적인 기술은 MiniMax Sparse Attention(MSA) 아키텍처입니다. 기존 트랜스포머 모델들이 모든 토큰 쌍 간의 관계를 전부 계산하는 Dense Attention 방식을 쓴다면, MSA는 꼭 필요한 관계에만 집중합니다. 그 덕분에 연산량이 이전 모델 대비 약 1/20 수준으로 줄었다고 해요. 성능을 올리면서 비용을 그렇게까지 낮춘 게 이 아키텍처 덕분이라는 거고요.

컨텍스트 창은 최대 100만 토큰(1M)으로, 이전 모델(M2.7)의 무려 5배입니다. 512K 토큰까지는 고품질로 보장되고, 텍스트·이미지·영상 입력을 모두 기본 지원합니다.

12시간 동안 혼자 돌아간 코딩 에이전트

MiniMax가 공개한 데모 중 눈에 띄

지난 5월 28일, 앤트로픽(Anthropic)이 시리즈 H 투자 라운드로 **650억 달러(약 89조 원)**를 조달했다는 발표가 나왔습니다. 숫자 자체도 충격적이지만, 더 눈에 띄는 건 이번 라운드 이후 앤트로픽의 기업가치가 9,650억 달러에 달하게 됐다는 거예요. 이 수치, 경쟁사 OpenAI의 기업가치(8,520억 달러)를 처음으로 넘어선 겁니다.

AI 역사에서 꽤 중요한 순간이에요. OpenAI가 ChatGPT로 생성 AI 붐을 이끌어온 지난 몇 년간, 앤트로픽은 항상 2인자처럼 보였는데, 이제 그 구도가 바뀌었습니다.

이번 투자에는 단순한 VC들만 있는 게 아니에요. Altimeter Capital, Sequoia Capital, Coatue, Greenoaks 같은 실리콘밸리 정통 투자자들뿐 아니라, 삼성, SK하이닉스, 마이크론 같은 반도체 기업들도 전략적 파트너로 이름을 올렸습니다. AI 모델 회사인데 하드웨어 생태계 전반과 묶이고 있다는 게 흥미롭습니다. 앤트로픽이 단순히 API를 파는 회사를 넘어, 인프라 수준의 플레이어가 되려 한다는 신호처럼 읽혀요.

솔직히 9,650억 달러라는 기업가치가 현실적인지에 대해서는 저도 약간 회의적이에요. 하지만 앤트로픽이 올해 연간 반복 매출(ARR) 470억 달러를 넘겼고, 올해 처음으로 영업흑자가 예상된다는 점을 보면, 이 숫자가 마냥 공허한 건 아닌 것 같긴 합니다. 그래도 1조 달러 가까이는 좀...

같은 날 발표된 게 또 있어요. 바로 클로드 오퍼스 4.8(Claude Opus 4.8) 입니다. 소프트웨어 엔지니어링 벤치마크 SWE-Bench Pro에서 69.2%를 기록하며 GPT-5.5와 Gemini 3.1 Pro를 모두 앞질렀고, 기존 모델 대비 가격은 3분의 1로 떨어졌어요. 패스트 모드는 2.5배 빨라졌고요. 모델 성능 수치가 너무 자주 갱신되다 보니 감흥이 좀 무뎌지긴 했는데, 이번엔 '다이나믹 워크플로(Dynamic Workflows)'라는 기능이 특이했습니다.

아직 리서치 프리뷰 단계지만, Claude Code 환경에서 메인 에이전트 하나가 수백 개의 서브에이전트를 병렬로 생성해 동시에 작업을 처리할 수 있다고 해요. 수십만 줄 규모의 코드베이스 마이그레이션을 단일 세션에서 처리하는 것도 가능하다는 건데, 이게 실제로 안정적으로 작동한다면 개발자 워크플로에 꽤 큰 변화가 올

Home

젠슨 황, 오늘 대만에서 AI PC 시대 선언: RTX Spark로 노트북에서 120B 모델 직접 돌린다

GPT-5.5 넘어선 중국 AI, MiniMax M3 오늘 공식 출시

앤트로픽, OpenAI를 처음으로 추월하다 — 그리고 아직 공개되지 않은 모델이 있다