마이크로소프트가 오늘(6월 2일) Build 2026 컨퍼런스에서 자체 개발 AI 모델 7종을 동시에 공개했습니다. 이번 발표의 핵심은 MAI(Microsoft AI) 패밀리인데, 그 중 가장 눈길을 끄는 건 MAI-Thinking-1이에요. 마이크로소프트가 처음으로 내놓는 추론 특화 모델(reasoning model)입니다. 35억 개 활성 파라미터, 256K 컨텍스트 윈도우. 중요한 건 OpenAI 데이터나 모델 증류(distillation) 없이 자체적으로 처음부터 훈련됐다는 점이에요.
성능 면에서는 SWE Bench Pro 코딩 벤치마크에서 Anthropic Claude Opus 4.6과 동급이라고 발표됐고, 블라인드 평가에서 Claude Sonnet 4.6보다 평가자 선호도가 높았다는 결과도 제시됐습니다. 근데 솔직히, 이런 벤치마크 비교는 항상 자사에 유리하게 나오는 경향이 있잖아요. 실제로 써봐야 알겠지만, 적어도 마이크로소프트가 이제 "우리 모델도 경쟁력 있다"고 당당하게 말할 수 있는 수준엔 온 것 같습니다.
MAI 패밀리엔 다른 모델들도 있어요. MAI-Image-2.5는 텍스트-이미지 생성 모델로 Google 경쟁 모델을 ELO 벤치마크에서 앞선다고 했고, MAI-Transcribe-1.5는 43개 언어에서 최상위 수준의 음성 인식 정확도를 제공합니다. MAI-Voice-2는 15개 이상의 새 언어를 추가했고, MAI-Code-1은 이미 GitHub Copilot과 VS Code에 탑재됐어요. 일곱 개 모델을 한 번에 공개하는 건 꽤 공격적인 행보입니다.
그리고 사실 오늘 발표 중에 개발자들한테 가장 직접적인 영향을 줄 소식이 따로 있어요. Project Polaris 얘기예요. 오는 8월부터 GitHub Copilot에서 GPT-4 Turbo를 Project Polaris로 교체한다는 건데, 마이크로소프트가 자사 서비스 내에서 OpenAI 모델을 자체 모델로 대체하는 거잖아요. Mixture-of-Experts 아키텍처 기반이고, Rust나 Haskell 같은 비주류 언어에서 특히 성능 향상이 두드러진다고 했습니다. 팀 구독자들은 자동으로 전환되고, 원한다면 3개월간 GPT-4로 롤백도 가능합니다.
Windows Agent Framework 1.0도 오늘 MIT 라이선스로 오픈소스 공개됐어요. 로컬 Windows 기기, Windows 365 클라우드 PC, Azure Arc 엣지 디바이스 전반에서 에이전트를 실행할 수 있는 라이브러리입니다. Azure Agent Mesh라는 개념도 등장했는데, 여러 클라우드와 기기에 걸쳐 에이전트들이 협력하는 연합형 멀티에이전트 실행 환경이에요.
Satya Nadella CEO는 기조연설에서 "AI는 이제 동기적 어시스턴트에서 장기 실행 작업을 자율 처리하는 비동기 동료로 진화했다"고 했는데, 솔직히 이런 선언적 멘트는 매년 Build마다 나오긴 해요. 근데 이번엔 제품 수준에서 그 방향이 꽤 구체적으로 드러났습니다. Word, Excel, PowerPoint 전반에서 에이전트 모드가 기본값이 됐고, GitHub Copilot Workspace가 Enterprise에서 GA 상태로 전환됐으니까요.
마이크로소프트가 OpenAI와의 관계를 유지하면서 동시에 이렇게 빠르게 자체 AI 스택을 키울 수 있었던 건 결국 클라우드 인프라와 자본의 힘이겠죠. Copilot 안에서 OpenAI 모델 비중이 앞으로 어떻게 바뀔지, 그리고 MAI 모델들이 실제 서비스에서 경쟁력을 입증할 수 있을지는 앞으로 몇 달이 지나봐야 알 것 같습니다.