마이크로소프트가 드디어 자체 AI 모델을 꺼내들었습니다. OpenAI에 의존하지 않고 처음부터 직접 만든 추론 특화 모델이에요. Build 2026 컨퍼런스에서 Mustafa Suleyman이 직접 무대에 올라 공개한 이 모델의 이름은 MAI-Thinking-1 — 마이크로소프트 AI 브랜드의 첫 번째 플래그십 추론 모델입니다.
근데 이게 단순한 신제품 발표가 아니에요. 마이크로소프트는 그동안 OpenAI에 수백억 달러를 투자하면서 GPT 계열 모델을 자사 제품 곳곳에 적용해왔거든요. Azure, Microsoft 365, Copilot이 전부 거기에 기반하고 있었으니까요. 그런데 이번에 "우리가 직접 만든 모델"을 공식 발표했다는 건, 단순히 포트폴리오를 다양화하는 게 아니라 전략적 독립성을 확보하겠다는 의지로 읽혀요. 실제로 이번 발표에서 "OpenAI 데이터 증류(distillation)를 하지 않았다"고 따로 강조했는데, 업계 기준으로 보면 그냥 지나칠 수 없는 멘트입니다.
기술 스펙을 보면 꽤 흥미롭습니다. 활성 파라미터는 350억 개지만, Mixture of Experts 구조를 사용해서 총 파라미터는 무려 1조 개에 달해요. 컨텍스트 창은 256K 토큰이고, 학습 데이터는 전부 상업적으로 라이선스된 클린 데이터만 사용했다고 합니다. 멀티스텝 명령어 처리, 긴 컨텍스트 추론, 코드 생성에 특히 강하도록 설계됐다고 해요.
성능 수치가 눈에 띄어요. AIME 2025에서 97.0%, AIME 2026에서 94.5%를 기록했는데, 이건 수학·과학 추론 능력을 측정하는 대표적인 어려운 벤치마크입니다. 그리고 독립 평가자들이 참여한 블라인드 사이드-바이-사이드 평가에서 Claude Sonnet 4.6보다 선호도가 높았다고 하고, 코딩 벤치마크 SWE Bench Pro에서는 Claude Opus 4.6에 맞먹는 수준이라고 발표했어요.
솔직히 이 수치를 액면 그대로 다 믿기는 어렵습니다. 자기 모델 발표할 때 유리한 벤치마크만 골라서 보여주는 건 업계의 오랜 관행이니까요. 그래도 외부 평가자를 투명하게 활용한 블라인드 테스트를 근거로 제시했다는 건 그냥 허튼소리라고 보기도 애매해요.
현재 Azure AI Foundry에서 프라이빗 프리뷰로 접근 가능하고, 기존 Chat Completions API와 호환됩니다. function calling과 멀티레이어 명령어 처리도 지원해요. Microsoft 365 Copilot의 에이전트 모드에 탑재될 예정이라 Word, Excel, PowerPoint에서도 곧 만나볼 수 있겠네요. 가격 면에서도 고비용 모델 대비 낮은 토큰 비용을 강조하고 있어서, 기업 고객 입장에서는 꽤 매력적인 선택지가 될 것 같습니다.
개인적으로는 이 발표가 OpenAI와 마이크로소프트 관계 변화의 가장 뚜렷한 신호라고 봐요. 두 회사가 파트너십을 유지하면서도 내부적으로 독자 노선을 키워온 거잖아요. 앞으로 Copilot에서 어떤 모델이 기본으로 쓰이게 될지, OpenAI와의 계약 구조는 어떻게 바뀔지 — 그 부분이 기술 스펙보다 어쩌면 더 중요한 이야기일 수도 있어요.