중국 메이투안이 1.6조 파라미터 AI 모델 LongCat-2.0을 오픈소스로 공개했어요. 엔비디아 칩 없이 국산 어센드 910 칩 5만 장으로만 학습했다는 게 핵심이에요. 반도체 수출규제로도 중국 AI를 막기 어렵다는 걸 보여주는 사례라 주목돼요.
배달앱으로 유명한 그 메이투안 맞아요. 음식 배달 중개업체가 이번엔 프런티어급 AI 모델을 내놨어요. LongCat-2.0이라는 이름의 이 모델, 파라미터가 무려 1.6조 개예요. 근데 숫자보다 더 놀라운 건 학습 방식이에요. 엔비디아 GPU를 단 한 장도 쓰지 않고, 화웨이의 어센드 910 칩 5만 장으로만 처음부터 끝까지 학습시켰다고 밝혔거든요.
구조를 좀 더 뜯어보면, LongCat-2.0은 MoE(전문가 혼합) 방식이라 1.6조 개 파라미터를 다 쓰는 게 아니라 토큰마다 필요한 전문가 조합만 골라 쓰는 구조예요. 그 덕에 실제 연산에 활성화되는 파라미터는 훨씬 적고, 컨텍스트 윈도우는 100만 토큰까지 지원해요. 메이투안은 이 모델을 자체적으로 "제미나이, GPT-5.5, 클로드 오퍼스급 폐쇄형 모델과 견줄 만하다"고 소개했는데, 특히 코드 이해와 에이전트형 작업에서 강점을 강조했어요. 실제로 오픈라우터 사용량 랭킹에서 상위권을 찍었다는 얘기도 나와요.
솔직히 이 소식이 왜 중요한지는 맥락을 알아야 와닿아요. 미국은 계속 엔비디아 첨단 GPU의 중국 수출을 막아왔잖아요. 그런데 딥시크에 이어 메이투안까지, 국산 ASIC 클러스터만으로 트릴리언 파라미터급 모델을 훈련시켜서 오픈소스로 풀어버렸어요. 이건 수출 규제의 실효성 자체에 물음표를 던지는 사례예요. 화웨이 어센드 칩과 자체 병렬처리 기술, HCCL 통신 라이브러리 조합만으로 이 정도 규모를 소화했다는 게, 중국 반도체 생태계가 예상보다 빠르게 자립하고 있다는 신호로 읽혀요.
물론 검증되지 않은 부분도 있어요. 메이투안이 자체 발표한 벤치마크 비교라 제3자 검증이 필요하고, 정확한 학습 토큰 수나 라이선스 세부조건도 아직 다 공개되진 않았어요. 그래도 오픈소스로 가중치를 풀었다는 것 자체는 확인된 사실이라, 커뮤니티에서 직접 검증이 시작될 거예요. 저는 개인적으로 이 흐름이 재밌는 게, 정작 미국 규제가 겨냥한 건 '중국이 첨단 모델을 못 만들게 막는 것'이었는데 결과적으로는 '자체 칩 생태계를 더 빨리 키우게 만든' 거 아닌가 싶거든요.
앞으로 다른 중국 빅테크들도 비슷한 행보를