오늘(6월 1일) 젠슨 황이 타이베이 Computex 무대에 올라서 "useful AI has arrived(유용한 AI가 도착했다)"라고 선언했을 때, 솔직히 처음엔 그냥 마케팅 멘트인가 싶었어요. 매번 이런 거 하잖아요. 근데 이번엔 발표 스펙들을 하나씩 뜯어보다가 진짜 뭔가 달라지는 순간일 수도 있겠다는 느낌이 들었어요.
핵심은 RTX Spark라는 새 칩이에요. 엔비디아가 PC용으로 처음 만든 슈퍼칩인데, 단순 GPU가 아니에요. Blackwell RTX GPU(CUDA 코어 6,144개)와 20코어 Grace CPU를 NVLink-C2C 인터커넥트로 하나로 묶고, 최대 128GB 통합 메모리를 얹었어요. AI 연산 성능이 무려 1페타플롭. 숫자가 익숙하지 않으신 분들을 위해 말하면, 1페타플롭은 1초에 1,000조 번 연산한다는 거예요.
이게 왜 대단하냐면, 지금까지 120B(1200억) 파라미터짜리 LLM을 개인 노트북에서 돌린다는 건 사실상 불가능했거든요. 메모리가 수십 GB씩 필요하고, 속도도 너무 느리니까요. 그래서 다들 클라우드에 쏘는 수밖에 없었던 건데, RTX Spark는 이걸 로컬에서 1M(100만) 토큰 컨텍스트로 처리할 수 있다고 해요. 내 노트북이 사실상 ChatGPT 수준의 AI 서버가 된다는 뜻이에요. 근데 데이터는 외부로 안 나가고, 내 기기 안에서만 돌아가고요.
Intel이랑 AMD 입장에서는 좀 당황스러운 상황일 거예요. 노트북 칩 시장은 지금까지 이 두 회사 세상이었는데, 엔비디아가 CPU까지 내장한 올인원 칩을 들고 직접 뛰어든 거니까요. ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI가 올 가을에 RTX Spark 탑재 노트북 출시 예정이고, 두께 14mm에 무게 3파운드(약 1.36kg)부터 시작하는 초슬림 라인업이라고 해요. Adobe도 이미 Photoshop과 Premiere를 RTX Spark에 맞게 재설계해서 AI·그래픽 처리 속도를 2배 높인다고 발표했어요.
사실 오늘 RTX Spark만 나온 게 아니에요. 젠슨 황은 거의 쉬지도 않고 발표를 쏟아냈는데요. 데이터센터용 Vera Rubin 플랫폼이 풀 프로덕션에 돌입했고, 엔비디아가 직접 만든 550B 파라미터 오픈 모델 Nemotron 3 Ultra도 공개했어요. 경쟁 모델 대