오늘(6월 1일) 젠슨 황이 타이베이 Computex 무대에 올라서 "useful AI has arrived(유용한 AI가 도착했다)"라고 선언했을 때, 솔직히 처음엔 그냥 마케팅 멘트인가 싶었어요. 매번 이런 거 하잖아요. 근데 이번엔 발표 스펙들을 하나씩 뜯어보다가 진짜 뭔가 달라지는 순간일 수도 있겠다는 느낌이 들었어요.
핵심은 RTX Spark라는 새 칩이에요. 엔비디아가 PC용으로 처음 만든 슈퍼칩인데, 단순 GPU가 아니에요. Blackwell RTX GPU(CUDA 코어 6,144개)와 20코어 Grace CPU를 NVLink-C2C 인터커넥트로 하나로 묶고, 최대 128GB 통합 메모리를 얹었어요. AI 연산 성능이 무려 1페타플롭. 숫자가 익숙하지 않으신 분들을 위해 말하면, 1페타플롭은 1초에 1,000조 번 연산한다는 거예요.
이게 왜 대단하냐면, 지금까지 120B(1200억) 파라미터짜리 LLM을 개인 노트북에서 돌린다는 건 사실상 불가능했거든요. 메모리가 수십 GB씩 필요하고, 속도도 너무 느리니까요. 그래서 다들 클라우드에 쏘는 수밖에 없었던 건데, RTX Spark는 이걸 로컬에서 1M(100만) 토큰 컨텍스트로 처리할 수 있다고 해요. 내 노트북이 사실상 ChatGPT 수준의 AI 서버가 된다는 뜻이에요. 근데 데이터는 외부로 안 나가고, 내 기기 안에서만 돌아가고요.
Intel이랑 AMD 입장에서는 좀 당황스러운 상황일 거예요. 노트북 칩 시장은 지금까지 이 두 회사 세상이었는데, 엔비디아가 CPU까지 내장한 올인원 칩을 들고 직접 뛰어든 거니까요. ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI가 올 가을에 RTX Spark 탑재 노트북 출시 예정이고, 두께 14mm에 무게 3파운드(약 1.36kg)부터 시작하는 초슬림 라인업이라고 해요. Adobe도 이미 Photoshop과 Premiere를 RTX Spark에 맞게 재설계해서 AI·그래픽 처리 속도를 2배 높인다고 발표했어요.
사실 오늘 RTX Spark만 나온 게 아니에요. 젠슨 황은 거의 쉬지도 않고 발표를 쏟아냈는데요. 데이터센터용 Vera Rubin 플랫폼이 풀 프로덕션에 돌입했고, 엔비디아가 직접 만든 550B 파라미터 오픈 모델 Nemotron 3 Ultra도 공개했어요. 경쟁 모델 대비 추론 속도가 5배라고 하고요. 로봇·자율주행용 월드 파운데이션 모델 Cosmos 3, 오픈 휴머노이드 로봇 레퍼런스 디자인 Isaac GR00T도 나왔어요. 발표 하나하나가 다 별도 뉴스거리인데, 이걸 하루에 다 쏟아낸 거예요.
개인적으로는 RTX Spark 얘기가 제일 흥미롭게 느껴져요. 클라우드 AI 서비스를 쓰면 내 대화 내용이 어딘가의 서버로 올라가는 거잖아요. 특히 기업 환경에서는 민감한 데이터를 외부로 못 보내는 경우가 많은데, 로컬에서 강력한 AI를 돌릴 수 있다면 그 벽이 상당히 낮아지죠.
물론 아직 모르는 게 더 많아요. 가격을 얼마로 책정할지, 배터리 수명은 어떻게 되는지, 실제 써보면 발표만큼 쾌적할지. 젠슨 황은 "PC가 재발명되고 있다"고 했는데, 그 말이 진짜인지 아닌지는 결국 올 가을 소비자들이 직접 써보고 나서야 알 수 있겠죠.