오픈AI와 브로드컴이 LLM 추론 전용 ASIC '할라피뇨(Jalapeño)'를 6월 24일 공식 공개했어요. 단 9개월 만에 테이프아웃을 완료했고, GPU 대비 토큰당 추론 비용 50% 절감이 목표예요. 오픈AI 사상 첫 자체 실리콘으로, NVIDIA 의존도를 낮추는 결정적 전환점이에요.
오픈AI가 자체 칩을 만들 거라는 루머는 꽤 오래됐는데, 드디어 실물이 나왔어요. 6월 24일, 오픈AI와 브로드컴이 공동 개발한 LLM 추론 전용 ASIC '할라피뇨(Jalapeño)'를 공식 발표했어요. 오픈AI 공식 블로그에도 올라왔고, 브로드컴 CEO 혹 탄이 직접 성능 수치를 공개했어요.
이름은 귀엽지만 숫자는 안 귀여워요. 혹 탄이 블룸버그에 밝힌 초기 테스트 수치 기준, 현 세대 GPU 대비 토큰당 추론 비용이 약 50% 줄어든다고 해요. 자사 워크로드 기준이라서 독립 검증은 아직 없지만, 이 숫자가 실제라면 ChatGPT 서비스 운영 비용이 절반 가까이 내려가는 거예요.
개발 기간이 더 놀라워요. 초기 설계부터 테이프아웃까지 딱 9개월이었대요. 고성능 첨단 반도체 업계에서 이건 거의 전례 없는 속도예요. 이게 가능했던 이유 중 하나가 흥미로운데, 오픈AI 자체 모델이 칩 설계·최적화 과정 일부를 가속했다고 해요. AI가 자신이 돌아갈 칩을 설계하는 데 기여한 셈이에요.
할라피뇨는 GPU가 아니에요. LLM 추론에만 특화된 ASIC이고, 훈련용이 아니에요. 수십억 명이 매일 쓰는 ChatGPT 응답 처리, 즉 추론 단계에서만큼은 NVIDIA 없이 돌리겠다는 거예요. 훈련은 여전히 NVIDIA에 의존하지만, 서비스 비용의 가장 큰 부분인 추론을 잡으면 수지가 크게 달라져요.
근데 왜 지금일까요? 오픈AI 2026년 1분기 매출이 57억 달러인데 영업 마진은 -122%예요. 손실의 가장 큰 부분이 컴퓨팅 비용이고, 그중 추론이 핵심이에요. IPO를 앞두고 수익성을 보여줘야 하는 상황에서 자체 칩은 단순한 기술 자랑이 아니라 생존 전략에 가깝죠. 📊
2026년 말 첫 배포가 목표고, TSMC가 제조를 담당해요. 이후 멀티제너레이션 플랫폼으로 확장하겠다고 했는데, 그 말은 할라피뇨가 끝이 아니라 시작이라는 뜻이에요. 구글이 TPU를 v1부터 꾸준히 키워온 것처럼, 오픈AI도 자체 실리콘 로드맵을 쌓겠다는 거고요.
사실 이런 행보는 구글·아마존·메타·MS가 이미 걸은 길이에요. 오픈AI는 빅테크 중 가장 늦었어요. 근데 늦은 만큼 9개월 테이프아웃이라는 속도로 만회한 것 같은 인상이에요. AI가 칩 설계를 도왔다는 것도, 단순히 빠른 게 아니라 방법론 자체를 바꾼 거라서 앞으로 더 빨라질 가능성도 있어요.
할라피뇨가 공개 검증에서 50% 비용 절감을 실제로 증명하면, 오픈AI의 경쟁력은 완전히 다른 차원이 돼요. 반대로 기대에 못 미치면... 뭐, NVIDIA 주가는 잠깐 흔들렸다가 다시 올라갈 거예요. 어쨌든 2026년 말이 기대되는 발표예요. 🚀
출처