
엔비디아가 새로운 무기인 추론 전용칩을 공개하며 에이전틱 인공지능(AI) 시대 선도를 향한 의지를 드러냈다. 중앙처리장치(CPU)와 그래픽처리장치(GPU), 추론 칩을 하나로 묶는 통합 생태계 전략을 앞세워 AI 시장 재편도 예고했다.
엔비디아는 16일(현지시간) 미국 캘리포니아주 산호세에서 열린 '엔비디아 연례 개발자 컨퍼런스(GTC) 2026'에서 7개 신규 칩과 5개 랙으로 구성된 슈퍼컴퓨터(CPU+GPU) 라인업을 발표했다.
가장 주목 받은 것은 엔비디아가 지난해 인수한 그록과 공동 개발한 새로운 언어처리장치(LPU) '그록 3 LPU(랙 타입은 LPX)'다. 삼성전자 파운드리가 생산을 맡은 이 칩은 추론에 특화됐다.
기존 AI가 데이터 학습과 패턴에 따른 확률 기반 답변을 한다면, 추론은 사람과 같이 판단을 근거로 여러 단계에 걸쳐 결론을 이끌어낸다. 에이전틱 AI 시대에 추론이 중요해지는 것도 이 때문이다. 여기엔 복잡한 작업 수행을 위한 인프라, 컴퓨팅 파워가 필수다. 엔비디아가 그록 3를 발표한 이유다.
LPU는 추론 비용을 획기적으로 낮추는 데 특화됐다. 기업은 이용자가 질문을 던질 때마다 막대한 컴퓨팅 자원을 소모하는데, 추론 비용을 낮추지 못하면 이용자가 많아질수록 적자가 커진다. 추론 작업이 기업 수익성과 직결된다는 의미로 그록 3 같은 칩의 중요성도 높아질 전망이다.
엔비디아는 그록 3를 이날 세부 스펙을 발표한 '베라(CPU) 루빈(GPU)' 플랫폼에 결합, 통합 생태계를 완성할 계획이다. 기존에 없던 이종 칩간 결합으로 AI 분야 새로운 기술의 등장을 알렸다.
GPU '루빈(Rubin)'은 주로 훈련(Training)을 맡는다. CPU 베라(Vera)는 스크립팅이나 코드 실행, 멀티 에이전트 상호작용과 같은 에이전트 작업을 처리한다. 거대언어모델에서 실시간 실행(추론)은 대역폭이 높은 그로크의 추론 칩이 속도를 극대화한다.

엔비디아는 그록 3 LPU와 베라 루빈 플랫폼을 연내 출시할 계획이다.
젠슨 황 엔비디아 최고경영자(CEO)는 기조연설에서 “베라 루빈과 그록 3 LPX 랙을 결합하면 메가와트 당 추론처리량은 최대 35배 향상되며, 운영사(조 단위 매개변수 기업)에게 최대 10배 더 큰 수익 기회를 제공한다”고 설명했다.
그는 오는 2027년까지 AI 칩을 포함한 엔비디아 하드웨어 매출이 1조달러(약 1400조원)에 이를 것이라고 전망했다. 실제 고객사의 컴퓨팅 수요는 이보다 더 클 것으로 예상했다.
전 세계가 AI 전환점을 맞으면서 GTC 2026은 주요 기술기업들의 각축장이 됐다. 엔비디아 루빈 GPU 기반 고대역폭메모리(HBM4)를 공급하는 삼성전자는 완성된 베라 루빈 플랫폼을 부스에 전시하며 기술력을 과시했다. 젠슨 황 CEO가 삼성전자 부스를 직접 방문해 양사 동맹 관계도 다졌다.
SK하이닉스는 최태원 회장, 곽노정 CEO가 직접 행사장을 찾았다. 엔비디아를 포함 글로벌 빅테크들과 AI 기술발전 및 중장기 협력 방안을 논의할 예정이다.
이형두 기자 dudu@etnews.com