[정구민의 테크읽기]사용자 서비스와 피지컬AI 성장을 주도하는 추론 AI 프로세서

정구민 국민대 전자공학부 교수
정구민 국민대 전자공학부 교수

최근 인공지능(AI) 프로세서 시장에서 추론 AI 프로세서 위상이 크게 높아졌다. 엔비디아가 장악한 학습 시장과 달리 추론 시장은 실제 사용자 서비스와 로봇, 자율주행차와 같은 피지컬 AI의 성패를 가르는 격전지로 부상했다. 특히 2개월간 이어진 미국 추론 칩 3대장 세레브라스·삼바노바·그록의 행보는 AI 산업의 방향성을 보여주는 중요 지표가 되고 있다.

첫 신호탄은 인텔의 삼바노바 인수설이다. 지난해 12월 프로세서 경쟁에서 고전하던 인텔이 삼바노바를16억달러 규모에 인수할 가능성이 있다는 소식이 전해졌다.

더 큰 충격은 이후 발표된 엔비디아의 그록 인수 소식이다. 200억달러라는 큰 규모로 진행되는 이번 인수는 독점 규제를 피하기 위해 자산 매입 형태로 된다. 엔비디아는 고대역폭메모리(HBM)를 사용하지 않는 그록의 독창적인 아키텍처를 흡수, 추론 시장에서 지배력을 공고히 하는 동시에 로봇과 엣지 디바이스 전략 핵심 동력을 확보했다는 평가를 받는다.

그록 핵심 기술인 언어처리유닛(LPU) 구조는 거대언어모델(LLM)의 응답 시간을 일정하게 유지하는 '결정론적 성능'을 제공한다. 이는 LLM과 같은 사용자 서비스와 향후 피지컬 AI 분야에서 중요한 역할을 하게 된다. CES 2026에서 발표된 자율주행 오픈소스 '알파마요'와 같은 시각언어행동(VLA) 모델의 확산에도 도움을 줬다.

높은 가격으로 진행된 인수는 세레브라스와 삼바노바 등 경쟁자의 가치도 크게 높였다. 또, 삼바노바 인수를 적시에 저가에 마무리하지 못한 인텔의 안목에도 비판이 제기된다.

지난해 12월 세레브라스의 상장 재도전도 이슈가 됐다. 최근 높아진 추론 프로세서 업체의 위상을 반영해 1년 만에 상장 재도전에 나섰다. 세레브라스는 초기 가장 활발히 움직였지만 아랍에미리트(UAE) 의존 이슈 등으로 상장을 철회한 바 있다. 상장 재추진에서는 매출에서 높은 비중을 차지하던 UAE G42를 주요 투자자에서 제외했다. 단순 투자자로 위상을 낮춰 미국 전략 자산을 지키려는 노력을 보여주려 했다는 평가다.

올해 1월 오픈AI는 세레브라스 컴퓨팅 파워를 3년에 걸쳐 100억달러 규모로 구매한다고 발표했다. 세레브라스 측면에서는 G42에 의존적 매출을 분산시켜 미국 증시 상장에 큰 도움이 된다. 오픈AI는 엔비디아 프로세서보다 15배 빠른 추론 성능을 바탕으로 전력 소모를 줄이는 동시에 챗GPT 응답속도와 서비스 품질을 크게 높일 수 있다.

2024년 초 UAE가 미국 압박으로 중국 회사 협력을 중단하면서 미국과 우리나라 회사의 협력이 강화되고 있다. 오픈AI와 마이크로소프트(MS)는 UAE 데이터센터인 스타게이트 프로젝트에 핵심 멤버로 참여하면서 G42와 직간접적으로 협력하고 있다. 참고로 한국 자율주행 스타트업 오토노머스에이투지는 G42 산하 스페이스42(Space42)와 자율주행 조인트벤처 A2D를 설립하고 중동 자율주행 확대에 나서고 있다.

추론 프로세서에 대한 높은 관심은 추론 기반 사용자 서비스가 크게 확장되고 있다는 점을 의미한다. 또, 빠르고 예측 가능한 추론 칩을 로봇·자율주행·사물인터넷 등에 활용해 관련 시장 성장에도 도움을 주게 될 것으로 보인다. 국내 리벨리온·퓨리오사AI·딥엑스·모빌린트·페블스퀘어 등 AI 프로세서 관련 회사가 성장해 나가고 있다. 추론 기반 엣지 기기와 서비스가 성장하는 트렌드 속에서 국내 업체의 좋은 성과를 기대한다.

정구민 국민대 전자공학부 교수 gm1004@kookmin.ac.kr