
차세대 고대역폭메모리(HBM)에 그래픽처리장치(GPU)가 탑재되는 방식이 추진되고 있다. 글로벌 빅테크들이 인공지능(AI) 성능을 향상시키기 위해 새롭게 시도하는 기술이다. 이는 메모리와 시스템 반도체의 융합 속에 반도체 기업 간 경계가 허물어지고 있다는 뜻이다.
26일 취재를 종합하면 메타와 엔비디아가 HBM에 GPU 코어를 탑재하는 방안을 검토하고 있다. 구체적으로 HBM 하단에 위치한 베이스다이에 GPU 코어를 내장하는 것으로, SK하이닉스·삼성전자와의 협력을 타진 중이다.
사안에 정통한 복수의 업계 관계자는 “차세대 '맞춤형 HBM' 아키텍처를 논의 중인 데, 이 중 HBM 베이스다이에 GPU 코어를 직접 통합하는 구조가 추진되고 있다”고 밝혔다.
HBM은 복수의 D램을 적층해 만든 고성능 메모리다. 대용량 데이터를 처리해야 하는 AI를 위해 고안됐다.
현재 베이스다이는 HBM 최하단에서 메모리와 외부 간 통신을 담당한다. 여기서 일보 전진한 것이 HBM4에서 구현된 '컨트롤러' 탑재다. 메모리를 제어할 수 있는 반도체를 추가해 성능과 효율을 끌어올리려 하고 있다. HBM4는 내년부터 본격 양산될 제품이다.
GPU 코어 탑재는 HBM4 컨트롤러보다 몇 단계 앞선 기술로 풀이된다. GPU·CPU에서 코어는 독립적 연산이 가능한 기본 단위다. 예를 들어 4코어 GPU는 연산이 가능한 코어가 4개가 있다는 뜻으로, 코어가 많을수록 컴퓨팅 성능이 향상된다.
코어를 HBM에 넣는 것은 GPU에 집중됐던 연산 기능을 메모리로 분산시켜 데이터 이동을 줄이고 GPU 본체의 부담을 낮추려는 시도다.
업계 관계자는 “AI 연산에서 중요한 요소는 속도뿐 아니라 에너지 효율”이라며 “메모리와 연산 유닛 간 물리적 거리를 줄이면 데이터 이동 지연과 전력 소모를 함께 줄일 수 있다”고 설명했다.
다만 기술적 도전 과제가 남아 있다. HBM 베이스다이는 실리콘 관통 전극(TSV) 공정 특성상 GPU 코어를 담을 수 있는 공간이 매우 제한적이다.전력 공급과 열 방출도 중요 이슈다. GPU 연산 코어는 높은 전력을 소모하며 상당 열을 발생시키기 때문에 발열 제어가 병목이 될 수 있다.
국내 반도체 업계에 기회이자 위기가 될 수 있다. CPU나 GPU를 구현할 수 있는 파운드리나 패키징 능력을 갖춘다면 HBM을 더욱 발전시킬 수 있는, AI 반도체 주도권을 이어갈 수 있는 기회가 되지만 대응 능력이 떨어질 경우 시스템 반도체 업계에 종속될 수 있다는 우려다.
김정호 한국과학기술원(KAIST) 전기·전자공학부 교수는 “AI 고도화를 위해 메모리와 시스템 반도체 간 경계가 무너지는 기술 전환 속도는 더욱 빨라질 것”이라며 “국내 기업들이 메모리를 넘어 로직 분야로 생태계를 확장해야 차세대 HBM 시장을 선점할 수 있다”고 말했다.
박진형 기자 jin@etnews.com