'AI 추천시스템' 최대 17배 가속...데이터센터 최적화 가속기 반도체 개발

글자 작게 글자 크게 인쇄하기

유민수 KAIST 교수팀, MCM 기술 기반
데이터센터 공간 효율성 난제 해결

유민수 한국과학기술원(KAIST) 전기및전자공학부 교수팀은 추천 시스템 고속화를 위한 '다중 칩 모듈'(MCM) 기술 기반의 혼합형 인공지능(AI) 가속기를 세계 최초로 개발했다고 6일 밝혔다.

MCM 기반 프로세서(이미지 왼쪽)와 FPGA에 구현된 추천시스템 가속기(오른쪽)를 도식화 한 이미지.
<MCM 기반 프로세서(이미지 왼쪽)와 FPGA에 구현된 추천시스템 가속기(오른쪽)를 도식화 한 이미지.>

기존 서버 시스템의 구조 변경은 최소화하면서 AI 기반 추천 시스템 성능을 대폭 강화하는 기술이다. 기존 추천 시스템을 최대 17배까지 가속할 수 있다.

AI 추천서비스는 사용자 이력·기록을 활용해 맞춤형 추천 정보를 제공하는 서비스다. 이용자 만족도, 기업 이윤을 확대하려면 빠르게 결과를 도출해야 하는데 '메모리 병목현상'이 발목을 잡아 왔다. 연산 시 프로세서인 중앙처리장치(CPU)가 메모리에서 데이터를 가져올 때 액세스 빈도가 불규칙하고 데이터 전송량이 늘어 문제였다.

연구팀은 지난해 AI 가속기를 메모리 근처에 두는 '프로세싱 인 메모리'(PIM) 기술을 개발, 병목현상 해결 방법론을 세계 최초로 제시했다. 프로세서와 메모리 간 실물 거리를 좁혀 병목현상 발생을 줄이는 식이다.

그러나 이 경우 PIM 기술을 활용하기 위한 별도의 연산 장치가 필요하다는 문제가 생겼다. 서버 시스템 구조를 변경해야 하기 때문에 데이터 센터 공간·전력 효율성을 저해한다는 한계가 있었다.

이번 연구에서는 MCM 기술로 이 같은 한계를 극복했다. MCM은 역할이 서로 다른 칩렛(칩 다이 탑재 기능을 분리한 작은 조각)을 하나로 패키징하는 것을 뜻한다. 연구팀은 이 기술로 프로세서와 '프로그램 가능 비메모리 반도체'(FPGA)가 단일화된 칩을 구현, 가속기를 개발했다.

이렇게 만든 가속기는 하드웨어(HW)를 단 메모리의 접근을 가능하게 한다. 또 FPGA 가변 논리회로로 추천 연산을 가속한다. 가속 효과는 2~17배에 이르고, 에너지 효율도 이전보다 높다. 또 기존 데이터센터 서버 시스템에 곧바로 적용할 수 있다.

유민수 KAIST 교수
<유민수 KAIST 교수>

연구팀은 삼성전자 미래기술육성센터의 지원을 받아 연구 성과를 냈다. 인텔 연구소로부터 MCM 기반 칩 관련 도움도 받았다. MCM 기반 칩은 인텔이 개발했다.

관련 연구 논문은 지난달 컴퓨터 시스템 구조 분야 최우수 국제 학술대회인 ACM/IEEE (ISCA)에서 발표됐다.

유 교수는 “추천 시스템 가속, 기존 데이터센터 시스템 적용 가능성과 공간 효율성을 모두 잡은 기술을 개발했다”면서 “AI 가속기 시장 판도를 국내 메모리 반도체 기업이 주도할 수 있도록 더욱 적극 산학 협력을 지속해 나가겠다”고 말했다.

대전=김영준기자 kyj85@etnews.com