100배 빠른 GPU 기반 슈퍼컴 국산화

코코링크가 국산화한 GPU 기반 슈퍼컴퓨터에 사용되는 보드. 이 보드에는 CPU보다 연산능력이 10배 빠른 GPU 8개가 동시에 탑재돼 기존 슈퍼컴보다 100배 빠른 연산이 가능하다.
코코링크가 국산화한 GPU 기반 슈퍼컴퓨터에 사용되는 보드. 이 보드에는 CPU보다 연산능력이 10배 빠른 GPU 8개가 동시에 탑재돼 기존 슈퍼컴보다 100배 빠른 연산이 가능하다.

 100% 수입에 의존하는 중앙처리장치(CPU) 기반 슈퍼컴퓨터보다 연산능력이 100배 빠른 그래픽처리장치(GPU) 기반 슈퍼컴퓨터가 국산화됐다. 이에 따라 우리나라가 슈퍼컴퓨터 수요국에서 공급국으로 전환하는 계기가 될 전망이다. 제품 가격은 기존 슈퍼컴퓨터의 10%에 불과해 외산이 장악한 1000억원대 국내 슈퍼컴퓨터 시장의 일대 판도변화도 기대된다.

 코코링크(대표 이동학)는 8대의 GPU를 장착한 10테라플롭스(초당 10조번 연산) 퍼스널슈퍼컴퓨터(CliC-80000)와 이를 구현하는 원천 기술을 개발했다고 28일 밝혔다.

 GPU는 그래픽 처리를 주로 하는 그래픽 프로세서로 CPU에 비해 10배 이상의 계산 능력이 빠르다. 이번에 개발한 8대 GPU가 한꺼번에 탑재되는 슈퍼컴은 기존 CPU 기반 슈퍼컴에 비해 연산능력이 100배 이상 빨라진다. 해외에서는 GPU를 활용한 슈퍼컴이 일반화되는 추세다.

 GPU 슈퍼컴을 국산화한 코코링크는 서울대 연구공원에 입주한 전문 벤처기업이다. 이 회사가 3년간 연구를 통해 개발한 GPU 슈퍼컴은 ‘1 대 8 PCI 익스프레스 버스 구조’로 세계 최고의 GPU 집적도를 달성했다. 이 기술을 활용하면 세계 최초로 노드당 최다 32대의 GPU를 집적한 시스템도 구현이 가능하다.

 이동학 코코링크 대표는 “노드당 10테라플롭스의 성능을 갖는 ‘CliC-80000’ 250대를 40Gbps 고속 네트워크인 ‘인피니밴드 QDR’로 병렬로 연결하면 세계 10위권 페타플롭스급 슈퍼컴퓨터의 구성도 가능하다”고 소개했다.

 코코링크는 이 기술을 활용해 10테라플롭스급 슈퍼컴을 구현하면 기존 CPU 기반 제품가격의 10% 정도인 3000만~6000만원밖에 소요되지 않는다고 밝혔다. CPU 등 고가의 부품 수를 크게 줄일 수 있기 때문이다.

 고성능 저비용의 GPU 슈퍼컴이 국산화되면서 그동안 크레이·IBM·HP 등 외산 브랜드에 의존해온 연간 1000억원대 국내 슈퍼컴퓨팅 시장의 수입대체 효과도 기대된다. 기상청은 매년 수백억원의 예산을 들여 미국 크레이 CPU 기반 슈퍼컴을 도입해왔다.

 코코링크는 현재 기판 규격 4U 제품의 필드테스트를 진행 중이며 오는 6월 정식 출시할 예정이다. 또 연내 이 제품의 절반 크기인 2U 크기의 컴퓨팅 노드를, 내년에는 4분의 1크기인 1U 규모의 고집적 제품도 선보일 계획이다.

 이동학 대표는 “GPU 슈퍼컴퓨터의 하드웨어 기술도 중요하지만 이를 효율적으로 이용하게 하는 소프트웨어 기술은 더욱 중요하다”며 “GPU 슈퍼컴퓨터에서 계산을 하기 위해서는 GPU 특성에 따른 벡터 알고리즘 기반의 프로그래밍이 요구되는데, 벡터 알고리즘 자체는 어렵지 않으나 생소해 전문 프로그래머가 적은 게 문제인 만큼 전문 인력양성에도 적극 나설 계획”이라고 말했다.

장지영기자 jyajang@etnews.co.kr