
“모듈형 데이터센터는 그래픽처리장치(GPU) 가격을 혁신하기 위한 선택입니다. 새로운 클러스터링·냉각 방식 등 경쟁력 있는 기술로 급증하는 인공지능(AI) 인프라 수요를 지원하겠습니다.”
김재원 엘리스그룹 대표는 15일 서울 테헤란로 새 오피스에서 간담회를 열고 “국산 기술로 완성한 차세대 AI 인프라로 국내 AI 생태계 자립도를 높이고 비용 장벽 없이 AI 혁신을 이룰 수 있는 토대를 만들겠다”며 이같이 전했다.
모듈형 데이터센터 구축과 인프라 기술 혁신으로 비용을 최소화, 경쟁사 대비 상대적으로 저가에 서비스형 GPU(GPUaaS)를 제공하며 '가성비(가격 대비 성능)' 서비스를 제공하겠다는 의미다.
가성비는 엘리스그룹 기술력에 기반한다. 냉각방식을 다변화하며 고온에 취약할 수 있는 컨테이너 시설 단점을 극복했다. GPU 등 반도체 설비 온도를 40도 내외로 유지하면 된다는 점에서 온수를 활용하는 방식과 외기까지 추가로 활용하는 방법 등을 찾아냈다.
다른 데이터센터 대비 전력 효율을 최소 두 배 이상 강화한 배경이다. 일반 데이터센터 전력효율지수(PUE)는 평균 2.3으로 엘리스그룹의 데이터센터 PUE는 수냉식 기준 1.2 수준이다.
김 대표는 “PUE는 공랭식 기준 1.6, 수냉식과 외기까지 활용하면 1.1 수준으로 떨어진다”며 “데이터센터와 GPU 수요가 기하급수적으로 증가하는 상황에 모듈형 데이터센터가 적합한 이유”라고 설명했다. 평균 3개월이면 구축되는 데다 랙당 최대 230kW 전력 지원으로 제공 가능한 GPU도 늘리고 있다.

GPU 클러스터링도 엔비디아 전용 인피니밴드가 아닌 이더넷 방식으로 지원한다. 높은 비용을 고려한 결정이다. 엘리스그룹은 해당 방식으로 '엘리스 클라우드'에서 자사 AI 교육 서비스를 제공하고 있으며 외국계 클라우드제공사업자(CSP) 대비 2.4배 빠른 평균 전송속도를 확인했다. 효율성을 입증한 것이다.
또 과학기술정보통신부 'AI 특화 파운데이션 모델' 프로젝트를 통해 총 512개 GPU를 연계 제공하며 서비스 경험을 강화했다. 고객사 수요에 최적화된 설계는 물론, 가상화를 통해 최대 1만장 규모 GPU 자원을 동시 지원할 수 있는 기술력도 확인했다. 국내외 신경망처리장치(NPU) 인프라도 지원한다.
엘리스그룹은 'GPU 스팟 요금제'를 출시, 효율적인 AI 인프라 지원을 강조했다. 일시적으로 미활용되는 유휴 GPU 자원을 활용해 비용을 온디맨드 대비 최대 50% 절감할 수 있는 서비스다.
김 대표는 “엘리스그룹 고객 1만3000여곳 중 상당수가 스타트업과 연구소”라며 “동일한 GPU 자원을 보다 효율적으로 제공할 수 있게 기술개발과 인프라 연구를 지속할 것”이라고 말했다.
이어 “국내 데이터센터 기반 싱가포르 교육 실증사업을 진행하고 있다”며 “일본·아랍에미리트(UAE)·사우디아라비아·싱가포르·유럽 등지로 이동식 모듈형 데이터센터(PMDC)를 수출할 것”이라고 덧붙였다.
박종진 기자 truth@etnews.com