◆삼성종합기술원 이상문 박사
86년 미 윌리엄펜대 졸업(컴퓨터 사이언스, 수학 전공)
89년 미 아이오와 주립대(Aims) 수학 석사
92년 미 뉴욕 주립대(Stony Brook) 응용수학 석사
95년 미 뉴욕 주립대 응용수학 박사
95년∼현재 삼성종합기술원 HPC 파트 전문연구원
슈퍼컴퓨터는 일반 PC보다 계산수행 능력이 월등한 컴퓨터를 말한다. 단위시간당 연산 능력 50∼150기가플롭스 이상, 주 연산기억장치 용량 32∼256기가바이트, 메모리간의 차선능력(bandwidth) 초당 약 15∼20기가바이트급이면 통상 슈퍼컴퓨터로 분류한다.
대부분의 사람들은 이 슈퍼컴퓨터가 일반 PC보다 100배 혹은 1000배 정도의 성능과 크기를 가졌으며 몇몇 선택된 연구원들만이 사용할 수 있는 도구로 생각하고 있다. 하지만 지금 이용되고 있는 일반 PC의 계산성능이 80년대 초반의 슈퍼컴퓨터보다 더 우수하다는 사실을 상기해보면 이러한 생각은 오해임을 알 수 있다.
기술발전 추세가 계속된다면 아마도 머지않은 장래에 각 가정에서도 현재의 슈퍼컴퓨터급 성능을 가진 PC를 이용하게 될 것이다.
1988년에서 1995년까지 슈퍼컴퓨터업계에서는 벡터 프로세서(vector processor)를 이용한 SMP(4CPUs)를 사용했다.
그러나 1995년 이후 RISC 칩세트가 등장하면서 칩세트 단가는 낮아지고 단위계산 능력 역시 향상됐으며 많은 양의 계산작업을 빨리 끝낼 수 있는 스루풋(Through-put) 개념 역시 중요하게 부각됐다.
이에 따라 MPP(4∼1024CPUs) 병렬 슈퍼컴퓨터가 등장, 1998년까지 슈퍼컴퓨터 업계를 관장했다. 하지만 MPP 슈퍼컴퓨터 역시 단위 작업의 계산능력을 향상시키기 위해서는 높은 수준의 언어를 구사해야 했기 때문에 보편적인 사용자로부터 외면당했다.
최근에는 벡터와 MPP의 장점을 따온 CC-NUMA라는 DSMP(병렬 SMP:4∼512CPUs) 구조를 가진 슈퍼컴퓨터 시스템을 많이 사용하고 있다.
이러한 슈퍼컴퓨터의 사용은 각 회사의 능력 또는 각 국가의 컴퓨팅 기술력으로 간주될 만큼 활성화, 보편화되고 있다.
슈퍼컴퓨터의 활용분야를 살펴보면 자사와 고객정보에 관한 안정된 서비스를 수행하기 위해 증권 및 금융기관, 호텔 등에서 사용하고 있으며 기업에서는 상품의 개발과 제품 설계의 최적화를 위해, 연구소에서는 설계구축(modeling) 및 계산해석(computing & analysis)을 위해 사용하고 있다.
많은 기업 및 연구소들이 이처럼 슈퍼컴퓨터를 앞다퉈 도입하게 되면서 저비용으로 슈퍼컴퓨터급의 성능을 지닌 시스템을 자체적으로 구축할 수 없을까 하는 고민을 하게 됐다. 이에 비용이 많이 드는 중앙집중식(mainframe) 구축체계의 대형 슈퍼컴퓨터보다는 기업의 부서별, 계열사별 역할에 적합한 소형 슈퍼컴퓨터급 기종으로 분산 도입하는 경향이 나타나게 됐다.
리눅스를 이용한 클러스터링(clustering) 기법은 그 해답으로 1997년부터 과학계에 돌풍을 일으키고 있다. 클러스터링 기법을 이용하면 기업이나 연구소들은 자신들이 이미 보유하고 있는 PC나 워크스테이션을 네트워크로 묶어 슈퍼컴퓨터급의 성능을 이용할 수 있기 때문이다. 클러스터 슈퍼컴퓨터는 가격대 성능비로 봤을 때 기존 슈퍼컴퓨터보다 월등히 앞서는 것이다.
클러스터링을 이용한 시스템 연구는 1980년대 후반부터 시작됐다. 그 중 가장 유명한 프로젝트가 바로 NOW(Network Of Workstation)다. 하지만 당시만 하더라도 워크스테이션을 연결해주는 네트워크 장치 및 성능이 현재에 비해 많이 뒤떨어졌고 네트워크 장비에 맞는 PVM 프로토콜 역시 별도로 개발해야 했다.
가격이 싸면서도 적절한 성능을 발휘하는 장비를 구하기가 힘들었던 것이다. 그러나 1995년을 기점으로 유닉스 환경을 제공해주는 공개 소프트웨어인 리눅스가 등장하고 주변 장비들 역시 쉽게 구할 수 있는 환경이 조성됐다.
리눅스의 경우 PC상에서 서버급 워크스테이션의 기능을 구현해주기 때문에 PC나 워크스테이션을 연결하는 클러스터 시스템에 활용 가능할 것으로 이전부터 관심을 끌어왔었다. 리눅스 클러스터 시스템이 대외적으로 널리 알려지기 시작한 것은 칼텍사의 「베어울프(Beowulf)」 프로젝트가 1997년 슈퍼컴퓨팅 콘퍼런스에서 고든벨 상을 수상하면서 부터다.
리눅스 클러스터에 대해 관심을 가져야 하는 이유는 두 가지다. 우선 리눅스를 이용하면 저비용으로 고성능의 클러스터 시스템을 구현할 수 있다. 리눅스는 공개돼 있어 비용을 지불할 필요가 없으며 더불어 소스 프로그램까지 얻을 수 있어 시스템 구동 저변에 대한 내용을 공부하고 연구할 수 있다. 따라서 얼마나 많은 연구를 하느냐에 따라 사용자들은 자신들의 연구를 위해 최적의 성능을 보이는 적합한 시스템을 직접 만들 수 있으며 구입할 수도 있다.
둘째 클러스터 시스템은 가용성 및 활용성이 뛰어나다는 점이다. 즉 네트워크에 묶여 있는 PC나 워크스테이션을 2∼3개의 클러스터 시스템으로 나눌 수 있으며 보다 큰 클러스터 시스템을 만들 때도 PC나 워크스테이션들을 쉽게 증설할 수 있다.
수행하고 있는 연구에 따라 원하는 시스템을 자유자재로 변경할 수 있는 것이 가장 큰 장점이다. 상용 슈퍼컴퓨터의 경우 CPU 업그레이드시 기존 CPU와 새로 업그레이드하는 CPU를 혼합해서 쓸 수 없는 데 비해 클러스터 시스템은 이것이 가능하기 때문에 기존 유휴 설비를 재활용할 수 있는 것이다.
따라서 리눅스 클러스터를 이용하면 저렴한 비용으로 슈퍼컴퓨터에 준하는 시스템을 구축할 수 있으며 사용자들은 자신들의 연구 특성에 맞게 상용 소프트웨어와 자체 보유 소프트웨어를 활용할 수 있다.
특히 이를 상용 슈퍼컴퓨터와 클러스터 시스템으로 양분해 활용한다면 구입, 구축 및 유지보수 비용 측면에서 많은 이점을 얻을 수 있다. 이 때문에 첨단연구 및 신수종사업을 위한 연구를 하는 사용자들의 경우 핵심기술 해석을 위한 자체 개발 소프트웨어를 보유하고 있으며 단위계산 성능을 확보하기 위해 저비용으로 구성 가능한 클러스터를 많이 사용하고 있다. 범용성을 지향하는 상용 소프트웨어들은 첨단 연구를 위한 특정 스펙(SPEC)을 지원하기에 역부족이기 때문이다.
무한경쟁 시대에서 살아남기 위해 국가와 기업은 우수한 컴퓨팅 파워를 보유하고 활용해야 한다. 우수한 컴퓨팅 파워는 바로 대학이나 연구소의 개발능력과 직결되고 그것은 바로 산업전반에 걸친 경쟁력에 지대한 영향을 미치기 때문이다.
이러한 추세는 과거 도로·항만·철도 등의 산업 인프라만을 일컫던 국가의 사회간접자본(SOC:Social Overhead Capital) 항목에 슈퍼컴퓨터 보유현황이 산입되기 시작됐다는 사실에서도 명백하게 드러난다.
슈퍼컴퓨터의 역할과 중요성은 최근 선진국의 사례에 비춰 보더라도 확인할 수 있다. 혹자는 슈퍼컴퓨터의 보유 능력이 21세기 국가 경쟁력을 좌우한다고 얘기한다. 첨단 바이오산업에서 필요한 인간 유전자 해독을 가능하게 했던 배경에 슈퍼컴퓨터가 있었던 것을 상기해보자.
미국과 유럽은 오래 전부터 슈퍼컴퓨터를 이용한 연구를 했으며 그로 인해 국가가 얻은 이익은 막대하다. 바이오 산업뿐만 아니라 이제는 산업전반에 걸쳐 슈퍼컴퓨터가 없이는 경쟁 자체를 하지 못할 정도로 슈퍼컴퓨터의 활용은 확대일로에 있다.
물리·화학·자동차·대기환경·정보통신·기계항공·우주·영화·게임산업 등 기초과학 및 산업전반에 걸쳐 사용하는 추세다. 이런 측면에서 국가가 보유하고 있는 슈퍼컴퓨터의 경쟁력은 곧 지식기반산업에서의 국가 경쟁력을 좌우한다고 해도 과언이 아님을 실증하고 있는 것이다. 기초과학연구소의 자료에 의하면 현재 우리나라 전체 연구장비의 보유수준은 슈퍼컴퓨터를 포함해 1993년 미국 대학 전체가 보유하고 있는 수준이라고 한다.
따라서 이제 산업계와 학계, 그리고 정부가 협력해 리눅스 클러스터 컴퓨터의 보급에 관심을 기울이는 것도 좋은 대안이라고 할 수 있다. 예전에는 비싼 비용을 투자해야 했지만 이제는 국내 기술로도 얼마든지 클러스터 슈퍼컴퓨터를 제작, 운영을 할 수 있는 여건이 조성됐기 때문이다. 저가의 리눅스 클러스터 슈퍼컴퓨터가 각 대학, 연구소, 정부기관, 기업 등에서 원활히 그리고 광범위하게 활용된다면 단시간 내에 SOC로서의 국가 컴퓨팅 수준은 한 단계 진보할 것이며 이로 인해 국가 경쟁력 역시 한 단계 업그레이드될 것이다.
리눅스 클러스터 슈퍼컴퓨터에 대한 정부의 적극적인 지원 및 정책 수립이 필요한 때다.