[Case Study] 코오롱베니트 서버가상화의 HA 이중화

📁관련 통계자료 다운로드코오롱베니트 가상화 프로젝트 구성도 코오롱베니트는 지난해 3분기 초 그룹 데이터센터 내 윈도 서버를 가상화 환경으로 전격 전환했다. 특이한 점은 서비스 가용성을 이유로 서버 가상화를 단행했다는 것이다. 가상화 환경으로 전환하고 여기에 고가용성(HA) 이중화 기능을 적용하는 것이 가장 비용 효과적인 서비스 안정성 확보 방안이라는 판단에서다.

 ==

 코오롱그룹 계열사 중 17개사에게 ITO 서비스를 제공하고 있는 코오롱베니트에게 시스템 이중화를 통해 서비스 가용성을 높여야 한다는 것은 오랜 숙원에 가까웠다.

 HA 이중화가 적용되지 않는 상황에서 서버 장애 시 복구에는 아무리 빨라도 4시간 소요된다. 하지만 모든 물리적 서버에 대해 HA 구성을 할 경우 비용 부담이 대단히 커졌다. 김효종 코오롱베니트 IT혁신본부 인프라팀장은 “코오롱그룹의 IT수준을 어떻게 높일 수 있을지 고민했고 가상화가 그 중 한 가지 방법이었다”고 배경을 설명했다.

 ◇가상화 전용 HA 환경 구현해 계열사 설득=코오롱베니트가 가상화를 검토한 것은 이번이 처음은 아니다. 하드웨어 자원 가용성, 비용 절감, 관리 업무 단순화와 신속한 서비스 환경 구현 등 가상화의 기본 혜택은 예전부터 눈여겨봐왔다. 2005년, 2008년에도 각각 검토했지만 당시에는 성능과 안정성, 비용 등을 종합적으로 고려했을 때 그리 매력적이진 않았다.

 2010년 들어서면서 가상화 기술은 물론 가상화 환경을 겨냥한 전문 소프트웨어들이 활발히 출시되자 상황이 달라졌다. 기술과 구현 비용이 모두 만족할 수 있는 수준이 된 것이다. 그렇다고 해도 계열사들의 동의를 얻어내는 것은 또다른 난관이었다.

 계열사 IT기획팀장들이 가장 우려했던 것은 하드웨어 장애로 인한 업무 서버(VM)의 집단 장애였다. 여러 계열사의 업무가 동시에 중단될 수 있다는 우려였다. 또 다른 회사의 업무 서버 문제가 우리 회사의 업무 서버에 영향을 줄 수 있지 않느냐는 우려가 높았다.

 코오롱베니트가 내건 카드는 가상화 HA 솔루션이었다. 가상화 환경에서 하드웨어 혹은 VM의 장애 시 얼마나 빠르게 서비스가 재개될 수 있는지 계열사들에게 확인시켜준 것이다. 3개월에 걸쳐 계열사 IT기획팀장들을 설득한 끝에 2010년 6월부터 가상화 환경 전환에 착수해 2개월만에 1차 완료되었다.

 비핵심 업무부터 가상화 환경으로 전환하면서 안정성을 검증하고 운영 노하우를 축적해나가는 도중 마침 노후화된 그룹웨어 서버의 교체 시점이 다가왔다. 그룹웨어 업무는 특히 가용성이 중요한 업무로 꼽혔다.

 김효종 코오롱베니트 팀장은 “초기에는 더 많은 업무에 HA를 적용하려고 했는데 실제로 테스트해보니 5분 정도면 VM이 새 환경으로 이관되어 서비스 가능했다”며 “이는 대부분의 내부 업무에서는 충분히 수용할 수 있는 대기 시간으로 판단했다”고 말했다.

 하지만 그룹웨어 서비스의 경우 아침에 단 5분이라도 멈춰지면 이메일을 포함해 전 계열사의 커뮤니케이션이 중단될 수 있다. 그럴 경우 코오롱베니트가 받을 엄청난 원성은 충분히 상상 가능했다.

 이 때문에 가상화 환경에 대한 HA 이중화로 가용성을 확보하기로 결정했고 맨텍의 HA 솔루션인 MCCS를 적용하기로 했다. 맨텍 MCCS를 선정한 것은 가상화 서버 장애 시 서비스 재개 속도가 빠르고 VM별 이중화 구성이 가능하다는 점 때문이다.

 ◇ 주저하던 계열사들을 설득해 서버 가상화를 적용한 만큼 안정성에 대해서는 코오롱베니트가 책임을 져야 했다. 덕분에 ‘무지막지한’ 테스트들을 수도 없이 시행했다. 서버의 전원 스위치를 갑자기 내려버리거나 네트워크 케이블을 뽑아버리고 하드디스크를 빼는 등 가능한 모든 ‘장애’를 테스트했다. 결과는 대만족이었다.

 코오롱베니트의 가상화 프로젝트는 이제 막 1단계를 지났다. 지난해 3분기 초 그룹사 윈도 서버들을 가상화 환경으로 통합하면서 물리적 서버 대수는 120대에서 20대로 줄였다. 20대의 물리적 서버에서 운영되는 실제 업무 서버(VM)은 150여대로, 25% 정도 늘어난 셈이다.

 가상화를 적용하기 전과 적용한 후 예산만 놓고 보면 그리 큰 차이가 없다는 설명이다. 가상화, HA 소프트웨어 라이선스 비용에 통합 스토리지 등 추가 하드웨어 구입 때문이다. 그러나 동일한 비용으로 서비스 안정성이 크게 향상되었다. 동일 환경에서 이같은 안정성을 확보하려면 몇배의 비용이 들었을 것이라는 계산이다. 또한 물리적 서버 대수가 줄어들면서 연간 절감되는 전기료는 약 1억원으로 추정하고 있으며 하드웨어 유지보수 비용도 줄어들었다.

박현선기자 hspark@etnews.co.kr