[전문가기고]데이터, 저장하지 말고 공유하자

[전문가기고]데이터, 저장하지 말고 공유하자

애널리틱스와 인공지능(AI)을 바탕으로 한 모던 인텔리전스 시대로 접어들었다. 기업은 데이터를 단순히 저장하는 것에 신경을 많이 쓰지 않는다. 오늘날 데이터 힘은 데이터를 자유롭게 하는 데서 오기 때문이다.

스토리지는 상호 긴밀한 사회에서 어마어마한 양으로 생성되는 데이터를 저장하는, 사일로화 된 저장소가 아니다. 데이터 공유와 전달을 통해 새로운 가치를 창출하는 플랫폼이다.

시장조사업체 IDC에 따르면 데이터 집약형 AI 시스템에 대한 기업 지출이 올해 191억달러로 증가하고, 2021년에는 522억달러까지 상승할 것으로 예측됐다. AI 시스템은 자동화된 고객 서비스 상담, 쇼핑, 상품 추천, 사이버 위협 자동 감지 시스템 등 보안, 보건에 이르기까지 다양한 범위를 포괄한다.

어떤 이들은 새로운 기회를 '4차 산업혁명'이라 부르기도 한다. 그러나 이는 지금 상황을 과소평가한 것이다. 마지막 산업혁명은 공장 조립 라인이 견인했다. 엔지니어링 전략으로 자동차를 더 빨리 생산할 수 있게 된 것이다. 그러나 오늘날 우리가 이야기하는 기술은 여러 엔지니어링 기법으로 자동차 자율 주행을 가능케 하는 수준까지 발전했다. 엄청난 기술 혁신이다. 전례 없는 양의 데이터 처리, 저장, 전달 역량을 바탕으로 최신 도구는 지난날 공상과학(SF) 영화 소재로나 치부되던 새로운 혁신 바람을 이끌고 있다.

비즈니스에서 데이터가 맡은 역할은 아무리 강조해도 지나치지 않는다. 미국 매사추세츠공대 테크놀로지 리뷰(MIT TR)가 퓨어스토리지 의뢰를 받아 진행한 연구 결과에 따르면 무려 86%에 해당하는 비즈니스 리더가 비즈니스 핵심 의사결정을 내릴 때 데이터에 기반을 둔다고 답했다. 87% 응답자는 고객에게 성과를 전달하는 핵심이 데이터라고 답했다.

이제는 스토리지 업계 모든 기업이 함께 새로운 도전 과제를 직시해야 한다. '공유'하지 않는 기존 아키텍처를 버려야 할 때다. 새로운 아키텍처는 데이터를 언제, 어디서나 공유하고 전달할 수 있는 아키텍처를 의미한다. 현대 기업 성공 열쇠는 '데이터 허브'다.

진정한 데이터 허브는 네 가지 기본 요소를 반드시 포함해야 한다. △파일(주류)과 오브젝트(클라우드-네이티브) 스토리지를 위한 높은 데이터 처리량 △스케일-아웃 방식 아키텍처 △데이터 유형 및 접근 방식과 무관하게 응답할 수 있는 다차원 성능 △대용량 병렬 처리다.

네 가지 요소는 데이터 통합에 필수다. 오늘날 너무 많은 데이터가 복잡한 사일로 굴레에 갇혔다. 개별 태스크에는 사일로가 유용할 수 있지만 데이터가 우선시되는 세상에서 사일로는 생산성이 없다.

데이터 활용 중요성은 모두 쉽게 알 수 있다. 최근 중국 검색엔진 기업 바이두는 연구를 통해 데이터세트가 1000만배 증가해야 언어 모델 오류 발생률을 4.5%에서 3.4%로 줄일 수 있다고 밝혔다. 단 1% 성능 개선을 위해 1000만배나 많은 데이터가 필요하다는 의미다. AI 세계 석학 앤드루 응 미국 스탠퍼드대 교수는 “소프트웨어(SW)가 아닌 데이터가 바로 기업의 경쟁우위”라면서 “기업이 반드시 데이터 웨어하우스를 하나로 통합해야 한다”고 강조하기도 했다.

데이터를 단순히 저장하고 싶은 조직에 데이터허브가 데이터웨어하우스나 데이터레이크 대체재가 될 수 없다. 데이터를 통합하고, 부서와 애플리케이션(앱) 간 데이터가 공유되길 원하는 조직에 데이터 허브는 각 사일로 강점을 파악하고 고유 특성을 통합해서 하나로 단일화시킨 플랫폼을 제공할 수 있다.

스토리지를 은행 또는 투자라 생각해 보자. 은행, 주식, 스타트업에 돈을 투자하는 것은 돈을 그대로 두기 위해서가 아니다. 돈이 굴러갈 수 있도록 각 시스템에 돈을 투자하는 것이다. 현대 기업은 데이터에 대해서 이와 같은 방식으로 생각해야 한다.

배성호 퓨어스토리지코리아 지사장 sbae@purestorage.com