[기고]4차 산업혁명과 클라우드

발행일 : 2017-04-28 14:25 지면 : 2017-04-28 27면

인터넷 발달로 모든 것이 연결되기 시작했다. 각종 센서가 연결되면서 엄청난 데이터가 오간다. 한 가지 문제가 생긴다. 세계 모든 곳에서 24시간 만들어지는 데이터는 어디에 저장하고 어떻게 처리해야 할까?

데이터의 흐름에는 국경이 없다. 데이터는 물리 형태로 존재하지 않아서 시공간 제약도 없다. 게다가 시간이 흐름에 따라 점점 증가한다. 지역 인터넷데이터센터(IDC) 형태로는 대응하기 쉽지 않다.

클라우드는 폭증하는 데이터를 저장, 처리하는 핵심 기반 구조로 자리 잡았다. 초기 투자 없이 이용한 만큼 지불하는 탄력성, 최소 자원으로 출발해서 사용량에 맞춰 동적으로 늘여 가는 확장성이 강점이다. 정보기술(IT) 자원과 신기술 도입 기간 단축, 위험 회피도 가능하다.

퍼블릭 클라우드는 아마존, 구글, 마이크로소프트(MS)가 경쟁을 벌이며 성장에 성장을 거듭한다. 퍼블릭 클라우드 선도 기업은 데이터센터를 짓고 초고속 네트워크로 연결하는 하드웨어(HW) 기반 구조 확충에 열을 올린다. 동시에 운영자와 개발자가 쉽게 사용할 수 있는 각종 개발 환경을 구축한다. 최근에는 빅데이터, 인공지능(AI), 머신러닝(기계학습), 사물인터넷(IoT) 관련 서비스도 일괄 제공해 명실상부한 IT 세상 최강자로 군림한다.

부문별로 퍼블릭 클라우드 선도 기업들의 전략을 살펴보자.

먼저 선도 기업들은 엄청난 분량의 데이터 저장, 빠른 실시간 스트림 처리, 비즈니스 통찰을 얻기 위한 분석 소프트웨어(SW)와 시각화 SW를 제공한다. 과거 벤더 중심의 상용 SW에서 벗어나 하둡 기반의 오픈소스 SW 생태계를 포용했다는 점이 차별화 포인트다. 독자 서비스를 합쳐 복잡한 하둡 구축 없이도 즉시 데이터를 저장하고 분석·시각화한다. 또 대다수 선도 기업이 대규모 데이터를 검색하기 위해 대량병렬처리(MPP) 아키텍처로 설계된 데이터베이스(DB) 엔진도 서비스 형태로 제공한다. 이 때문에 SQL에 익숙한 개발자와 분석가들이 손쉽게 데이터를 다룰 수 있다.

퍼블릭 클라우드 선도 기업은 자사 핵심 노하우를 오픈 소스 형태로 공개하는 위험도 무릅쓴다. 구글은 텐서플로를 공개해 일찌감치 딥러닝 개발에 필요한 프레임워크 표준을 주도한다. 이에 자극을 받은 아마존웹서비스(AWS)는 아파치재단에 MXNet을 공개했다. MS도 뒤질세라 CNTK를 오픈소스로 공개했다. 또 머신러닝 학습을 가속화하기 위해 그래픽처리장치(GPU) 사용이 가능한 머신러닝용 고급 인스턴스를 공급한다. 구글은 유연하게 GPU 개수를 늘리는 서비스를 선보였다. 이에 맞서 AWS와 MS는 용도에 맞는 다양한 GPU 인스턴스 구색을 갖췄다.

마지막으로 선도 기업들은 다양한 IoT 장치 연결과 관리, 보안 관리, 스트리밍 데이터 수집·저장 관련 서비스를 제공한다. 수많은 단말기에서 나온 작은 데이터가 모여 빅데이터가 되더라도 대응이 가능하다. 아마존은 스마트 음성 인식 스피커인 '에코'를 판매한다. IoT-빅데이터-AI 부문을 아우르는 좋은 사례다. 사용자가 음성으로 에코에 명령하면 IoT 기술을 사용해 AWS 클라우드에 접근한다. 빅데이터와 AI 기능을 통해 사용자 의도를 분석한 후 물품을 주문하거나 궁금한 사항에 대답하는 서비스다.

미래에 대비하는 우리의 전략은 무엇일까. 가장 먼저 클라우드 개념을 받아들이고 응용할 필요가 있다. HW부터 SW까지 모든 것을 직접 구축하기에는 시간과 비용이 너무 많이 든다. 이에 따라서 클라우드를 지렛대로 삼아 최대한 비즈니스에 부가 가치를 높이는 방법을 찾아야 한다. 또 퍼블릭 클라우드 업체가 모든 것을 다 할 수 없기 때문에 수직 영역에서 경쟁력을 발휘할 수 있는 전문 분야를 찾아야 한다. 이 두 가지 전략을 적절히 결합하면 기반 구조가 튼튼한 퍼블릭 클라우드 위에서 특정 분야에 적합한 플랫폼과 프레임워크를 구축할 수 있다. 이를 통해 한 단계 높은 수준에서 고객의 요구 사항을 충족시킬 수 있다.

조종암 엑셈 대표 cca@ex-em.com

기고