[미래포럼]빅데이터 시대의 데이터 빈곤

산업계는 데이터는 많은데 규제 때문에 빅데이터를 활용할 수 없다고 토로한다. 지난 1월 국회에서 데이터 3법이 통과되면서 앞으로 변화할 시행령과 고시 내용에 기대한다. 정보 활용과 개인정보 보호의 가치 간에 눈에 띄는 기준이 마련되고, 이를 기반으로 데이터를 활용하는 이용자에게 법 책임 부담을 상당히 덜어 줄 것이기 때문이다.

[미래포럼]빅데이터 시대의 데이터 빈곤

개인정보가 익명화 또는 가명화돼 안전한 범위 안에서 유통된다 하더라도 현장에는 쓸 만한 데이터가 없다는 목소리도 여전하다. 각 조직은 정보를 처리하면서 엄청난 빅데이터를 형성한다. 이를 데이터베이스(DB)에 집적하거나 클라우드 어딘가에 저장하고 있다. 그러나 정작 인공지능(AI)을 활용해 사업을 혁신하고자 하는데 필요한 데이터가 조직 내부에 없거나 정리되지 않아 쓸 수 없는 지경이다. 쓸 만한 데이터의 부재로 말미암아 국내 기업이 제공하고 있는 AI 서비스는 품질에서 다른 기업과 차이가 난다.

AI를 이용해 혁신한다는 것은 사람이 단순 반복해서 한 일을 자동화해 일상 업무를 급격히 줄이고, 이로써 얻은 시간에 창의 활동에 몰두하게 해서 이룬다. 물론 자동화에 이어 서비스 플랫폼을 구축하고 비즈니스 플랫폼으로 발전시키는 후속 조치가 따라야 한다.

프로세스 처리 시간 단축 등 간단한 혁신에도 적용 할 수 있다. 인간이 수행하기에 번거로운 일이지만 도구가 없어서 또는 관행적으로 해 온 일들을 자동화 할 수 있다. 이 과정에서 아이디어를 발굴하고 이를 현장에 적용하도록 이끌어 가는 힘은 단순한 기술의 이슈가 아니다. 적용하고자 하는 산업 영역의 지식이 풍부하고 업의 개념을 정확히 이해하고 있어야 한다. 목표를 명확하게 설정하고 이를 추진할 조직의 후원을 얻어야만 간신히 작은 성공의 단맛이라도 볼 수 있다.

결국 AI를 적용한 지능 기업, 지능 조직, 지능 정부가 되는 길은 기술을 이해하고 데이터를 축적한다고 해서 이룩되지 않는다. 혁신의 대장정을 한 방향으로 이끌어야 도달할 수 있는 목표인 것이다. 데이터를 개방하고 익명화해서 유통이 가능한 환경이 됐으니 당장 결과를 내놓으라 하는 것은 김칫국을 마시는 것과 같다. 적어도 조직 지능화를 원한다면 몇 가지 조건이 충족돼야 한다.

첫째 데이터를 체계화해서 잘 구축하고 이를 개방한다. 곳곳에서 필요로 하는 데이터에 대한 필요성을 반영하여 태그를 붙여 나가는 것이 필요하다. 조직이 보유한 DB는 업무에서 사용하고 있는 운영 데이터다. 그러나 고객 행태 등 경험성 데이터는 기존의 DB에는 찾아볼 수 없다. 이용자가 클릭한 정보는 파편화돼 별도 저장돼 있다.

정보시스템은 운영 데이터를 중심으로 통합되지 않고 곁가지 시스템이 덕지덕지 붙어 있다. 연결하기에 데이터의 복잡도가 높아져 있다. 이러한 상황에서 핵심 DB를 중심으로 연결된 파생 DB를 분석하고 태그를 해 나가면서 데이터를 정리하는 작업은 참으로 힘들다. 하지만 이러한 데이터의 정리가 없다면 아무리 좋은 AI 기술을 가져 오더라도 효과를 보기 어려울 것이다.

둘째 AI를 활용한 작은 사례를 지속 발굴하며, 기술 활용의 노하우를 축적한다. 조직원이 모두 AI 전문가가 될 수는 없으며, 그렇게 교육을 한다고 해서 당장 효과가 있을지도 의문이다. 오히려 참여자 각자의 업무 전문성, 지식 및 AI에 대한 기술 역량을 조화롭게 구성해 팀을 이뤄서 이들이 만들어 낸 작은 성과를 전 조직과 공유한다.

셋째 이러한 경험을 칭찬하고 축적해서 발전시킬 수 있는 분위기를 조성하고, 이를 문화로 정착시킬 수 있도록 생태계를 조성한다. 많은 사례를 만들어서 축적하고, 이에 대한 인센티브를 눈에 띄게 부여한다.

조직을 유인하면 변화가 시작되고 곧이어 관성이 생기고 이에 대한 저항도 발생한다. 리더는 목표를 명확히 재천명하고 저항에 맞서서 단호함을 보이며 시행 초기에 극적인 목표를 달성하여 성과를 보여주고 조직을 성취감에 도취되도록 하여야 할 것이다.

마지막으로 고려할 것은 전체 과정 가운데 데이터 안전성 및 프라이버시 측면에서 위험을 충분히 분석, 향후 다가올 위기에 대비해야 한다. 잘 활용하는 것은 쉽게 행할 수 있지만 그 과정에서 위험에 대비하는 것은 편집증성 프로세스 관리가 병행하지 않으면 이뤄지기 어렵다. 극심한 경쟁 상황에서의 비교 우위로 작동할 것이다.

사회 곳곳에 AI 열풍이 불고 있고 데이터 분석을 할 수 없으면 경쟁력이 많이 뒤처져 보일 정도로 관련 기술에 대한 학구열이 높아진다. 그러나 이러한 기술을 통해 이룩하고자 하는 목표가 무엇이며, 그 전제 조건과 환경이 조성돼 있는지 면밀히 따져 봐야 할 시점이기도 하다. 먼 길을 가기 위해서는 처음에는 걸어야 한다는 셰익스피어 말이 와닿는 시기이다.

이경호 고려대 정보보호대학원 교수 kevinlee@korea.ac.kr