[ET단상]지속적인 개방형 데이터 혁신 생태계 조성

김재수 한국과학기술정보연구원(KISTI) 국가과학기술데이터본부장
김재수 한국과학기술정보연구원(KISTI) 국가과학기술데이터본부장

산업경제 시대에 돈이 자본이라면 디지털경제 시대에서는 데이터가 자본이다. 주간 경제지 이코노미스트는 데이터가 세계에서 가장 영향력 있는 자원이라고 했다. 이제 데이터의 중요성과 가치가 높아지면서 데이터 경쟁력은 국가 경쟁력이 됐다. 이런 데이터 자본은 활동 데이터 활용, 또 다른 데이터 생성, 플랫폼 기반 가치 창출이라는 세 가지 원칙을 활용해 경쟁 우위를 확보하고 있다.

최근 새로운 형태의 자본인 데이터를 유통하는 데이터경제가 떠오르고 있다. 우리나라 정부도 데이터의 중요성을 인식, 국가전략투자 프로젝트로 데이터경제를 선정했다. 핵심 기술 개발 지원, 전문 인력 5만명, 데이터 강소기업 100개를 육성하기 위해 데이터 산업에 총 1조원 투자 계획을 발표했다.

데이터경제에서는 데이터의 수집, 저장, 유통, 활용 등 과정에서 가치가 창출된다. 데이터 생산자, 데이터 서비스 제공자, 비즈니스 수요자, 최종 사용자 등 데이터 가치를 창출하는 구성원이다. 이런 데이터 생태계를 기반으로 데이터 활용은 많은 영역에서 생산성 향상과 혁신을 가속시키고 있다. 최근 5세대(5G) 이동통신 상용화는 지금보다 더 많은 데이터를 생산하고, 인공지능(AI) 및 빅데이터 기술 등과 결합해 데이터경제를 폭풍 성장시킬 원동력이 될 것이다.

빅데이터 시대에서 대용량 데이터도 매우 중요하지만 작으면서 중요하고 활용도 높은 데이터도 있다. 80%의 '사소한 다수'가 20%의 '핵심 소수'보다 뛰어난 가치를 창출한다는 '롱테일 이론'처럼 '롱테일 데이터'가 있다. 이런 유형의 데이터가 디지털경제 시대에서도 마찬가지로 적용된다.

예를 들면 온라인 서점 아마존닷컴의 전체 수익 가운데 절반 이상이 오프라인 서점 서가에 비치하지도 않는 비주류 단행본이나 희귀본 등이다. 세계 60개 이상 도서관이 참여해 40여개 언어로 된 3000만권의 책을 서비스하는 구글 도서 프로젝트(GBP)도 사례의 하나다. GBP에 참여한 오야 라이거 미국 코넬대 사서는 GBP 프로젝트로 디지털화한 책 85~90%는 최근에 한 번도 대출되지 않은 것이라고 말했다. 디지털화된 도서가 즉각 이용이 아니라 미래 이용자가 이용할 수 있도록 롱테일을 준비하는 것이라고 했다.

데이터가 산업, 사회, 과학 등 다양한 분야에서 혁신 원천으로 인식하고 있지만 산업 활용은 미약하고, 산업 전반에 걸친 경쟁력 제고에도 한계가 있다. 또 국민의 삶과 안전 관련 사회 현안 문제 해결 활용에도 미흡한 수준이다.

많은 기업이나 과학자가 데이터를 중요하게 인식하지만 정말 사용할 만한 데이터가 없거나 알지 못하는 것이 문제다. 즉 국가에서 무슨 데이터가 생산됐는지, 누가 생산했는지, 어디에 있는지를 몰라서 제대로 활용하지 못하는 것이다.

이런 문제를 해결하기 위해서는 롱테일 데이터를 수집, 관리, 활용할 수 있는 개방형 혁신 생태계가 필요하다. 데이터의 진정한 가치는 통합이 아니라 융합과 분석에서 나오고, 완성되고 있다. 데이터의 진정한 가치를 위해서는 플랫폼이 매우 중요하다. 마윈 알리바바 회장도 “정보기술(IT)이 미래를 제어하는 것이라면 데이터기술(DT)은 미래를 창조한다”고 했으며, DT 시대에서는 플랫폼이 매우 중요하다고 강조했다.

국가에서 생산되는 많은 데이터를 수집, 관리, 활용할 수 있는 인프라인 개방형 데이터 생태계가 만들어지고, 지속해서 운영돼야 한다. 단순히 데이터가 수집되고 관리되는 것이 아니라 데이터가 활용돼 많은 기업·과학자·국민이 활용할 수 있는, 살아있는 플랫폼이 돼야 한다.

김재수 한국과학기술정보연구원(KISTI) 국가과학기술데이터본부장 jaesoo@kisti.re.kr