[월요논단] 데이터! 미래를 움직이다

[월요논단] 데이터! 미래를 움직이다

정양호 한국산업기술평가관리원장 yhchung@keit.re.kr

나이팅게일은 크림전쟁에서 다친 군사들을 위해 헌신한 '백의의 천사'로 잘 알려져 있다. 그러나 나이팅게일은 의료를 통해서만 많은 목숨을 구한 것이 아니다. 그는 통계를 활용해 더 많은 군인 목숨을 구했다.

당시 나이팅게일은 전쟁에서 목숨을 잃는 군인보다 야전병원의 비위생 환경에서 오는 질병으로 죽는 군인이 더 많다는 사실을 발견했다. 그는 환자들의 입원 및 퇴원 기록과 사망자 수, 병원 위생 상태 등을 바탕으로 데이터를 만들고 상관관계를 분석해 그래프로 도식화했다. 이렇게 객관화시킨 통계자료로 관계 기관을 설득하고 병원 위생 상태를 개선했다. 이 덕분에 위생이 강조된 지 5개월 만에 군인 사망률이 42%에서 2%로 크게 감소했다.

이 일화는 현상에 대한 합리적인 원인을 찾기 위해서는 데이터를 기반으로 한 분석이 필요하다는 것을 보여 준다. 경험과 직관에 의존한 분석도 같은 결론을 내릴 수 있지만 데이터라는 든든한 지원군이 함께한다면 객관성과 신뢰성 증가로 설득은 더 쉬워진다.

데이터는 비단 전쟁터뿐만 아니라 다양한 분야에 걸쳐 의사결정 근거로 활용되고 있다. 파리바게뜨는 날씨에 따른 고객 선호 제품을 분석해서 매출을 30%까지 끌어올리기도 했고, 아마존은 고객 장바구니에 담긴 상품 정보와 소비 패턴 등을 분석해 물류창고로 예측 배송하는 서비스도 운영하고 있다.

요즘에는 인류 문명 탄생 이후 2003년까지 생산된 총 정보량과 버금가는 데이터 양이 이틀마다 쏟아져 나오고 있고, 제타바이트(10의21승 바이트)와 같이 크기도 가늠할 수 없는 단위들이 생겨나고 있다. 이렇게 생성되는 빅데이터는 산업기술 연구개발(R&D)에도 활용될 수 있다.

지난 10년 동안 한국산업기술평가관리원(KEIT)에서 신규 지원한 7000여 건의 과제 수행 및 성과 정보와 NTIS에 있는 전 부처 국가 R&D 지원 관련 데이터 50만여 건을 활용하면 R&D 투자가 활발하게 이뤄지는 산업 분야를 파악할 수 있다.

우수한 성과를 내는 기관들의 요인을 분석해 R&D 지원 효과를 극대화하는 것도 가능하다. 올해 정부 R&D 예산은 약 24조원이다. KEIT는 이 가운데 8.4% 수준인 약 2조원을 지원한다. 이 한정된 예산을 낭비하지 않으려면 '역량이 뛰어난' 지원 대상을 선정하고, 선정된 기관이 '우수한 성과'를 낼 수 있도록 집중 지원해야 한다. 데이터 기반으로 R&D 지원 합리화 방안을 마련해야 하는 이유다.

먼저 과제 선정 시 적합한 기관이 선택될 수 있도록 관련 데이터를 활용할 수 있다. R&D 수행 과정에 필요한 특허 및 기술 정보 등을 빅데이터 분석을 통해 제공하는 것도 가능하다. 이를 바탕으로 의욕 강하고 우수한 기술이 개발에만 그치지 않고 산업 발전을 견인해 나가도록 돕는다면 정부 R&D 지원의 본연 역할을 충실히 했다고 평가될 수 있을 것이다.

세계 추세인 전통 방식에 정보통신기술(ICT)을 접목해서 더욱 효율 높고 빠른 서비스를 제공하는 '디지털 전환'을 산업기술 R&D에 적용, 기존의 정형 데이터 분석 방식에서 얻지 못한 다양한 통찰을 얻었으면 한다.

정형 데이터 분석에서 시도해 보지 못한 키워드나 상관관계 분석 등을 인공지능(AI)을 활용해 빠른 속도로 수행해 낼 수 있기를 바란다. 이를 바탕으로 경향 분석과 미래 예측이 가능해져 데이터 분석이 미래 먹거리 창출과 산업 경쟁력 강화에 눈에 띄는 도움을 직접 줄 수 있기를 기대해 본다.