정부, 연구데이터 공유 플랫폼·권리 보장 방안 만든다

정부가 실험, 관찰, 조사, 분석 등 연구개발(R&D) 수행 과정에서 나오는 방대한 데이터의 공유·활용체계를 만든다. 연구 과정에서 축적한 데이터를 후속 연구 시 활용하는 '오픈 사이언스' 일환이다. 국가 연구데이터 플랫폼을 구축하고 원 데이터 생산자의 권리 보장 방안을 마련한다.

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크

과학기술정보통신부는 이 같은 내용을 골자로 한 '연구데이터 공유·활용 전략'을 수립해 19일 국가과학기술심의회 운영위원회에 보고한다. 전략상 제시된 5개 핵심 과제를 연내 추진하고 데이터 기반 R&D가 활발한 분야의 시범 사업을 실시한다.

축적된 연구데이터를 원스톱으로 검색·활용하는 '국가 연구데이터 플랫폼'을 만든다. 플랫폼은 데이터 융합 분석용 가상 작업 환경과 분석도구를 제공한다. 데이터 유통 이력을 투명하게 관리하고 위·변조를 막기 위해 블록체인 기술 접목을 검토한다.

국가 연구데이터 플랫폼은 '국가연구데이터센터'가 운영한다. 센터는 국가 차원 연구데이터 관리 체계의 총괄 기관이다. 산하에 분야 별 전문센터도 둔다. 분야 별 전문센터는 데이터 취합·관리와 활용 촉진 역할을 맡는다.

연구데이터 관리·공유·활용에 관한 법·제도를 정비한다. 연구데이터의 법률상 정의를 마련하고 관리 제도를 도입한다. 원 데이터의 소유권, 개방 활용 시 권리·인센티브 등 연구자 권리를 보장한다. 이를 골자로 국가 R&D 사업 공동관리규정, 연구관리 표준매뉴얼을 개정한다.

기업 등 민간이 연구데이터를 수집, 활용할 수 있도록 데이터 활용 응용프로그램인터페이스(API)를 제공한다. 민간의 연구데이터 분석 소프트웨어(SW) 개발을 지원한다. 우수 SW를 적극 도입하고 연구데이터 컨설팅 전문기업을 육성한다.

연구자 데이터 분석·활용 능력을 높이는 빅데이터 교육과정을 운영한다. 기존에 공개된 데이터, 연구보고서, 논문 등을 활용한 교육용 데이터뱅크를 구축한다. 연구데이터센터 등에 투입할 ICT 인프라 운영 인력을 양성한다.

바이오, 미래소재, 대형연구장비, 인공지능 분야에서 41억원 규모 데이터 활용 시범 사업을 실시한다. 축적된 25만건 유전체 연구 데이터를 분석하는 SW 경진대회를 연다. 50만건 화합물 데이터를 이용한 신약 후보물질 효능·독성 예측 시스템을 개발한다.

과기정통부는 R&D 과정에서 나오는 데이터가 높은 가치를 보유했음에도 그 동안 활용이 미진했다고 봤다. 지난해 하반기 '모아서 새롭게 태스크포스(TF)'를 운영했다. 현행 제도는 논문, 특허, 연구 보고서, 장비·시설 등만 연구 성과로 본다. 데이터 공유·활용 체계가 미흡했다.

선진국은 연구 성과와 과정을 개방해 R&D 성과를 높이는 오픈 사이언스 정책을 추진 중이다. 미국은 2013년 '연구데이터 관리·공유에 관한 지침'을 마련했다. 유럽연합(EU)도 데이터 공개를 지원하는 정책(Open AIRE)을 운영한다.

정병선 과기정통부 연구개발정책실장은 “이번 전략은 세계적 오픈 사이언스 확산 추세에 발맞추기 위한 핵심 정책 과제”라면서 “연구데이터 공유 문화가 신속하게 정착되도록 시범사업 성과의 조기 가시화를 위해 노력할 것”이라고 말했다.
이어 “연구데이터 공유·활용 제도는 연구 현장에 큰 변화를 미칠 수 있는 만큼 현장 목소리를 종합 검토해 신중하게 확산시킬 것”이라고 덧붙였다.

연구데이터 공유·활용 전략 비전 및 추진체계(자료 : 과기정통부)
연구데이터 공유·활용 전략 비전 및 추진체계(자료 : 과기정통부)

송준영기자 songjy@etnews.com