국가프로젝트 'CDM' 적용 활발..의료 빅데이터 생태계 구축 속도

의료 빅데이터 활용 요구가 높아지면서 개인정보 유출 우려를 최소화하는 공통데이터모델(CDM) 관심이 높다. 정부부처는 의료 데이터를 활용한 국가사업에 CDM 접목을 본격화하면서 빅데이터 활용 저변을 넓힌다. 의료 빅데이터 활용 대안으로 자리 잡는다.

과학기술정보통신부, 산업통상자원부, 보건복지부는 헬스케어 분야 국가 과제에 CDM 활용을 확대한다고 7일 밝혔다. 올해 인프라를 구축하고 내년 플랫폼을 만들어 활용한다.

정부부처 CDM 관련 사업 현황
정부부처 CDM 관련 사업 현황

CDM은 의료 데이터 표준 기술이다. 데이터 구조와 서식을 표준화한 뒤 연구자, 기업 등에 공유한다. 원 데이터를 제공하는 게 아니라 익명화 해 기업이 필요한 통계 데이터만 공유한다. 익명·가공정보여서 개인정보로 취급하지 않는다.

정밀의료 등 현대의학에서 빅데이터 활용이 필수로 작용하면서 CDM도 주목 받는다. 개인정보보호법, 의료법 등 각종 규제로 의료 빅데이터 활용 제약이 큰 상황에서 대안으로 부상했다.

과기정통부는 국가전략프로젝트로 282억원을 투입하는 '정밀의료병원정보시스템(P-HIS)'에 CDM을 적용한다. 클라우드 기반 전자의무기록(EMR)에 CDM 기능을 넣어 표준화를 구현한다. 데이터가 생성, 축적되는 EMR 단계부터 표준화가 가능해 연구목적 공유 체계를 구축한다. 3년간 357억원을 투입해 개발하는 인공지능(AI) 의료시스템 '닥터 앤서'에도 CDM을 적용을 검토한다.

산업부는 지난 달 분산형 바이오헬스 빅데이터 사업단을 출범해 2020년까지 39개 병원 5000만명 의료데이터를 CDM으로 전환키로 했다. 표준화된 데이터는 연구자, 기업에 공유해 바이오 빅데이터 생태계를 구축한다.

내년부터는 복지부와 범부처 차원에서 CDM 프로젝트를 추진한다. 산업부는 대형 병원 중심으로 진행되는 CDM 사업을 1·2차 병원까지 확대한다. 중요 정보 중 하나인 만성질환자 데이터는 1·2차 병원에 집중된다. 데이터 확보는 물론 추후 공동 연구 등을 진행할 때 CDM이 필요하다. 1·2차 병원을 3차 병원, 기업 등과 공동 연구 생태계로 끌어들이는 역할도 한다. 복지부는 CDM 기술 고도화와 연구지원 인프라 영역을 담당한다.

산업부 관계자는 “올해 처음 착수한 CDM 프로젝트는 인프라 구축이 핵심”이라면서 “내년에는 복지부와 협업해 공동으로 CDM 저변확대와 활용 모델 제시에 집중한다”고 말했다.

오딧세이 컨소시엄에 참여한 국내 병원 의료진이 관련 회의를 하고 있다(자료: 아주대병원)
오딧세이 컨소시엄에 참여한 국내 병원 의료진이 관련 회의를 하고 있다(자료: 아주대병원)

세계적으로 CDM 관심이 높다. CDM 컨소시엄인 오딧세이에는 세계 각국 병원과 구글, IBM 등 정보통신기술(ICT)기업까지 총 100여개 기관·기업이 참여한다. 12개국 53개 데이터베이스(DB)로부터 6억명이 넘는 임상정보가 CDM으로 변환돼 활발히 공유된다. 우리나라도 2015년부터 아주대병원을 시작으로 20여개 병원, 기관이 참여한다.

정부도 의료 빅데이터 활용 도구로 CDM을 주목한다. 바이오 헬스 영역에서 데이터 가치는 결과물을 좌우한다. 각종 규제로 의료 빅데이터 활용 제약이 있는 상황에서 안전하게 활용 가능한 플랫폼이 필요하다. 다만 통계정보에 국한한 데이터 범위, 분석 도구 부족 등 CDM이 가진 한계도 명확해 개선이 요구된다.

과기정통부 관계자는 “개인정보 이슈를 완벽히 해소하지는 못하지만 의료 빅데이터를 활용한 연구, 상업화를 추진하는데 CDM은 대안”이라면서 “산업부, 복지부가 내년부터 공동 프로젝트를 추진하고, 과기정통부도 CDM 기술이 필요하다고 인지해 R&D 영역을 지원하겠다”고 말했다.

[전자신문 CIOBIZ] 정용철 의료/바이오 전문기자 jungyc@etnews.com