올 10월 국민 바이오 빅데이터 개방…K정밀의료 구현 앞당긴다

국민 100만명의 건강·질병 정보를 수집하는 '국가 통합 바이오 빅데이터 구축 사업'이 오는 10월 데이터를 외부에 개방한다. 우리 국민의 유전체, 의료, 생활 습관 등 데이터를 정밀의료 연구에 활용해 신약 개발, 헬스케어 혁신 등을 주도한다.

김종덕 한국보건의료정보원 국가바이오빅데이터센터장이 20일 서울 중구 의정원에서 '개인 중심 통합 데이터 구축·활용 방안'을 소개했다.(사진=과학기자협회)
김종덕 한국보건의료정보원 국가바이오빅데이터센터장이 20일 서울 중구 의정원에서 '개인 중심 통합 데이터 구축·활용 방안'을 소개했다.(사진=과학기자협회)

김종덕 한국보건의료정보원 국가바이오빅데이터센터장은 20일 서울 중구 의정원에서 '개인 중심 통합 데이터 구축·활용 방안'을 소개했다.

바이오 빅데이터 구축 사업은 참여자 동의를 바탕으로 혈액, 소변 등 검체를 확보하고, 임상·유전체 정보와 공공데이터, 개인 건강 이력 등을 연계해 일종의 '데이터뱅크'를 조성한다. 기탁된 데이터는 다수 연구자에게 제공된다. 앞서 약 50만명의 바이오 데이터를 수집한 영국은 심장질환, 암·뇌신경 관련 3000편 이상의 논문을 출간했고, 핀란드는 14개 다국적 제약사와 협력해 희귀 유전변이 기반 신약 후보물질을 발굴했다.

우리나라는 2032년까지 국민 100만명의 바이오 데이터를 확보하는데, 1단계 사업 기간인 2028년까지는 77만2000명 데이터의 자산화가 목표다. 1단계 사업에는 예산 총 6066억원이 편성됐다.

김 센터장은 “한국은 개인 유전체 정보는 물론 각 의료기관이 보유한 임상 정보와 의무기록까지 기부할 수 있다”면서 “영국, 핀란드, 미국 등 앞서 바이오 빅데이터 사업을 실시한 국가보다 실효성 높은 자료 생성에 초점을 맞췄다”고 설명했다.

의정원은 이번 사업에서 데이터뱅크 구축을 담당한다. '건강정보 고속도로' '진료정보 교류시스템' 등 보건의료 정보화 사업 역량을 활용해 바이오·임상·건강 데이터를 결합한 개인 중심 통합 데이터를 구성한다. 의정원은 지난해 11월 '참여자 관리 시스템'을 개통했다. 당초 계획했던 2026년 12월보다 1년 이상 앞당겼다. 참여자 관리 시스템에는 참여자 정보 관리와 데이터 생성·수집, 연구자 지원 포털 연계 등을 구현했다.

김 센터장은 “개인정보가 담긴 만큼 모든 데이터는 폐쇄망에서 관리하고, 보안 인증도 진행하고 있다”고 강조했다.

'국가 통합 바이오 빅데이터 구축 사업' 참여자 인체 자원·데이터 활용 체계도(자료=한국보건의료정보원)
'국가 통합 바이오 빅데이터 구축 사업' 참여자 인체 자원·데이터 활용 체계도(자료=한국보건의료정보원)

10월에는 지금까지 확보한 데이터를 연구자에게 개방한다. 개방하는 데이터는 크게 세 종류로 나뉜다. 가장 낮은 수준의 요약 통계 데이터는 별도 절차 없이 누구나 포털 사이트에서 확인할 수 있다. 통계가 어떻게 생성됐는지 확인하는 2단계 교육용 데이터는 익명화를 거쳐 회원가입을 거쳐야 한다.

가장 높은 등급의 연구자용 데이터는 심의를 거쳐 폐쇄된 환경인 가상 데스크톱 인프라(VDI)에서만 활용할 수 있다. 연구를 마친 결과물만 반출되고 실제 데이터는 모두 파쇄된다. 의정원은 올해 하반기 데이터 개방 후 매년 최신화해 국내 연구자의 학술 활동을 뒷받침할 계획이다.

김 센터장은 “한국형 바이오 빅데이터 기반 정밀의료 연구와 맞춤형 치료 전략 수립, 신약 개발 임상 비용 절감 등을 기대할 수 있다”면서 “한국이 아시아 최대 빅데이터 허브로 도약하도록 적극 지원하겠다”고 말했다.

염민섭 한국보건의료정보원장이 20일 서울 중구 의정원에서 열린 미디어아카데미에서 발언했다.
염민섭 한국보건의료정보원장이 20일 서울 중구 의정원에서 열린 미디어아카데미에서 발언했다.

염민섭 보건의료정보원장은 “이번 바이오 빅데이터 사업 외에 건강정보 고속도로와 진료정보 교류시스템의 통합을 추진하고 있다”면서 “전자 정보 활용으로 환자가 어디서든 개인 주치의를 만난 것과 같은 효과를 발휘할 수 있을 것”이라고 말했다.

송윤섭 기자 sys@etnews.com