'암 빅데이터 플랫폼' 가동…진단·진료 새 길 개척

국립암센터 주도 10개 병원 참여
임상 라이브러리 '커넥트' 공개
3년 내 10개 암종 정보 30% 확보

국립암센터 암빅데이터센터.
국립암센터 암빅데이터센터.

국립암센터 주도로 국내 10개 병원이 힘을 모은 '암 빅데이터 플랫폼'이 가동됐다. 3년 안에 주요 10개 암종 임상데이터 30%를 빅데이터로 구축, 치료에 활용한다.

최귀선 국립암센터 암빅데이터센터장은 “국내 유방암 임상데이터의 약 10%를 확보한 데 이어 올해는 대장암, 폐암에 대한 공통 라이브러리를 구축한다”면서 “전체 임상데이터를 모으는 세계 첫 시도로 2022년까지 10개 암종에 대한 라이브러리가 구축되면 국내 전체 암 임상 데이터 30% 이상을 포괄할 수 있는 대표성을 확보하게 된다”고 설명했다.

국립암센터는 각 병원에 흩어진 암 관련 임상데이터를 수집하는 다기관 임상 라이브러리 플랫폼 '커넥트(CONNECT)'를 공개했다. 지난해 6월 과학기술정보통신부 '빅데이터 플랫폼 및 센터 구축 사업' 헬스케어 분야 주관기관으로 선정된 후 국내 10개 의료기관과 함께 표준화된 암 임상데이터 세트 구축 작업 결과다.

각 병원은 암 진단부터 수술, 항암치료, 예후에 이르는 임상데이터를 표준화된 형태로 수집한다. 3개년 과제가 마무리되면 유방암, 갑상샘암, 신장암, 폐암, 대장암, 난소암, 간암, 위암, 전립샘암, 췌담도암 10개 암종에 대한 다기관 임상데이터 라이브러리가 구축된다. 수집된 암데이터는 우리나라 사망 원인 1위인 암 진단과 치료 결정뿐만 아니라 항암 치료제 연구개발(R&D) 등에 활용된다. 대국민 암 예방, 검진, 치료, 재활 등 다양한 서비스 모델이 기대된다.

최 센터장은 “병원마다 임상데이터웨어하우스(CDW)를 구축하고 있지만 단일 병원 데이터만으로는 활용 효과를 보기 어렵다”면서 “암 치료가 특정 유전자 변이에 대응하는 표적항암제를 처방하는 정밀 의료 체제로 가고 있는 만큼 한 달에 한 번 업데이트 되는 '리얼 데이터'로 각 병원 치료제 사용 현황과 생존율을 확인하고 의사결정에 활용할 수 있다”고 밝혔다.

수집된 데이터는 권한에 따라 △폐쇄형 △공유형 △개방형 세 단계로 활용된다. 각 기관 내 폐쇄망에서는 기관생명윤리위원회(IRB) 승인을 받은 연구자만 원시데이터 접근이 가능하다. 외부 제약회사나 스타트업은 별도 신청을 통해 IRB 승인을 받으면 공유형 포털에 접속해 공동 연구를 할 수 있다. 일반인에게 암종별 메타 데이터와 오픈 API를 제공하는 개방형 포털도 구축했다. 모든 임상데이터는 익명화 방식으로 수집되며, 각 병원 폐쇄망에서만 활용이 가능하다. 10개 센터 간 데이터 공유도 전용망으로만 이뤄진다.

데이터를 외부로 반출할 수 없기 때문에 포털 내에 별도 분석 플랫폼을 구축해 연구자가 데이터를 유용하게 활용할 수 있도록 돕는다. 클릭센스로 여러 통계 지표를 시각화해 보여 주고, 파이선이나 R 등 프로그래밍 언어를 지원한다. 머신러닝, 딥러닝 등 인공지능(AI) 학습도 가능하다.

최 교수는 “개인정보보호법 개정으로 가명 처리된 데이터를 연구용으로 활용하는 법적 근거가 마련된 만큼 협의를 통해 구축된 데이터를 사전 신청한 외부 기업이나 연구자도 활용할 수 있도록 공개 범위를 확대하는 것을 검토하고 있다”면서 “향후 임상데이터 외에 유전체데이터나 종양영상데이터도 국가 데이터베이스(DB)화하면 플랫폼을 확장할 수 있을 것”이라고 말했다.

정현정기자 iam@etnews.com