[사이언스온고지신]의료 데이터 뉴딜사업을 위한 네 가지 제언

이상훈 한국한의학연구원 미래의학부 책임연구원
이상훈 한국한의학연구원 미래의학부 책임연구원

만화영화에서나 보던 인공지능(AI) 시대가 어느새 성큼 눈앞으로 다가오고 있다. 물론 세부적으로 들여다보면 앞으로 가야 할 길이 멀어 보이기도 한다. 하지만 지금까지 AI가 보여준 발전 속도를 고려할 때, 지금은 불가능해 보이는 길 또한 어느 순간 당연한 것으로 보이는 시대가 찾아올지도 모른다.

AI가 기여할 수 있는 수많은 영역 중 의료 AI가 특히 주목을 받는 이유는 인간의 가장 본질적 인 생존 욕구에 기여하기 때문일 것이다. 하루가 멀다 하고 쏟아져 나오는 AI 관련 논문과 기사 등을 살펴보면 복합적 의사결정에 여전히 한계가 있지만, 적어도 의료영상 분야에서는 인간의 수준을 한참 뛰어넘은 것으로 보인다. 그렇다면 AI 의료 시대에 필요한 인재는 무엇이고, 우리는 그것을 위해서 무엇을 해야 할까?

AI 관련 현장 연구자들에게 가장 어려운 것이 무엇인가를 물어보면 한 명도 빠짐없이 '쓸 만한 데이터가 없다'는 응답을 한다. 막상 AI를 만들려고 하면 학습시킬 자료가 없다는 것이다. 아무리 빅데이터와 AI라는 단어가 한 몸처럼 같이 등장하는 용어라 할지라도 무조건 데이터가 많은 것이 AI 개발을 보장해주지는 않는다. 현대 AI연구를 가장 짧게 설명하라면 '컴퓨터의 어마어마한 연산량과 속도를 이용해 상상할 수 없을 정도의 시행착오를 인간 대신 겪어서 패턴을 찾아내는 작업'이라고 할 수 있다. 그 결과가 마치 인간이 갖고 있는 직관과 판단력처럼 동작하기 때문에 AI라는 표현을 사용하는 것뿐이다. 결국 AI라고 해도 쌓여있는 데이터 안에 '찾아낼 정보'가 담겨있지 않다면 필요한 것을 찾아낼 수 없다. 줄자로 잰 청양고추 '길이'를 기반으로 고추 품질 등급을 판정하는 AI를 만드는 것은 카메라로 찍은 고추 색깔과 모양을 기반으로 판정하는 AI 개발에 비해 압도적으로 어렵거나, 거의 불가능에 가깝다. 잘 설계된 좋은 데이터 없이는 좋은 AI가 나올 수 없다. AI는 마법의 도구가 아니라 시행착오를 인간 대신 고속으로 수행해주는 비서일 뿐, 없는 것에서 있는 것을 만들어내지는 못한다.

그렇다면 '의료 AI 개발에 쓸 수 있는 고품질 빅데이터'를 만들기 위해서는 어떤 것들이 필요할까?

첫 번째는 데이터 특징을 이해하는 '데이터 생산자' 육성이다. AI 개발 80%는 데이터수집과, 분류, 정제 과정 등 우수한 재료를 확보하는 작업이다. 의료 AI의 개발 과정을 이해하고, 개발자에게 필요한 가공된 데이터를 생산할 수 있는 융합형 의료 인력 육성이 필수적이다.

두 번째는 AI 개발에 활용할 수 있도록 전산화 돼있으면서, 데이터 유실이 최소화된 로 데이터(Rawdata)의 지속가능한 수집 환경 구축이다. '찾아낼 정보'가 담겨있는, 원형에 가까운 데이터이면서 동시에 AI 가 학습 시킬 수 있는 형태로 잘 변환된 데이터가 필요하다. 의사가 판단 근거로 사용한 '측정결과 값'만 차트에 남아있어서는 안되고 '측정과정에서 생산된 소스'가 가급적 원형 그대로 보관 돼야 한다. 엑스레이, CT, MRI와 같이 소스 자체가 의료영상저장전송시스템(PACS)에 남아있으면서 라벨링 결과까지 있는 의료영상은 AI의 개발에 최적의 대상이었다고 할 수 있다. 이와 유사한 형태로 뇌파, 심전도 등 각종 생체신호 센싱 데이터를 원본 그대로 저장·전송할 수 있는 시스템이 구축돼야 한다.

세 번째는 로 데이터 수집이 가능한 의료기기 인프라의 구축이다. 뇌파, 심전도 등 생체 신호를 측정한 후 최종 분석 결과만을 제공하는 방식의 의료기기로는 AI개발에 필요한 로 데이터를 확보할 수 없다. 시간에 따른 심전도 값 자체를 데이터베이스(DB)화해서 차트와 연동할 수 있도록 소프트웨어(SW)를 제공하는 '빅데이터 친화형 의료기기'가 보편화 될 때 이런 데이터를 기반으로 AI 개발이 꽃피울 수 있다.

마지막으로는 이런 모든 과정을 통해 생산되는 의료 빅데이터가 지속 가능하게 생산되도록 하는 인센티브 제도 구축이다. 아무리 중요한 일이라고 해도, 그것을 수행하게 하는 동기부여가 이뤄지지 않는다면 결국 데이터는 수집되지 않는다. 의료 AI개발을 위한 고품질 빅데이터 구축이 제도화 되고, 이에 대한 지불체계가 마련될 때 실질적인 빅데이터가 수집되기 시작한다.

5월 11일 한국형 빅데이터 뉴딜사업이 본격적으로 천명됐다. AI 시대 미래 한국을 먹여 살릴 핵심 인프라가 구축되는 것은 매우 반가운 일이다. 의료 빅데이터 뉴딜을 위해서는 빅데이터 구축에 대응할 수 있는 로 데이터 저장과 전송을 지원하는 의료기기 SW 개발 지원 사업, 이를 저장 전송하기 위한 파일 포맷 표준화 및 전송 시스템 보급 지원 사업, AI 융합형 의료인재 확보를 위한 '의료인 AI 기업 병역 특례 제도 마련', 건강 보험청구 시 라벨링된 로 데이터에 대한 인센티브제도 도입 등이 하루 빨리 이뤄져야 할 것이다.

한국형 의료 빅데이터 뉴딜 사업을 통해 한국이 동아시아 의료 빅데이터 및 의료 AI의 허브로거듭날 수 있기를 기원한다.

이상훈 한국한의학연구원 책임연구원 ezhani@kiom.re.kr