서울대병원-하버드 의대 '가상 병원 시뮬레이터' 공개

실제 임상 현장과 똑같은 가상 병원에서 의료 인공지능(AI)을 실전 검증하는 모델이 세계 최초로 발표됐다.

AI 처방이 환자 악화나 자원 고갈에 미치는 연쇄 파급 효과를 사전 검증해 실제 환자 위험 없이 AI 안전성을 철저히 시험할 전임상이 가능해질 전망이다.

서울대병원 특화연구소 김성은 연구교수와 하버드 의대 공동 연구팀은 거대언어모델(LLM) 기반 의료 AI를 동적으로 평가하는 '임상 환경 시뮬레이터(CES)'를 14일 발표했다.

이 디지털 가상 병원 평가 체계 연구는 국제 학술지 네이처 메디슨 최신 온라인판에 게재됐다.

기존 의료 AI 평가 모델과 가상 병원 시뮬레이터(CES)의 성능 비교.
기존 의료 AI 평가 모델과 가상 병원 시뮬레이터(CES)의 성능 비교.

기존 의료 AI 평가는 과거의 정적인 데이터에 의존하고 있어 현장에서 의사 결정이 미치는 연쇄적 파급 효과를 반영하지 못했다. 연구팀은 조종사가 비행 시뮬레이터에서 훈련받듯 의료 AI 역시 시간 흐름과 자원 제약 속에서 대처 능력을 평가하기 위해 '환자 엔진'과 '병원 엔진'을 동기화했다.

환자 엔진은 전문의가 정의한 질병 궤적 템플릿과 실제 전자의무기록의 환자 초기 데이터를 바탕으로 LLM이 증상과 치료 반응의 다양한 가상 경로를 동적으로 생성해 환자 상태 변화를 모사한다.

병원 엔진은 실제 병원의 시간 데이터를 바탕으로 현장의 단계별 업무 흐름을 그대로 재현해 병상, 의료진, 장비 상태를 실시간 추적한다. 혈액 검사 지시가 내려지면 실제 소요 시간에 맞춰 단계별로 필요한 의료 인력이 순차적으로 배정되고 초응급 환자에게 자원을 우선 할당하는 우선순위 체계까지 구현했다.

가상 병원에서는 AI 개입 시점에 따라 위기 상황이 생생하게 구현된다.

예를 들어 AI가 검사 처방을 지연시킬 경우 안정적이던 흉통 환자가 급성 심근경색으로 악화할 수 있다. 또 AI가 특정 초응급 환자에게 CT 스캐너 등 핵심 자원을 우선 할당하면 다른 환자들의 대기열이 길어지는 현실적인 병목 현상도 발생한다.

AI의 결정 하나가 특정 환자의 생사를 가르는 것은 물론 병원의 남은 자원을 고갈시켜 다음 환자의 진료 기회를 연쇄적으로 제한하는 실제 병원 환경을 구현한 것이다.

AI가 내린 모든 결정은 환자 예후와 병원 운영 효율성을 합친 '이중 지표 복합 점수'로 평가된다. 환자를 위험에 노출시키지 않고 시스템 안전성을 입증하는 '무위험 전임상 테스트 환경'을 제공함으로써 의사가 본연의 역할에 온전히 집중할 수 있도록 AI가 의료진의 디지털 대리인의 역할을 한다.


김성은 연구교수(공동 제1저자)는 “가상 병원이 인체의 복잡한 생리적 반응을 완벽히 예측할 수는 없다”면서도 “이번 연구는 의료 AI가 단편적인 문제를 푸는 도구를 넘어, 역동적인 의료 체계 내에 완전하게 통합돼 실제 도움을 주도록 검증하는 다음 단계가 될 것”이라고 강조했다.

서울대병원 의생명연구원 특화연구소 김성은 연구교수
서울대병원 의생명연구원 특화연구소 김성은 연구교수

배옥진 기자 withok@etnews.com