국립암센터, 496만 암데이터 활용…'AI 실증·차세대 신약' 투트랙 가동

발행일 : 2026-05-19 16:00 지면 : 2026-05-20 13면

국립암센터가 496만명 규모 대규모 암 환자 데이터와 인공지능(AI) 인프라를 차세대 신약 개발 플랫폼에 결합한다. 대형 데이터 기반 임상 실증 인프라를 구축하는 동시에, 항체-약물접합체(ADC)와 표적단백질분해(TPD) 등 고부가가치 신약 설계 효율성을 극대화한다는 구상이다.

국립암센터는 암 관련 정형 임상정보와 영상·유전체·다중 오믹스 데이터를 통합한 데이터웨어하우스(DW)를 기반으로 GPU 분석 환경과 연합학습 체계를 도입한 국가 차원 '암 AI 데이터 허브'를 구축할 계획이라고 19일 밝혔다. 현재 예산 확보를 위해 보건복지부와 협의를 추진 중인 것으로 파악됐다. 룩셈부르크 국립보건연구원(LIH) 등 글로벌 협력과 범부처·민간 공동연구를 통해 재원 마련도 추진 중인 것으로 알려졌다.

특히 임상 의사결정 지원 시스템(CDSS) AI 모델은 전이학습을 기반으로 다기관 임상 실증을 추진할 예정이다. 전이학습은 기존 학습된 데이터를 활용해 새로운 환경에 빠르게 적응하는 방식이다. 실증은 2028년부터 2030년까지 진행한다. 5개 이상의 의료기관이 참여해 맞춤형 AI 모델의 유효성을 검증하게 된다. 아울러 환자 장기 상태를 복제해 실제 약물 투여 전 효과를 사전 시뮬레이션하는 디지털 트윈 기반 가상 임상시험 기술도 적용한다.

구축된 데이터 인프라는 차세대 신약 R&D 전략인 ADC 및 TPD 연구에 쓰인다. 단기적으로 임상 적용 및 상용화 가능성이 높은 ADC에 연구 역량을 우선 집중하고, 중장기적으로는 질병 원인 단백질을 원천 분해하는 TPD 기술을 육성한다는 목표다.

암센터는 국내외 TPD 연구 과정에서 난제를 해결하기 위해 AI 기반 구조 정밀 설계 전략과 오믹스 통합 분석 방법론을 적용할 예정이다. 이 연구 방법은 암 단백질만 골라 제거할 최적의 분해 효소를 찾아내고, 약물이 표적과 효소를 단단히 결합해 약효를 내도록 결합 구조를 설계하는 고난도 과정이다.

의료 데이터 사각지대에 놓인 희귀·소아암과 고령 암환자 지원을 위한 연구도 시작한다. 희귀암 레지스트리(질환별 환자 통합 데이터베이스) 설계를 연내 마무리해 내년 운영한다. 권역암센터 등 10개 이상 기관이 참여해 5000명 이상 환자 데이터를 구축할 계획이다.

고령 암환자 분야에서는 약 1만건 규모 실제 데이터(RWD)와 임상 데이터를 기반으로 노인 포괄평가(CGA)를 도입한다. 이를 통해 2030년 전후 치료 의사결정 모델과 5개 수준의 핵심 진료 가이드라인을 마련하고, 향후 건강보험 수가 및 적정성 평가 등 국가 정책과 연계한다.

이건국 국립암센터 연구소장은 “인공지능과 구조 정보, 오믹스 데이터를 결합한 정밀 설계는 신약 후보물질 발굴의 성공 가능성을 높이는 핵심 동력”이라며 “병원 기반 임상자료와 진료 현장에서 축적된 실세계 데이터를 활용해 환자 맞춤형 정밀의료의 임상 적용을 한층 강화해 나가겠다”고 말했다.

임중권 기자 lim9181@etnews.com