AI가 질병 원인 유전자까지 짚어낸다…국내 연구진, 설명가능 분석 플랫폼 개발

SaintGSE의 학습 및 예측 프레임워크 개요. (연구재단 제공)
SaintGSE의 학습 및 예측 프레임워크 개요. (연구재단 제공)

대규모 유전자 데이터를 스스로 학습해 질병 신호 경로와 핵심 유전자를 정밀 예측하는 인공지능(AI) 분석 체계가 구축됐다.

한국연구재단은 윤성일 중앙대 교수 연구팀과 양시영 성균관대 교수 연구팀, 조찬미 한양대 교수 연구팀이 공동 연구를 통해 대규모 전사체 데이터를 기반으로 질병 연관 경로를 정밀하게 예측하고 각 경로의 핵심 유전자를 근거와 함께 제시하는 AI 분석 기술 '세인트GSE(SaintGSE)'를 개발했다고 1일 밝혔다.

차세대 시퀀싱 기술 발전으로 방대한 전사체(유전자 발현) 데이터가 축적되고 있으나, 이를 질병 분자 기전과 신호전달경로 변화로 연결해 질병 정확한 원인을 해석하는 데에는 여전히 한계가 존재한다.

연구팀은 데이터의 효율적인 표현 방법을 스스로 학습하는 비지도 학습 기반의 인공신경망 구조인 오토인코더와 트랜스포머 구조를 결합한 SaintGSE를 구축해 복잡한 전사체 데이터 패턴으로부터 질병 관련 신호전달경로의 활성화 여부를 정밀하게 예측하는 데 성공했다. 특히 설명가능한 AI(XAI) 기법을 도입해 AI가 질병 경로를 예측할 때 어떤 유전자를 결정적인 근거로 삼았는지 그 기여도를 수치화하여 제시할 수 있도록 만들었다.

실제 연구팀이 이 모델을 골관절염 및 천연물 처리 전사체 데이터에 적용한 결과 질병이 발생하는 분자 기전을 정확히 해석해 냈을 뿐만 아니라 치료 후보물질이 몸속에서 어떻게 작용하는지 그 기전까지 효과적으로 탐색할 수 있음을 증명했다.

이는 기존의 단순 통계 분석을 넘어 AI가 질병 신호를 직접 예측하고 원인 유전자까지 규명하는 새로운 분석 체계를 완성한 것으로, 향후 환자 맞춤형 정밀의학 및 맞춤형 신약 개발 효율성을 획기적으로 높일 수 있는 만능 플랫폼의 기반을 마련했다는 평가를 받는다.

윤성일 교수는 “이번 연구는 AI를 활용해 복잡한 유전자 데이터 속에서 질병을 유발하는 핵심 경로와 원인 유전자를 설명 가능한 방식으로 도출해 낸 성과”라며 “앞으로 다양한 신약 후보 물질의 작용 원리를 예측하는 정밀의학 분야의 핵심 기술로 널리 활용될 것으로 기대한다”고 말했다.

이번 연구 성과는 국제학술지 '골관절염 및 연골(Osteoarthritis and Cartilage)'에 4월 16일 온라인 게재됐다.

이인희 기자 leeih@etnews.com