[KISTI과학향기]'신약개발 AI', 우리에게 약일까, 독일까?

오늘날 AI는 제약 산업의 여러 방면에서 활약하고 있다. 신약 후보 물질 탐색, 기존에 있던 약물을 다른 질환 치료제로 개발하는 약물 재창출(repositioning), 약물 적응증과 반응성 예측, 약물의 화학적 성질과 유전체 데이터를 기반으로 한 임상시험 성공률 예측, 약물이 작용할 표적 단백질 구조 예측이 그 예다. 제약 업계에서는 막대한 시간과 비용을 투입해야 했던 과거에 비해 전반적으로 효율성을 높일 수 있게 되었다는 점에서 신약개발 지름길이 열렸다는 전망이다. 앞다퉈 신약개발 인공지능(AI) 시장에 뛰어드는 수많은 스타트업과 연구소들이 그 증거일 것이다.

최근 AI는 신약 개발에 다양하게 활용되고 있다. (출처: shutterstock)
최근 AI는 신약 개발에 다양하게 활용되고 있다. (출처: shutterstock)

◇AI, 신약개발 기간을 크게 줄이다

한 예로 2012년 영국에서 설립된 AI 스타트업인 엑사이언티아(Exscientia)는 신약 후보 물질 탐색을 위한 AI 알고리즘을 개발해 기술 상용화를 거친 후 2020년 초 강박장애(OCD) 치료를 위한 약물(DSP-1181) 후보 물질을 발표했다. 일본의 스미모토 제약과 협력해 이뤄낸 성과는, AI 설계 물질로서 임상시험에 진입하는 데 성공한 최초 사례였다. 엑사이언티아에 따르면 임상시험에 이르기까지 평균적으로 5년가량 걸리던 개발 과정은 AI를 이용하면서 12개월로 단축됐다. 이후 회사는 신약개발 AI 플랫폼의 뛰어난 효율성을 과시하듯 2년도 지나지 않아 면역항암제(EXS-21546), 알츠하이머 치료제(DSP-0038)까지 추가로 발표하였으며 그 결과 현재 총 세 종류의 임상 후보 물질에 대해 임상 1상을 진행하고 있다.

약물 표적 부위인 단백질의 구조, 그리고 약물과 단백질 상호작용을 예측하는 '구조기반 신약 개발' 분야에서도 AI에 거는 기대가 크다. 2020년 말 알파고를 개발한 것으로 잘 알려진 인공지능 회사 구글 딥마인드는 단백질 구조 해독 AI인 '알파폴드2(AlphaFold2)'를 발표했다. 과거 X선 결정법이나 저온 전자현미경법(Cryo-EM) 실험 등을 이용해 길게는 수십년이 걸리던 일을 컴퓨터를 이용해 단 몇 분에서 몇 시간 정도로 단축하는 혁신이 일어난 것이다.

뒤이어 2021년에는 미국 워싱턴대 데이비드 베이커 교수가 이끄는 연구팀이 '로제타폴드(RoseTTAFold)'를 개발하는 데 성공했다. 로제타폴드는 알파폴드2보다 더 적은 데이터로도 구조를 예측할 수 있는 효율적인 AI로 평가받아 국제학술지 '사이언스'에서 '2021년 최고 연구성과'로 선정되기도 했다.

◇신약개발 AI, 6시간 만에 독성물질 4만종 생성

이처럼 신약개발 AI는 다른 분야의 AI와 마찬가지로 과학자들의 손과 발이 돼 그 어느 때보다 빠르고 효율적으로 성과를 낼 수 있도록 도와주고 있다. 그러나 새로운 기술에는 탁월한 혁신성만큼이나 의도치 않은 위험성이 따르게 마련인 걸까? 선한 목적으로 개발돼 우리에게 이롭기만 할 것 같던 신약개발 AI에 대해 엄청난 부작용을 우려하는 연구 결과가 최근 발표됐다.

신약개발 AI의 위험성을 경고하는 연구가 최근 발표됐다. (출처: shutterstock)
신약개발 AI의 위험성을 경고하는 연구가 최근 발표됐다. (출처: shutterstock)

지난 3월, 미국 노스캐롤라이나의 신약 개발사 컬래보레이션스제약(Collaborations Pharmaceuticals)은 AI와 머신러닝이 오용될 경우 생화학 무기를 만들어내는 데 쓰일 수 있다는 내용의 논문을 국제학술지 '네이처 기계지능'에 게재했다. 이 연구는 첨단 기술 동향을 살피고 그와 관련된 잠재적 안보 문제에 대비할 목적으로 2년마다 개최되는 '국제 생화학무기 회의'로부터 요청받아 이루어진 것이었다.

신약 물질을 물리적으로 실험하기에 앞서 분자 설계를 주로 하는 이 연구진은 “수십년 동안 우리는 인간의 건강 악화가 아닌 개선을 위해 컴퓨터와 AI를 사용해 왔다”면서 이 기술이 오용될 가능성에 대해 순진하고 안일했음을 반성했다. 그들은 건강에 해가 될 만한 약물을 걸러내기 위해 독성 예측의 전문가가 된 사람들이었고 독극물과 관련된 보안 문제와는 거리가 멀다고 스스로 생각해왔다.

연구진은 적절한 약물 후보를 탐색하는 데 사용하던 '메가신(MegaSyn)'이라는 머신러닝 알고리즘을 조금 변형해 써 보기로 했다. 원래 메가신은 일반적으로 물질의 독성이 예측될 경우 감점하고 반대로 생체적합성이 예측되면 점수를 더하는 식으로 학습하는 AI였다. 하지만 이번 연구에서는 독성과 생체적합성 모두에 가점하는 방식으로 알고리즘을 바꾸었다. 즉, 의도적으로 인체에 치명적으로 작용할 독성물질을 찾고자 한 것이다. 연구진은 누구나 접근할 수 있는 공개 데이터베이스에 있는 정보로 AI를 훈련시켰으며 살충제, 환경 독소 및 기타 약물로 구성된 반수치사량(LD50) 모델을 기준 삼아 새로운 가상 분자에 점수를 매겼다.

논문에서 '치명적인 분자 생성기'라고 불린 이 AI는, 결과적으로 6시간이 채 되지 않아 40,000개의 독성 분자 후보들을 생성해냈다. 새롭게 설계된 독성물질 중에는 지구상에서 가장 독성이 강한 물질로 여겨지는 신경독 'VX'보다 더욱 강력한 것으로 예측되는 물질이 수백 가지나 존재했다. 더욱 놀라운 점은 연구진이 AI를 훈련하는 데 사용한 데이터세트에 신경독 종류가 포함되지 않았음에도 불구하고 이러한 물질이 생성되었다는 사실이었다. 살충제, 환경 독소, 약물 데이터로부터 이처럼 강력한 신종 독성물질이 고안된 것은 그들도 예상하지 못한 부분이었다.

AI가 생성한 대부분의 물질들은 신경독 VX(오른쪽 그래프에 있는 구조)보다 독성이 더 높은 것으로 나타났다. (출처: Nature Machine Intelligence)
AI가 생성한 대부분의 물질들은 신경독 VX(오른쪽 그래프에 있는 구조)보다 독성이 더 높은 것으로 나타났다. (출처: Nature Machine Intelligence)

연구진은 머신러닝 기술을 이용할 수 있는 누구든 공개된 정보를 통해 이와 같은 AI를 개발할 수 있다고 우려하면서 논문 말미에 “여러 분야에 걸쳐 신약개발 AI에 대한 진지한 논의가 당장 이루어져야 한다”고 촉구했다.

그나마 다행스러운 점은 이처럼 수많은 잠재적 후보 물질이 설계되더라도 이를 실제로 합성하기는 무척 어렵다는 것이다. 그 장벽이 얼마나 높은지는 10년 남짓한 신약개발 AI 역사상 AI로 발굴한 후보 물질이 최종 임상을 통과한 성공사례가 단 한 건도 없는 것을 보면 알 수 있다. 분명 신약개발 AI는 여러 방면에서 연구 효율성을 높였으며 막대한 자본을 끌어모으고 있는 매력적인 도구지만 아직 보완될 점이 많은 기술이다. 그러니 신약개발 AI가 다음 도약을 이루어 내기 전 지금은 희망을 품고 치열하게 토론을 나눌 골든타임이다.

글: 정유희 과학칼럼니스트