고려대 컴퓨터학과, 인공지능 질의응답 국제대회에서 2년 연속 '1위'

고려대학교(총장 정진택)는 컴퓨터학과 연구팀이 의학·생물학 질문에 답하는 인공지능(AI) 시스템 경진 국제대회 '바이오ASQ' 대회에서 2년 연속 우승했다고 28일 밝혔다.

고려대 연구팀은 정민별, 성무진, 김강우, 윤원진, 유재효 등 대학원생과 졸업생인 김동현 박사(현대자동차 AIR 랩), 지도교수인 강재우 교수로 구성됐다.

올해로 8번째를 맞는 이 대회는 가장 오래된 의생명 분야 질의응답 시스템 경진대회다. 구글, 미국 국립보건원(NIH), 유럽연합 등이 후원한다.

예를 들어 폐암에 관련된 논문을 주고 '폐암의 전이에 관여하는 유전자 변이는 무엇인가?'라는 질문을 하는 방식이다. 이 대회에 출전하는 인공지능모델들은 3개월에 거쳐 모두 5번의 시험을 보게 되며, 결과는 의사, 생물학자 등 해당 분야 전문가가 만들어 놓은 정답을 이용해 평가된다.

고려대 연구팀은 '이그젝트(Exact)' 종목에서 총 5회 평가회차 중 1위 4회, 2위 1회로 매사추세츠대학(1위 1회), 후단대(2위 1회)를 꺾고 지난해에 이어 우승했다.

'BRAF V600E 유전자 변이는 전이성 비소세포폐암과 연관이 있습니다'와 같이 서술형 문장으로 답을 만들어 제출하는 '아이디얼(Ideal)' 종목까지 참여해 5회 중 1위 3회, 2위 1회로 캘리포니아대 샌디에이고(UCSD), 호주 맥쿼리대를 압도하며 우승하여 두 종목 모두를 석권했다.

이번 결과는 AI 모델을 이용해 얻은 성과다. 강재우 교수 연구팀이 개발한 의생명 분야 문헌에 특화된 딥러닝 언어모델(BioBERT)도 활용했다.

자연스러운 문장으로 답을 하는 아이디얼 종목은 서술형 문제에 해당하는데, 이그젝트 종목에서 나온 단답형 정답과 BART 언어 요약 모델을 활용해 정답 문장을 생성해낸다. 단순히 주어진 문서에서 문장을 선택해 정답을 말하는 기존 방식과는 달리 강재우 교수 연구팀은 정답 문장을 인공지능이 직접 작성해내는 방식을 처음으로 사용했다. 이 덕분에 문장이 얼마나 자연스러운지 평가하는 항목에서는 거의 만점에 가까운 점수를 받았다.
고려대 관계자는 “이번 연구는 의생명 도메인의 텍스트를 학습한 결과를 바탕으로 기존 의생명 질의응답 시스템의 성능을 유의미한 수준까지 큰 폭으로 개선했다는 점에서 의미가 있다”고 설명했다.

기념촬영을 하고 있는 고려대 컴퓨터학과 연구팀. 왼쪽부터 유재효 석박통합과정(고려대), 김동현 박사 (현대자동차 AIR Lab, 고려대 졸업생), 정민별 석박통합과정(고려대), 강재우 교수(고려대), 윤원진 박사과정(고려대), 성무진 석박통합과정(고려대), 김강우 석박통합과정 (고려대)
기념촬영을 하고 있는 고려대 컴퓨터학과 연구팀. 왼쪽부터 유재효 석박통합과정(고려대), 김동현 박사 (현대자동차 AIR Lab, 고려대 졸업생), 정민별 석박통합과정(고려대), 강재우 교수(고려대), 윤원진 박사과정(고려대), 성무진 석박통합과정(고려대), 김강우 석박통합과정 (고려대)

문보경기자 okmun@etnews.com