광주과학기술원, 암 관련 유전자 연구 검색엔진 개발

이현주 교수·김정균 박사과정 연구팀

국내 연구팀이 암과 유전자의 관계에 대한 기존 연구 결과를 보다 손쉽고 정확하게 찾을 수 있는 특화된 검색 엔진을 개발하는 데 성공했다.

광주과학기술원(총장 김영준) 이현주 정보통신공학부 교수와 김정균 박사과정(제1저자)은 수 많은 각종 의학·생물학 문헌에서 암 관련 유전자와 그 유전자의 세포내 상태 변화, 유전자와 질병과의 관계를 표현하는 문장들을 찾아내는 검색엔진 시스템 `디그시(DigSee·Disease Gene Search Engine with Evidence Sentences)`를 개발했다고 5일 밝혔다.

광주과학기술원, 암 관련 유전자 연구 검색엔진 개발

이에 따라 연구진들이 수많은 의학·생물학 관련 문헌에서 유전자와 질병 간의 관계를 명시적으로 기술한 문장을 효율적으로 찾을 수 있게 돼 질병 연구에 기여할 것으로 보인다.

미래창조과학부와 한국연구재단이 추진하는 중견연구자지원사업의 지원으로 수행된 이 연구에는 박종철 한국과학기술원 교수연구팀과 김정재 싱가포르 난양공대 교수가 참여했으며 연구 결과는 생물학 분야 학술지인 `핵산 연구` 7월호에 게재됐다.

암은 수천개 이상의 유전자가 변화하는 것과 관련 있고 이 유전자들은 복합적인 상호 작용을 통해 신호 전달 체계에 영향을 미친다. 암에 대한 연구는 암 관련 유전자들에 관한 연구 결과들을 종합적으로 분석하는 것이 중요하다.

하지만 암 관련 유전자들에 대한 연구 결과들을 발표한 문헌들이 기하급수적으로 증가해 연구자들이 새로운 연구 결과들을 손쉽게 찾아내고 통합적으로 분석하는 것이 갈수록 힘들어지고 있다. 유전자와 질병의 관계에 대한 명시적인 표현을 문헌에서 손쉽고 정확하게 찾을 수 있는 방법이 요구되는 이유다.

연구팀은 연구·개발한 디그시는 생명 과학 및 의학 문헌을 저장하는 데이터베이스인 메드라인에 포함된 모든 논문에서 200종 이상의 악성종양과 관련한 9000개 이상의 유전자가 어떠한 상태 변화를 통해 특정 악성 종양을 일으키는가에 대한 정보를 추출·제공한다.

특히 자체적으로 개발한 베이지안 분류기에 기반을 둔 텍스트 마이닝 기법을 통해 사용자의 검색과 가장 관련이 높은 문장을 관련성이 높은 순으로 정렬해 보여준다.

이같은 텍스트 마이닝 기법은 문헌에 기술된 문장의 패턴을 분석해 개발됐으며, 검색의 정확도 면에서 기존의 일반적인 검색 엔진의 성능을 월등히 앞서고 있다.

이현주 교수는 “디그시는 암 연구자들이 필요한 논문을 찾을 때 유용하게 사용할 수 있는 검색 엔진으로서 연구 효율은 물론 연구 결과의 질 향상에도 기여할 것”이라며 “향후 모든 유전 질병에 대해 검색이 가능한 검색 엔진으로 확장시킬 계획”이라고 말했다.

광주=서인주기자 sij@etnews.com