[사이언스온고지신]유전체 빅데이터 시대를 맞으며

글자 작게 글자 크게 인쇄하기
이병욱 한국생명공학연구원 국가생명연구자원정보센터 책임연구원
<이병욱 한국생명공학연구원 국가생명연구자원정보센터 책임연구원>

애플 창업자인 스티브 잡스는 췌장암에 걸려 죽음을 앞둔 2011년 자신의 유전체 정보를 분석해 췌장암 원인 유전자 변이를 찾아냈다. 당시 약 1억원 이상 비용을 들여 원인 유전자를 찾았지만, 아쉽게도 치료제가 없어 손을 쓸 수 없었다.

유명 배우 안젤리나 졸리는 2014년 '유방암 예방을 위해 유방을 모두 절제했다'고 발표해 세간의 화두가 됐다. 그녀는 'BRCA1'이라는 암 억제 유전자 변이를 가지고 있어서 유방암에 걸리기 쉬운 체질이었다. 주치의는 향후 유방암에 걸릴 확률이 80%가 넘는다고 진단했는데, 유방 절제로 발생 확률을 5%이하로 줄였다.

두 사람의 공통점은 바로 질병 예방과 진단에 자신의 유전체 정보를 이용했다는 것이다. 유전병 원인은 모두 유전체 이상에서 유래한다. 개인 유전체 정보를 정확히 해독해 원인 유전자를 알아낸 다음, 적합한 치료로 질병을 극복할 수 있다.

시작은 30억 개의 DNA 염기서열을 정확히 해독하는 것이다. 2000년대 초 발표한 인간유전체지도 초안은 유전체 시대 서막을 알리는 역사적 사건임과 동시에 생물을 데이터로 인식하는 전환점이었다.

당시 한 명의 유전체 해독을 위해 10년이라는 기간과 3조원 비용이 소요됐으며 이는 유전체 대중화를 막는 장애물이었다. 하지만 2005년 새롭게 등장한 차세대 유전체 서열결정(NGS) 기술과 이후 발달은 우리를 '100달러 개인 유전체' 시대로 접어들게 했다. MRI나 초음파 진료와 유사한 수준 비용으로 유전체 정보를 얻을 수 있게 됐다.

유전체 해독비용의 급격한 감소로 인류는 '유전체 빅데이터'라는 새로운 시대를 맞이하게 됐다. 국가 차원에서 10만 명 이상 유전체 해독을 진행 중인 국가는 현재 10개다. 아시아에서는 중국, 일본, 사우디아라비아 등이 있다. 한국은 5월 22일 문재인 대통령이 직접 발표한 '바이오헬스 산업 혁신전략'을 통해 최대 100만명 규모 바이오 빅데이터를 구축하겠다고 선언했다. 내년부터 2021년까지 1단계 2만명 규모 사업을 시작으로, 2029년까지 100만명 빅데이터 구축 완료를 목표로 한다.

우리나라는 유전체 연구 및 활용 분야에서 후발 주자며, 특히 유전체 정보 분석 및 해석에서는 선진국과 큰 격차가 있다. 우리 현실과 유전체 분야의 새로운 흐름에 어떤 준비를 해야 하는지 생각해 볼 필요가 있다.

가장 시급한 것은 빅데이터를 저장하고 분석하는 전산인프라 구축과 해석 기술 개발이다. 사람 한명의 유전체 정보 양은 약 250기가바이트(GB)며, 1만 명이면 2.5페타바이트(PB) 데이터가 생산된다. 개인 연구자 실험실에서 분석하는 것은 거의 불가능하다. 국가차원의 유전체 전산인프라를 구축하고 해석 기술을 개발해 클라우드 컴퓨팅으로 제공해야 한다.

또 유전체 분야 기술력과 심각한 전문 인력 부족을 개선해야 한다. 유전체 정보 생산·공유, 분석, 인공지능(AI)을 이용한 응용, 정밀의료, 신약개발, 동식물 육종 등 각 분야별 독자 기술력을 갖춰야 한다. 유전체 선진국 기술을 따라서는 영원히 유전체 선진국이 될 수 없다. 유전체 전문가 양성을 위해 장기적인 대규모 투자가 꾸준히 이뤄져야 된다.

또 유전체 빅데이터 공유와 활용을 막는 개인정보 보호법 등 국내 규제법을 국제적인 표준에 준해 개방해야 한다. 국내 유전체 빅데이터 활용 문제점을 지혜롭게 풀려면 유전체 정보를 공유 주체인 정부·연구자·병원·기업·개인이 지속 논의해 합의점을 찾아야 한다.

우리나라는 유전체 연구에 많은 연구비를 투입하지만, 사업이 종료되면 대부분 생산정보는 사장되고 있다. 데이터가 체계적으로 관리 돼야 비로소 빅데이터로 능력을 발휘하게 된다. 연구자들이 자발적으로 자신의 데이터를 공유하는 문화가 확산돼야 하며, 국가에서 데이터를 모으고 공유하는 기반을 제공해야 한다.

유전체 분야는 블록체인, AI 및 빅데이터 분석 등이 융합되고 바이오 빅데이터와 결합될 때 무궁무진한 활용성을 띤다. 복잡하고 이질적인 빅데이터를 어떻게 생산, 수집, 관리, 통합 분석해 새로운 가치를 창출할 것인가는 4차 산업혁명 시대를 맞이한 바이오 분야의 숙제다.

이병욱 한국생명공학연구원 국가생명연구자원정보센터 책임연구원 bulee@kribb.re.kr