인포보스, 700여종 식물 유전체 DB 하나의 플랫폼에 모았다

'PGD'에 190개 유전체 정보 추가
2.7 버전...무료 웹서비스로 제공
비전문가도 유전체 비교 분석 가능

인공지능(AI) 기반 생물 유전체 빅데이터 분석기업 인포보스가 최근 최신화한 세계 최대 식물 유전체 데이터베이스 Plant Genome Database(PGD)
인공지능(AI) 기반 생물 유전체 빅데이터 분석기업 인포보스가 최근 최신화한 세계 최대 식물 유전체 데이터베이스 Plant Genome Database(PGD)

인공지능(AI) 기반 생물 유전체 빅데이터 분석기업 인포보스가 세계 700여종 식물 유전체 데이터를 하나의 플랫폼으로 모으고 이를 비교 분석할 수 있는 기반을 마련했다.

인포보스는 지난해 자사가 구축한 유전체 데이터베이스 'PGD(Plant Genome Database)'에 190개 유전체 정보를 추가해 2.7 버전으로 최신화했다고 9일 밝혔다.

PGD는 무료 웹서비스 형태 통합 식물 유전체 데이터베이스다. 유전자 기능 예측 정보를 보여주는 동시에 동일한 플랫폼에서 유사한 유전자를 찾을 수 있는 블라스트(BLAST) 등 생물정보학 도구를 제공한다. 비전문가도 유전체 비교 분석이 가능하다.

PGD 2.7 버전에서는 이전 2.6 버전에서 보다 109개 분류군에 대한 190개 유전체 정보를 추가로 활용할 수 있다. 국내 생물자원과 관련해서는 피자식물 21개, 나자식물 1개, 이끼류 2개, 우산이끼류 1개, 녹조류 1개 등 26개 분류군의 유전체 정보가 추가됐다. 우리나라에서 나고 자란 자생 관속식물 8개 분류군(새콩, 병풀, 더덕, 고욤나무, 넓은쑥부지깽이, 대청, 신갈나무, 속속이풀)도 포함된다.

인포보스가 PGD에서 제공하는 식물 유전체 데이터 종류 (자료=인포보스)
인포보스가 PGD에서 제공하는 식물 유전체 데이터 종류 (자료=인포보스)

PGD는 현재까지 현재 713종, 총 2174개 식물 유전체 데이터를 확보했다. 수집된 유전체 데이터의 총 길이는 1,065,569,158,023염기쌍(bp:basepairs)으로 1테라(T)bp를 넘어선다. 이 중 우리나라에 분포하는 관속식물의 분류군 수는 164개다. 외국 원산 식물과 외국에서 들어와 우리나라에서 토착화된 귀화식물을 제외한 우리나라에서 나고 자란 자생 관속식물 41개 분류군도 포함된다.

고부가 바이오산업의 주원료인 국내 자생생물에 대한 유전자원 확보와 연구 중요성이 커지고 있다. 국내의 경우 보유한 식물자원 8073여종 중 확보된 유전체 빅데이터 양은 1%에도 못 미친다.

국내 바이오 기업이 사용하는 해외 생명 자원 중 식물이 69%로 가장 큰 비중을 차지하고 있어 식물자원 국산화 기반 필요성이 대두된다. 최근 정부 차원에서도 식물 자원의 중요성을 인식하고 농림축산식품부를 중심으로 한반도 토종식물자원 생명 정보를 집대성하는 빅데이터 구축작업을 시작했다.

손장혁 인포보스 공동대표는 “자국 식물자원 유전정보는 생물주권의 근간으로 유전정보 확보와 연구의 중요성은 더욱 강조되고 있다”고 말했다. 손 공동대표는 “PGD에서 제공하는 식물 유전체 데이터는 국내외 식물자원의 산업적 활용을 위한 기초 자료와 분석자료로 쓰일 수 있다”면서 “자생 식물로부터 고부가 바이오 산업 원료를 효율적으로 발굴하고 상업화하는데 활용되길 기대한다”고 덧붙였다.

정현정기자 iam@etnews.com