인포보스 "코로나19 스파이크 단백질 변이 17개·핵단백질 변이 10개 확인"

국내 인공지능(AI) 유전체분석 전문기업 인포보스(대표 손장혁, 박종선)는 주목해야 할 코로나19 변이에 대해 연구자료를 2일 발표했다.

3월 이후 미국에서 코로나19 바이러스 전파속도가 급격히 빨라지면서 바이러스 연구가 본격화되고 전체 염기서열도 해독·분석되고 있다.

8월 6일 현재 전 세계 주요 유전체 데이터베이스 중 하나인 NCBI(National Center for Biotechnology Information)에서는 현재 1만4877개의 코로나 바이러스 전체 염기서열을 제공하고 있다.

공개된 염기서열 데이터를 기반으로 각 지역별 바이러스 변이율을 비교 분석하는 등 다양한 연구가 진행되고 있지만 자료가 워낙 복잡하고 방대해 코로나 바이러스 변이 추적 작업에 어려움이 있다.

코로나19는 RNA 바이러스 특성상 시간이 지나면서 다양한 변이를 축적하게 된다. 대표적으로 알려진 변이는 스파이크 단백질의 D416G 변이로, 코로나 바이러스가 대량으로 퍼질 수 있는 계기를 마련해줬다.

인포보스는 시간에 따른 코로나 바이러스의 변이율 변화에 주목해 미국에서 수집된 검체에서 얻어진 1만62개의 코로나 바이러스 염기서열 정보를 월별로 분석한 결과 흥미로운 결과를 확인했다.

233개의 단일 다형성 변이(SNP)의 월간 비율 변화 추이 그래프 (자료=인포보스)
233개의 단일 다형성 변이(SNP)의 월간 비율 변화 추이 그래프 (자료=인포보스)

미국 내 월별 코로나 바이러스 감염자수는 3~4월을 기점으로 폭발적으로 증가하고 이후 5~6 월 동안 유지되다가 7월에 다시 폭증하는 양상을 보였다. 염기서열의 경우 3~4월에 높은 수를 보이고 점차 줄어드는 것으로 확인돼 분석시 염기서열 수의 감소부분을 감안해서 해석하는 것이 중요하다고 인포보스는 판단했다.

인포보스는 코로나 바이러스의 단일 염기 다형성 변이(SNP) 각 유전자별로 찾아내 총 8464개의 SNP를 찾아내고 이들이 월별로 보여주는 비율을 추적하는 작업을 수행했으며 이 중 6월에 미국에서 대발생한 이후 그 비율이 높아지는 변이를 찾아냈다.

스파이크 단백질에 17개, 핵단백질의 10개 단일 다형성 변이(SNP)의 월간 비율 변화 추이 그래프 (자료=인포보스)
스파이크 단백질에 17개, 핵단백질의 10개 단일 다형성 변이(SNP)의 월간 비율 변화 추이 그래프 (자료=인포보스)

총 233개(2.75%)의 SNP가 6월 대비 7월에 그 비율이 높아지고 이들 중 기존에 알려진 바이러스의 전파력을 10배 올린 D614G 변이가 있는 스파이크 단백질에 17개, 유전체 RNA를 감싸는 핵단백질에 10개의 변이가 발견돼 향후 이들이 D614G와 같이 어떤 파급력을 보여줄지 모니터링 할 필요가 있다고 인포보스는 밝혔다.

이번 연구는 인포보스의 유전체 분석 파이프라인인 GeIS(Genome Information System)를 통해 수행했다.

인포보스 관계자는 “지속적인 변이 추적을 위해 주기적으로 데이터를 수집, 분석하는 작업을 수행할 계획”이라며 “나아가서 이들 변이가 바이러스에 영향을 줄 수 있는 여부 및 항바이러스 제제 개발에 필요한 데이터를 자체 기술로 개발한 인공지능 기반 유전체분석 플랫폼 메타 시리즈를 통해 알릴 예정”이라고 밝혔다.

정현정기자 iam@etnews.com