[기고]데이터가 스스로 신소재를 개발하는 세상

[기고]데이터가 스스로 신소재를 개발하는 세상

몇 년째 쓰고 있던 구닥다리 스마트폰을 최신형으로 바꿨다. 아침에 일어나면 스마트폰에 내장된 비서 프로그램을 불러 날씨를 묻고, 음악을 추천 받아 플레이한다. 구입한 지 한 달 정도 지났을 뿐인데 인공지능(AI)은 이미 내 생활 패턴을 파악했다. 어떤 장르의 음악을 좋아하는지, 집에 오면 어떤 애플리케이션(앱)을 주로 쓰는지 등을 꿰뚫는다.

AI 파급 효과는 이 수준에 그치지 않는다. 3년 전 구글 딥마인드에서 개발한 알파고가 바둑 기사 이세돌 9단을 꺾었을 때 경악을 금치 못한 이유는 단순히 기계가 인간을 뛰어넘었기 때문이 아니다. 연산 능력에서 이미 인간은 기계 상대가 되지 못했다.

놀라움의 핵심은 인간의 두뇌 활동 가운데 정수라고 여긴 '창의 사고'도 기계가 잘할 수 있다는 것이었다. 알파고는 인간이 만들어 놓은 기보(데이터)를 공부(기계학습)해서 조금이라도 승리에 유리한 착수를 찾아내며 이를 증명했다. 알파고는 바둑계에서 은퇴했지만 딥마인드는 알파폴드라는 새로운 프로그램을 개발하고 생명체의 단백질 구조 연구를 시작했다. 이를 통해 난치병을 정복하려는 원대한 포부를 담은 프로젝트다.

기계학습 알고리즘을 이용해 창의 결과물을 만드는 시도는 다방면에서 활발하다.

소재를 연구하는 과학자 입장에서 보면 AI가 첨단 신소재를 개발하는 역할을 하리라 본다. AI 기계학습에 필수인 데이터베이스(DB) 구축에 국내외 재료 연구자의 지식을 모은다고 가정해 보자. AI가 황금알을 낳는 거위와 같이 우리가 생각하지 못한 신소재를 하나씩 꺼내 줄 수 있다.

현재 신소재 개발 분야 데이터는 양과 질 모두 부족하다. 인간이 경험을 통해 통찰력을 얻는 것과 비슷하게 AI는 방대한 양의 데이터를 학습해서 더 나은 방향의 결론을 추론하기 때문에 양질의 데이터가 많이 필요하다. 기계학습이 직접 적용되고 있는 헬스케어, 마케팅 등 분야는 양질의 빅데이터 생산이 가능하다. 기계학습 효율성이 높을 수밖에 없다.

소재 부문은 다양한 물질 정보를 모아야 해서 데이터 축적이 어렵다. 다양한 소재의 데이터를 모아 놓고 기계학습을 시키는 것은 무의미하다. 문제를 극복하기 위해선 특정 소재의 데이터를 따로 클러스터화해서 관리해야 한다.

소재별 빅데이터를 AI에 학습시켜야 한다. 특정 물질을 연구하는 국내 연구자는 한정돼 있다. 여기서 나오는 정보를 모두 모아 놓는다고 해도 단기간에 빅데이터를 확보하기는 어려운 현실이다. 연구 데이터를 단순히 받아서 축적하는 것에 그치지 않고 인위로 생성하려는 노력이 필요하다.

소재 데이터는 합성 온도, 합성 시간, 구성물질 조성비 등과 같은, 소재를 만들 때의 독립변수가 입력 값이 된다. 소재 전기전도도, 강도, 열전도도 등과 같은 소재의 특성이 출력 값이 된다. 개별 연구자마다 연구 목적이 다르기 때문에 입력 값을 조절하고 통제하는 방식이 각각 다르다. 데이터 양이 충분하다면 무작위로 쌓아도 유의미한 결과를 얻을 수 있다. 빅데이터 확보가 어렵다면 특정 목적을 위해 변수를 통제해 특정 입력 값의 데이터를 개별 연구자에게 요청함으로써 제어된 데이터를 축적하는 하향식 방식을 고려할 수 있다.

소재 특성 측정·분석 플랫폼을 구축해 데이터 축적을 효율화하고, 출력 값 신뢰성을 높이는 방안도 강구해야 한다. 현재 국내에 구축한 수많은 분석 장비로부터 데이터가 생성된다. 연구자가 개별로 측정을 의뢰하고 분석 결과 역시 개별 제공이 되고 있어 데이터는 따로 축적되지 않는다.

분석 데이터를 축적하자는 연구자의 동의가 있어서 지금 당장 모든 데이터를 모을 수 있다고 해도 분석 시료가 어떤 독립 변수로 만들어진 것인지에 관한 정보를 수집하고 관리하지 못하면 애써 모은 데이터는 무용지물이다. 특정 소재의 특성을 측정·분석하는 플랫폼을 구축해서 소재 분석 데이터가 플랫폼을 거쳐 가도록 하면 데이터 클러스터의 효율 관리가 가능하다.

이미 기술 성숙도가 높은 수준에 오른 소재라면 데이터 생성도 가능하다. 기계학습 효과도 더 커질 수 있다. 유망한 첨단 소재 가운데 이 같은 조건을 만족하는 소재를 추려서 측정·분석 플랫폼과 데이터 클러스터를 만들어 봄직하다. 시도와 노력이 쌓이면 AI 도움으로 신소재를 개발하는 미래가 열릴 수 있다.

이동수 한국과학기술연구원(KIST) 책임연구원 d.s.lee@kist.re.kr