[과학 핫이슈]진격의 알파고

글자 작게 글자 크게 인쇄하기

구글 딥마인드 인공지능(AI) 바둑 프로그램 '알파고'가 파죽지세다. 이번엔 중국 커제 9단을 제물로 삼았다. 지난해 이세돌 9단을 꺾은 데 이어 또 한 번 세계 최강 기사에게 완승했다.

알파고와 커제 9단이 23일 중국 저장성 우전에서 열린 바둑의 미래 서밋에서 대국을 벌이고 있다.
<알파고와 커제 9단이 23일 중국 저장성 우전에서 열린 바둑의 미래 서밋에서 대국을 벌이고 있다.>

알파고는 작년 이세돌 9단과 대국 때보다 더 강해져 돌아왔다. 향상된 하드웨어와 알고리즘을 탑재했다. 스스로 학습하는 능력이 강화된 새 알파고는 바둑을 넘어 범용 AI로의 활용 가능성을 보여줬다.

커제 9단을 잡은 알파고는 '알파고 마스터'로 불리는 새 버전이다. 가장 큰 차이는 스스로 학습하는 능력이다. 지난해 이세돌과 대국을 벌였던 알파고는 강력한 연산 능력과 방대한 기억력이 강점이었다. 기존 프로기사의 기보 16만건을 바탕으로 바둑을 뒀다. 중앙처리장치(CPU) 1202개, 그래픽처리장치(GPU) 176개에 해당하는 연산 능력을 갖췄다.

[과학 핫이슈]진격의 알파고

새 알파고의 연산력은 기존보다 10배가량 떨어지지만 스스로 학습하는 능력이 가장 큰 무기다. 새 알파고는 데이터에 의존하는 대신 스스로와의 대국(강화 학습)으로 바둑 실력을 쌓았다. 기존 알파고가 석 점을 먼저 깔아도 이길 수 없는 정도의 실력을 완성했다.

데이비드 실버 딥마인드 박사는 “알파고는 자신과 수없이 많은 바둑을 두면서 약점을 빨리 찾아내고 고칠 수 있게 됐다”면서 “사람들이 기계 학습을 생각할 때 연산력과 데이터를 중요하게 여기지만 실제 가장 중요한 것은 알고리즘”이라고 설명했다.

딥러닝에 쓰이는 인공신경망 계층이 대폭 늘었다. 인공신경망 계층을 두텁게 쌓을수록 예측의 정확도와 학습 능력이 향상된다. 작년 알파고는 12개 계층을 사용했지만 이번에는 40개 계층을 쌓았다. 학습 속도는 기존 수개월 걸리던 양을 수 주 만에 마칠 정도로 높아졌다.

알파고의 달라진 스타일은 창의적인 수 싸움으로 연결된다. 커제 9단과 2국에서 보여준 119수는 '신의 한수'로 평가받았다. 상대가 승기를 잡았다고 방심한 틈을 타 일거에 역전했다. 한 수로 사방에 걸친 자신의 돌을 도왔다. 전문가들은 이 같은 '알파고식 신의 한수'를 바둑 실력이 좋다고 해서 떠올릴 수 없는 창의적인 수로 평가했다.

데미스 허사비스 딥마인드 최고경영자(CEO)는 “알파고 마스터는 인간의 기보를 더 이상 필요로 하지 않는다”면서 “스스로 대국하는 과정에서 결점을 찾고 고쳐나간 것이 혁신의 핵심”이라고 강조했다.

새 알파고는 게다가 기존보다 더 효율적으로 작동했다. '알파고 마스터'는 구글의 기계학습 전용 칩 TPU(Tensor Processing Unit) 하나로 작동한다. 기존 10분의 1 수준의 컴퓨팅 파워만으로 고도 연산이 가능하다. 에너지 효율은 10배가량 향상됐다.

알파고는 바둑을 위해 개발된 AI다. 새 알파고가 커제 9단에 압승한 방식은 범용 AI의 가능성을 보여줬다는 평가다. 딥마인드의 목표 역시 인간이 만든 데이터에 의존하지 않고도 다양한 학습으로 작업하는 범용 AI다. 스스로 사고하는 범용 AI가 인간을 도와 질병 진단, 신약 개발 분야에서도 혁신을 이룰 것으로 기대했다.

실제 적용 사례도 있다. 구글은 알파고와 이세돌 9단 대국 직후 알고리즘 일부를 데이터 센터 냉각 솔루션에 탑재했다. 그 결과 냉각에 쓰는 전력을 40%가량 절감했다. 알파고 활용 영역이 바둑을 넘어섰다.

알파고는 여전히 많은 한계를 갖고 있다. 바둑에서 인간을 뛰어넘는 성취를 이뤘지만 인간 두뇌 영역에 맞는 고도화는 이루지 못했다는 평가다. 알파고는 기억, 상상, 언어 등 인간 영역을 완벽히 포괄하지 못한다. 딥마인드는 향후 AI를 지금보다 더 다양한 영역에 활용하기 위해 해결해야 할 과제로 꼽았다.

딥마인드는 AI 역할을 인간의 '조력자'로 한정했다. AI는 사람이 설정한 목표에 따라 최고의 결과를 내놓지만 목표를 설정하는 것은 여전히 사람의 몫이기 때문이다. AI가 실업난을 야기하는 등 인류 사회를 혼란에 빠트릴 것이라는 우려를 불식하려는 의도도 담겼다.

하사비스 CEO는 “알파고는 스스로 학습하는 경지에 올랐지만 ('게임을 이기라'는) 목표를 설정한 것은 인간”이라면서 “AI는 사람이 설계한 목표를 이루기 위해 작동하기 때문에 여전히 인간의 제어 범위 안에 있다”고 강조했다.

송준영기자 songjy@etnews.com

“말도 안되는 가격!! 골프 풀세트가 드라이버 하나 값~~ 598,000원”