예측에서 번역까지…구글 딥러닝의 꿈

발행일 : 2015-03-20 10:00

미국 실리콘밸리 산호세컨벤션센터에서 열린 GTC(GPU Technology Conference) 2015 기간 중인 3월 18일(현지시간) 구글 제프 딘(Jeff Dean. Jeffrey Dean) 구글 수석 연구원이 연단에 올랐다. 주제는 딥러닝(Deep Learning).

제프 딘은 구글 최적화의 신으로 불리는 인물. 그는 구글이 진행해온 딥러닝 프로젝트에 참여해오기도 했다. 제프 딘은 딥러닝을 활용해 이미지를 인식하는 건 여기에서 텍스트 캡션을 알아서 만들어거나 오디오, 실시간 통역 등 다양한 활용이 가능하다고 말한다.

이미 알려진 것처럼 구글은 안드로이드에 음성 인식 기능을 추가한 상태다. 구글에 따르면 안드로이드 버전의 음성 인식 오류 비율은 젤리빈 당시 25% 미만이었다. 구글은 전 세계에 있는 수많은 음성 명령어 연구를 거듭하고 있으며 이를 통해 새로운 패턴을 예측할 기반을 쌓고 있다.

지난 2012년에는 유튜브에서 무작위 추출한 이미지 1,000만 장 중 고양이 이미지를 골라내는 데 성공하기도 했다. 신경망 알고리즘을 적용한 시스템이 머신러닝 반복 학습을 통해 알아서 고양이 이미지를 판별해낸 것이다. 당시 구글은 1만 6,000대에 달하는 CPU와 10억 건이 넘는 데이터를 처리할 수 있는 모델에 인공 신경망을 적용했다.

반복 학습을 통해 머신러닝 외에도 데이터를 바탕으로 한 추론도 가능하다. 단어 의미를 기계가 알아서 추정하는 알고리즘이 그것. 예를 들어서 ‘프랑스-파리’라는 단어에서 추론을 통해 ‘대한민국-서울’ 식의 결론을 내릴 수도 있다. 문맥상 의미를 파악해 추론을 하는 것이다. 딥러닝은 이런 추론 정밀도를 비약적으로 끌어올릴 수 있다.

몇 주 전 발표된 내용도 언급했다. 구글이 인수한 영국 스타트업인 딥마인드(DeepMind)가 개발한 에이전트 프로그램인 DQN(Deep Q-Network)은 사람이 전혀 손대지 않은 상태에서 게임을 스스로 학습, 높은 점수를 내는 방법을 학습할 수 있는 수준을 나타낸 것이다. 현장에선 실제로 DQN이 스페이스 인베이더나 벽돌 깨기 같은 게임을 하는 모습을 영상으로 소개하기도 했다. DQN은 100종에 달하는 게임을 이런 식으로 스스로 학습했다.

제프 딘 수석연구원은 딥러닝이 비약적으로 발전하고 있다는 점을 강조했다. 지난 2011년 이미지넷의 이미지 인식 에러율은 25.7%였다. 하지만 구글은 지난 2014년 이를 6.7%까지 줄이는 데 성공한 바 있다. 하지만 딥러닝의 발전 속도는 더 빨라지고 있다. 올해 1월 바이두의 슈퍼컴퓨터인 밍와는 이미지 인식 에러율 5.98%를 기록했다. 이어 MS리서치가 2월 4.9%를 기록, 사람의 이미지 인식 에러율은 5.1%보다 정확도를 높였다. 다시 구글이 3월 들어 4.8%로 낮췄다. 이미 인식 에러율 자체에선 사람보다 더 정확하다는 얘기다.

음성과 시각은 물론 사용자 예측과 번역까지 다양한 분야에서 딥러닝을 활용할 수 있으며 제프 딘은 현재 구글의 경우 50개가 넘는 자사 응용 프로그램에 딥러닝을 사용 중이라고 밝혔다. 실제로 구글의 CEO 래리 페이지는 딥러닝을 통한 인공지능이 구글의 궁극적인 목표라고 말하기도 했다. 궁극의 검색엔진은 모든 내용을 이해하고 대답하는 것이라는 얘기다.

Broadcast live streaming video on Ustream

전자신문인터넷 테크홀릭팀

이석원기자 techholic@etnews.com

테크홀릭